(攀枝花学院图书馆 四川攀枝花 617000)
[摘 要] 当今环境下,如何推动ChatGPT赋能到图书馆服务上呢?本文对ChatGPT赋能图书馆知识服务的推进路径进行了一些分析和研究,希望ChatGPT新技术场景下图书馆知识服务的推进路径实现有所帮助。
[关键词] ChatGPT;图书馆;知识服务
1 引 言
人工智能技术的发展推动着自动问答、数据分析、资源组织与信息查询等智能服务不断提升。国内文化产业在技术环境的变迁和国家机制的引领下, 算力、人工智能、模型等将融入图书馆智能化建设的过程中,ChatGPT等生成式AI大模型也将促进图书馆知识服务与新兴技术深度融合,推动多资源环境下知识服务场景的转变。虽然 ChatGPT目前尚未正式进入中国市场,但GPT类技术赋能知识服务的研究值得深入探索。
2 ChatGPT赋能图书馆知识服务的推进路径
ChatGPT技术已经在人机自然交流、语料体系整理、知识演绎推理和自然语言理解等功能上取得巨大进展,人工智能生成内容的时代已经来临。图书馆可以借助现有的技术变革机遇,针对参考咨询服务服务、学科知识服务、情报服务、教育培训服务等知识服务场景,在多方面实现变革性开拓,推动图书馆知识服务跃上新台阶。
2.1提升多源多模态信息汇聚与整序能力
在图书馆资源建设中,经常提到“多源数据”“多模态信息”与“多源融合”等概念,意思是指,多来源大规模的文本、视频、音频等不同模态的数据集。而在大语言模型技术的发展中,训练数据的体量、质量、种类、模态决定了模型最终生成的效果,机器学习领域CLIP模型和Diffusion模型的出现使不同模态的数据在语义特征尺度上实现融合转换,为多模态语义融合提出了解决方案,让ChatGPT仅通过输入文字内容就可以生成音频、视频或3D模型。在现在大数据时代背景下,图书馆能否依靠模型提升业务效率,前提取决于其能否满足不断增长的语料和算法需求。图书馆积累汇聚了海量的语料信息资源,主题馆藏、电子图书资料、文献资源和业务数据等,具有多维度、多元化特点,将馆藏中相对高质量的资源数据作为大语言模型的预训练语料,利用人工智能算法实现数据融合分析,实现ChatGPT技术支持下以用户需求为中心的精确人性化微观人机问答服务,也为多维度资源汇聚下馆员宏观决策提供依据。而多源多模态信息整序是指图书馆依托高性能算力支持集成各类数据整序技术,面向多模态数据进行关联整序,动态重组知识单元,面向图书馆参考咨询服务重构信息资源序列,创新多模态信息组织能力,发掘馆藏资源的服务能力,挖掘信息资源深层隐性知识,进而提升人机交流服务内涵,促进知识交流。
2.2 构建对话型生成式学术搜索引擎
在图书馆检索系统与搜索引擎并行发展的时代,大多用户以搜索引擎为信息查询起点,借助于搜索引擎实现自己的检索目标。而为了吸引用户利用图书馆,精确高效地找到所需资源并比较信息内容的关联性,实现学科知识服务的精准性,图书馆提升学术检索服务变得迫在眉睫,而ChatGPT的出现有助于解决这一难题。大语言模型的核心要素算法、算力、数据已经实现从量变到质变的飞跃,使ChatGPT具备较好的语言理解、数据整理、逻辑推理与内容生成能力。深度学习、自然语言处理等人工智能技术在学术检索中的应用,带来了搜索引擎向对话型学术搜索引擎的升级。因此,图书馆需要加强建设大规模语料库,训练关联数据成为语料资源,创新知识组织方法,将文献资源库转换成知识库,提高用户对知识库中学术搜索引擎的利用率,充分发挥 ChatGPT自然语言处理能力。 对于图书馆学科知识服务来说,ChatGPT可以帮助图书馆构建更智能交互化的学术搜索引擎,结合传统的OPAC系统,并利用神经网络、语义网、自然语言处理、深度学习等人工智能技术,实现资源检索到资源发现的转变,从而提高检索结果的准确度,更好地满足用户的搜索需求。同时,ChatGPT还能够通过理解用户的交流意图,结合用户搜索主题、历史记录、偏好兴趣等分析用户需求,为用户提供智能交互的拟人化搜索体验,减少了用户信息筛选环节,进一步提高学科知识服务效率。
2.3 促进情报检索语言与人工智能融合
ChatGPT在人机自然语言交互方面取得的成功表明了检索语言的重要价 值,图书馆也要提升在大语言模型中情报检索语言改革的能力。图书馆情报服务要充分利用新的模式、方式,扩大创新情报检索语言的应用范围,依托人工智能技术,结合已有的文摘、索引、目录检索服务,在馆员为用户提供情报服务时,要尽可能细化情报检索匹配条件,按照服务需求进行高精确度检索,方便馆员或用户快速准确地获取所需信息。ChatGPT正在实现模糊搜索到精准推送的跨越,改变了以往关键词检索的服务形式,通过人机交流对话理解上下文自然语言内容,能够为馆员提供文字总结或是与检索结果相关的网页链接。图书馆情报服务系统将形成新的检索语言范式,通过将自然语言转换为检索规范语言,从而实现情报检索语言与人工智能的融合,从自动文摘、自动综述等检索结果出发,优化知识组织与情报检索的效果。
2.4 增强自然语言模型的逻辑推理能力
Web3.0时代,以ChatGPT为代表的自然语言模型能够通过上下文语境理解用户提出的问题,为用户提供精准的信息内容,并可以在持续的交互过程中基 于人类反馈强化学习技术实现机器学习增强大模型的完善程度和能力。 ChatGPT拥有的逻辑推理能力是由训练语料的概率计算决定,并非人类思维逻 辑推理得到,其生成的结果高度依赖训练语料的质量,当用户提出超出训练语料范围的问题,自然语言模型可能生成错误的答案误导用户。从长远发展来看,如果图书馆在应用ChatGPT等人工智能生成软件时不重视此类情况,可能会造成虚假知识泛滥、虚构历史等错 误的教育信息推荐与生成情景。另外,当用户学习辨别能力有限时,大模型的应用反而会影响图书馆教育培训服务的初衷和愿景。 图书馆在应用ChatGPT外挂基础设施为用户提供教育信息培训服务时,应尽可能挖掘和整理馆藏资源,或多馆联盟训练属于图书馆的大规模自然语言模型,使其训练语料符合多样性、高质量、大规模等特点,并对各种馆藏数据进行规范化清洗。通过大量的馆藏训练语料库培养大模型的逻辑推理能力,使得模型能够充分理解用户的意图后提供正确、完整的教育培训信息推荐服务。ChatGPT目前仅仅学会了推理的表面逻辑,不具备较强的逻辑推理能力和因果关系的数理运算能力。对于图书馆建立大模型来说,逻辑推理仍然具有挑战性,图书馆应在突破训练语料的限制上,在与用户的交互过程中不断学习,了解用户真正的需求,实现对模型的调优和反馈,让用户获得一种创造性和主动性的交互体验。
3 结论
ChatGPT的发展历程是科技进步的一个缩影, 本文从图书馆发展视角出发,提出图书馆需提升多源多模态信息汇聚与整序能力、构建对话型生成式学术搜索引擎、促进情报检索语言与人工智能融合以及增强自然语言模型的逻辑推理能力等路径,以期为图书馆知识服务的理论与实践发展提供参考。
参考文献
[1]何哲,曾润喜,秦维,等.ChatGPT等新一代人工智能技术的社会影响及其治理 [J].电子政务,2023,244(4):2-24.
[2] 张智雄,曾建勋,夏翠娟,等.回应AIGC的信息资源管理学人思考[J].农业图书 情报学报,2023,35(1):4-28.