(相关资料图)
查文献、读文献,是做科研的一项基本工作。据统计,科研人员花费在查找和消化科技资料上的时间约占全部科研时间的51%。有没有一种可能,将文献变成一个知识库或者数据库,用人工智能方法减轻科研人员查找与阅读文献的“负担”?5月30日,在2023中关村论坛“人工智能驱动的科学研究论坛”上,基于大语言模型+向量数据库的文献知识库——Science Navigator(以下简称文献知识库)正式发布。
这是一项让科研人员通过对话提问的方式进行文献检索、阅读、分析及管理的科研成果。该成果由北京科学智能研究院、中国科学院计算机网络信息中心、墨奇科技联合研发。
“从最早眼查手翻的‘查阅式’检索,到后来基于搜索引擎以及互联网的‘搜索式’检索,再到现在人工智能技术的跨越式发展,我们首次看到大语言模型在理解问题和问答能力上接近人类智能的水平。”墨奇科技副总裁孟卓飞表示,文献知识库的发布,恰好赶上了检索模式进入对话时代的发展趋势。
“文献知识库的性能优势,可以用‘多、快、好、省’4个字来形容。”孟卓飞介绍,“多”体现在“多模态、多模型、多数据”;“快”指的是“查询快、导入快、迭代快”;“好”体现在“数据更实时、引用更可靠、理解更专业”;“省”则是通过极致的系统优化与自研向量算法,让数据的运算成本明显降低。
文献知识库的发展方向,是将更多实验数据纳入向量数据库。届时,科学实验涉及的设计原理、实验方式,实验结论以及结论背后对应的思考都可以作为查询的目标。孟卓飞表示,借助大模型和向量数据库,科研人员提出方向性问题,机器将完成拆解问题、提出质疑、设计实验、模拟实验等一套流程,甚至可以根据结果进行问题的反思推导与迭代,进一步释放科研人员的时间精力,以投身解决关键问题与创新思考。(何亮)