English

概率检索模型研究的新进展

2020-03-29 13:43 来源:中华读书报 

  本书作者提出利用术语间关系扩展贝叶斯网络检索模型的新方法,是语义检索技术发展的重要成果,也是贝叶斯网络检索模型扩展研究的新进展。

  人们在海量信息中寻找所需内容,离不开信息检索技术和工具,尤其是在计算机网络迅速发展和广泛应用的今天及未来,探索更为智能、更为精准、更为快速的语义检索技术和工具已然是社会向科研人员提出的时代要求。在这样的大背景下,徐建民教授新著《基于术语关系的贝叶斯网络检索模型扩展》对国内信息检索技术的进一步发展有着重要的意义。

  《基于术语关系的贝叶斯网络检索模型扩展研究》,徐建民著,科学出版社2019年11月出版,定价98.00元

  广义的信息检索可以包括两个方面,一是指将信息按照一定的方式进行加工、整理、组织并存储起来,二是根据用户的特定需要将相关信息准确地查找出来的过程。信息的查找过程即为“查询”和“信息”的匹配过程,其关键技术为信息检索的建模。经典的信息检索模型主要包括布尔模型、向量空间模型和概率模型三类。在智能化检索不断发展的今天,给这些经典模型赋予语义检索的能力是当前信息检索领域的研究热点之一。其中,以贝叶斯网络理论为基础的概率模型的研究,吸引了国内外检索技术专家的广泛兴趣。目前贝叶斯网络检索模型包括三种:推理网络检索模型、信念网络检索模型和贝叶斯网络检索模型。然而,基本的贝叶斯网络检索模型,是以术语节点或文档节点为查询匹配基础,在推理和检索的过程中,并未充分考虑术语间的关系,因而在语义检索的目标实现过程中有很大局限性。为了解决这个问题,本书作者提出利用术语间关系扩展贝叶斯网络检索模型的新方法,是语义检索技术发展的重要成果,也是贝叶斯网络检索模型扩展研究的新进展。

  基本的信念网络检索模型包括三层节点:查询节点、术语节点和文档节点,作者利用术语间的同义关系和相关关系对基本模型进行扩展以提升语义检索有效性,给出了扩展模型的拓扑结构和概率推导,并实验验证了这种扩展的性能。信念网络检索的最大优点是其提供了一个灵活的框架,可以有效地归并不同的证据,证据的融入可以实现对基于内容检索的修订和补充,从而得到更合理的检索结果,据此,本书作者分别将同义词证据、科技文献间的引用关系作为新的证据融入基本信念网络检索模型,给出了两个融合不同证据的扩展信念网络检索模型,从另一个角度实现了基本模型的扩展。简单贝叶斯网络检索模型仅包括两层节点:术语节点和文档节点,作者探索出通过复制术语层给出具有三层节点(两个术语层)模型的方法,其中两个术语层之间的弧依据词语间的同义关系和共现关系确定,这种扩展方法增强了语义检索的有效性。

  本书作者徐建民教授是河北大学图书情报档案学科带头人,学术积淀深厚,对专业研究领域的发展态势有敏锐地把握。受Allan将信息检索的向量空间模型应用于话题识别与追踪的启发。作者尝试将信息检索领域的检索模型应用到话题识别与追踪,这项工作拓展了研究视野,体现了信息检索研究的延续性,也为其他研究者提供了新的思路。

  期待也相信作者,未来能为贝叶斯网络在信息领域的应用做出新的成果。(宛玲)

[责任编辑:邱晓琴]


手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

光明网版权所有