关键词:
开放世界知识图谱补全
关系之间的依赖性
贝叶斯网
概率推理
关系预测
摘要:
知识图谱作为海量数据的支撑技术,为搜索引擎、问答系统和推荐系统等应用提供知识服务,由实体以及实体之间关系构成的三元组是知识图谱的基础结构。为了丰富知识,传统的知识图谱补全方法以表示学习为基础,将实体和关系投射到向量空间,并通过向量之间的距离计算来构造更多的三元组。然而,现实世界中的知识在不断更新变化,这要求知识图谱能够及时增补有用的新知识。同时,数据中蕴含的知识也可以作为新知识的来源,对知识图谱补全具有重要意义。研究人员将所有不包含于知识图谱的数据称为开放世界数据,提出开放世界知识图谱补全方法,从数据中获取知识图谱中不存在的新实体,利用新实体构造三元组。然而,对于任意一个新实体,现有的开放世界补全方法每次只能构造一个三元组,在一定程度上限制了新知识的丰富程度。事实上,知识图谱中实体共同涉及的关系之间通常具有相互依赖的性质,基于这种依赖性可利用数据中的新实体来构造更多的三元组。贝叶斯网被广泛用于变量之间相互依赖关系和不确定性知识的表示和推理,为了给知识图谱补充更多的新知识,本文研究基于贝叶斯网的开放世界知识图谱补全方法。利用贝叶斯网表示关系之间的依赖性,针对从开放世界数据中提取的新实体,基于贝叶斯网概率推理来获取与新实体相关的其他关系,进而构造更多的包含新实体的三元组来完善知识图谱。本文的主要研究内容概括如下:(1)基于知识图谱构建贝叶斯网,有效表示关系之间的依赖性,作为开放世界知识图谱补全的基础。(2)提出基于贝叶斯网概率推理的三元组构造方法,从开放世界数据中获取包含新实体的三元组,并将这些三元组作为证据,通过贝叶斯网推理构造更多的三元组,从而实现知识图谱的补全。(3)利用三元组类型预测和链路预测任务对本文方法进行了实验测试,验证了模型构建方法的高效性和知识图谱补全方法的有效性。