关键词:
知识表示
开放世界
知识图谱
知识补全
问答系统
摘要:
数据稀疏、知识不完备等问题是制约知识图谱发展的重要因素,因此,完善知识图谱的知识补全算法是领域内的研究热点。现有的知识补全算法无法有效利用知识图谱内知识,以及对开放世界和知识包含的时间信息的忽视导致知识图谱中的知识存在失效情况,无法为基于知识图谱的问答系统提供可靠的知识支持。针对上述问题,本文展开对面向文本问答的开放世界知识补全技术的研究。通过构建面向开放世界的知识动态融合模型,引入开放世界知识补全知识图谱,优化知识表示。提出基于时序变化的知识演进模型,引入时间信息,构建时间超平面,基于超平面进行知识补全,达到提升时间知识图谱补全效果的目的。本文主要研究工作如下:(1)提出并实现了面向开放世界的知识动态融合模型。当前知识补全模型大多存在着知识图谱信息利用不充分、忽视开放世界知识的问题。针对这一问题,本文提出了面向开放世界的知识动态融合模型。该模型对传统知识补全模型DKRL进行改进,在卷积神经网络中加入注意力机制作为文本描述表示模型,获取实体和关系语义向量,并且融合开放世界知识辅助知识补全任务,将知识补全任务应用范围从封闭世界拓展到开放世界。实验表明,本模型对比Tran E、Trans H、DKRL、OWE这些基线模型,在实体预测实验中平均排名与hits@10指标达到最优。(2)提出并实现了基于时序变化的知识演进模型。现有的传统知识补全模型对于时间信息很少考虑,导致对于时间知识图谱补全任务十分无力。而面向时间知识图谱的动态知识图谱补全模型则在获取知识表示向量时局限于知识图谱结构信息。针对这一问题,本文提出了基于时序变化的知识演进模型,在知识表示过程融入时间信息,并结合开放世界实体描述信息,进行时间知识图谱补全任务,对时间知识图谱中知识随时序变化的演进进行表示。通过实验表明,对比Trans E、Trans H、Hy TE这些基线模型,本模型在时间知识图谱上的实体预测实验中平均排名与hits@10达到最优,相比最优对比模型Hy TE在hits@10指标中的头实体预测和尾实体预测分别提升2和8个千分点。(3)基于以上研究成果,设计并构建了基于开放世界知识补全技术的文本问答系统。该系统包含问题处理、数据检索以及问答三个功能模块,具有准确率较高、可解释性较强以及可视化展示问题答案等优点。