计算机工程与应用››2021,第57卷››发行(19): 189-197.内政部:10.3778/j.issn.102-831.2104-0430

模式识别与人工智能 • 上一篇   下一篇

融合知识表示和深度强化学习的知识推理方法

宋浩楠,赵刚,王兴芬  

  1. 北京信息科技大学 信息管理学院,北京 100192
  • 出版日期:2021-10-01 发布日期:2021-09-29

结合知识表示和深度强化学习的知识推理方法

宋浩南、赵刚、王兴芬  

  1. 北京信息科技大学信息管理学院,北京100192
  • 在线:2021-10-01 出版:2021-09-29

摘要:

知识推理是解决知识图谱中知识缺失问题的重要方法,针对大规模知识图谱中知识推理方法仍存在可解释性差、推理准确率和效率偏低的问题,提出了一种将知识表示和深度强化学习相结合的方法RLP变速器利用知识表示学习方法,将知识图谱映射到含有三元组语义信息的向量空间中,并在该空间中建立强化学习环境。通过单步择优策略网络和多步推理策略网络的训练,使强化学习智能体在与环境交互过程中,高效挖掘推理规则进而完成推理。在公开数据集上的实验结果表明,相比于其他先进方法,该方法在大规模数据集推理任务中取得更好的表现。

关键词: 知识推理, 深度强化学习, 知识表示, 路径控制, 规则挖掘

摘要:

知识推理是解决知识图中知识缺乏问题的一种重要方法。大规模知识图中的知识推理方法仍然存在可解释性差、推理精度和效率低等问题。本文提出了一种将知识表示与深度强化学习相结合的RLPTransE方法。首先,使用知识表示学习方法将知识图映射到包含三元组语义信息的向量空间,并在该空间中建立强化学习环境。然后,通过单步优化策略网络和多步推理策略网络进行训练,使强化学习agent能够有效地挖掘推理规则,并在与环境交互的过程中完成推理。在公共数据集上的实验结果表明,与现有方法相比,该方法在大规模数据集的推理任务中取得了更好的性能。

关键词: 知识推理, 深度强化学习, 知识表示, 路径控制, 规则挖掘