知识图推理:关键技术与应用综述
摘要
1.简介
2.知识图简介
2.1. 知识表示
2.2. 知识提取
命名实体识别:从文本中检测命名实体并将其分类为预定义的类别,例如人、组织、地点、时间等。通常,命名实体识别是其他知识提取任务的基础。 关系提取:从文本中识别和提取实体以及实体之间的关系。 例如,从“[史蒂夫·乔布斯]是[苹果]的创始人之一”这句话中,实体“[史蒂夫·乔布斯]”和“[苹果]”被确定为具有“是非”关系。 事件提取:识别文本中关于事件的信息并以结构化形式呈现。例如,可以从恐怖袭击的新闻报道中识别位置、时间、目标和受害者等信息。
2.2.1. 命名实体识别
2.2.2. 关系提取
2.2.3. 事件提取
2.3. 知识融合
3.知识图推理
3.1. 介绍
3.2. 知识图推理方法
3.2.1. 基于嵌入的推理
3.2.2. 基于符号的推理
3.2.3、。 基于神经网络的推理
3.2.4. 混合推理
4.比较与分析
知识图嵌入通常嵌入欧氏空间。 近年来,MuRP、ATTH等模型对嵌入双曲空间的情况进行了探索,取得了很好的结果。 然而,一般来说,在双曲空间中嵌入知识图的研究很少。 一些模型表明,双曲空间和其他非欧几里德空间可以更好地表示知识图。 知识图在非欧氏空间中的表示和推理值得进一步研究。 本文介绍的图神经网络自然匹配知识图,如r-GCN和r-GHAT模型仍然是早期的尝试,还远远不够完善。 设计更复杂的图网络结构来实现知识图推理是一个热点和有前途的方向。 变压器网络在自然语言处理领域因其强大的表达能力和高效的并行训练能力而脱颖而出,并且可以快速迁移到计算机视觉、图像处理和语音识别领域,在这些领域的结果同样出色。 研究表明,该变换器网络在知识图和知识图推理方面也具有良好的性能。 基于模型预训练的迁移学习广泛应用于自然语言处理、图像处理和计算机视觉,但很少用于知识图推理。 知识图和知识图推理中的预训练模型值得探讨。 现代知识图推理技术在数据集和相应的竞赛和评价中也有很大的机会,特别是在中文知识图数据集中。
5.应用
5.1. 无线通信网络(WCN)
5.2. 问答(QA)系统
5.3. 推荐系统
5.4. 个性化搜索
6.未来方向
7.总结
作者贡献
基金
数据可用性声明
利益冲突
工具书类
Ren,H。; 戴,H。; 戴,B。; 陈,X。; 周,D。; Leskovec,J。; Schuurmans,D.SMORE:大规模知识图中的知识图完成和多跳推理。 2022年8月14日至18日,美国华盛顿特区,第28届ACM SIGKDD知识发现和数据挖掘会议记录。 [ 谷歌学者 ] 季S。; 潘,S。; 坎布里亚,E。; 马丁宁,P。; Yu,P.S.《知识图的调查:表示、获取和应用》。 IEEE传输。 神经网络。 学习。 系统。 2022 , 33 , 494–514. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] Wu,Y。; 马云(Ma,Y.)。; Wan,S.多模式视觉问答中的多尺度关系推理。 信号处理。 图像通信。 2021 , 96 , 116319. [ 谷歌学者 ] [ 交叉参考 ] Wu,Y。; 纪,X。; Ji,W。; 田,Y。; Zhou,H.CASR:用于单图像超分辨率的上下文残差网络。 神经计算。 申请。 2020 , 32 , 14533–14548. [ 谷歌学者 ] [ 交叉参考 ] 李·G。; 他,B。; 王,Z。; Zhou,Y.受无线传感器网络人际交互行为启发的数据代理。 IEEE互联网事物杂志。 2022 , 9 , 8397–8411. [ 谷歌学者 ] [ 交叉参考 ] 谢凯。; 贾,Q。; Jing,M。; 于清。; Yang,T。; 基于知识图的Fan,R.数据分析。 第十五届宽带和无线计算、通信和应用国际会议论文集,日本永昌,2020年10月28日至30日。 [ 谷歌学者 ] 刘伟。; 尹,L。; 王,C。; 刘,F。; Ni,Z.基于物联网和物联网的深层语义移动计算中文医学知识图。 Wirel公司。 Commun公司。 暴徒。 计算。 2021 , 2021 , 5590754. [ 谷歌学者 ] [ 交叉参考 ] 奥尔,S。; C.比彻。; Kobilarov,G。; 莱曼,J。; Cyganiak,R。; Ives,Z.G.DBpedia:开放数据网的核心。 第六届国际语义网络会议和第二届亚洲语义网络会议论文集,韩国釜山,2007年11月11日至15日; 第722-735页。 [ 谷歌学者 ] Bollacker,K。; 埃文斯,C。; 帕里托什,P。; 斯特奇,T。; Taylor,J.Freebase:一个合作创建的用于构建人类知识的图形数据库。 2008年6月9日至12日,加拿大不列颠哥伦比亚省温哥华,数据管理特别利益小组会议记录; 第1247-1250页。 [ 谷歌学者 ] 霍法特,J。; 苏恰内克,F.M。; 小檗属,K。; Weikum,G.YAGO2:维基百科的时空增强知识库。 Artif公司。 智力。 2013 , 194 , 28–61. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Dong,B.X。; 加布里洛维奇,E。; 海茨,G。; 霍恩,W。; 老挝,N。; 墨菲,K。; 斯特罗曼,T。; Sun,S。; Zhang,W.知识库:概率知识融合的网络规模方法。 2014年8月24日至27日,美国纽约州纽约市,ACM SIGKDD知识发现和数据挖掘会议记录; 第601-610页。 [ 谷歌学者 ] 吴,Q。; 张,H。; 高,X。; 何,P。; 翁,P。; 高,H。; Chen,G.推荐系统中多方面社会影响深层潜在表征的双重图形注意网络。 2019年5月13日至17日,美国加利福尼亚州旧金山,国际万维网会议(WWW)会议记录。 [ 谷歌学者 ] Wang,H。; 张,F。; 谢,X。; Guo,M.Dkn:新闻推荐的深度知识软件网络。 2018年4月23日至27日,法国里昂,国际万维网会议(WWW)会议记录。 [ 谷歌学者 ] Wang,H。; 张,F。; 张,M。; Leskovec,J。; 赵,M。; 李,W。; Wang,Z.推荐系统中带标签平滑正则化的知识软件图神经网络。 2019年8月4日至8日在美国阿拉斯加州安克雷奇举行的ACM SIGKDD知识发现和数据挖掘(KDD)会议记录。 [ 谷歌学者 ] Ying,R。; He,R。; Chen,K。; Eksombatchai,P。; 汉密尔顿,W.L。; Leskovec,J.网络规模推荐系统的图卷积神经网络。 2018年8月19-23日,英国伦敦,ACM SIGKDD知识发现和数据挖掘会议(KDD)会议记录。 [ 谷歌学者 ] Sun,H。; Dhingra,B。; 扎希尔,M。; Mazaitis,K。; Salakhutdinov,R。; Cohen,W.W.利用知识库和文本的早期融合进行开放领域问答。 《自然语言处理经验方法学报》(EMNLP),比利时布鲁塞尔,2018年10月31日至11月4日。 [ 谷歌学者 ] Sun,H。; Bedrax-Weiss,T。; Cohen,W.W.Pulnet:基于知识库和文本的迭代检索的开放领域问答。 《自然语言处理实证方法学报》,中国香港,2019年11月3日至7日。 [ 谷歌学者 ] Berant,J。; Chou,A。; 弗罗斯蒂格,R。; Liang,P.基于自由基的问答对语义分析。 《自然语言处理实证方法会议录》(EMNLP),西雅图君悦酒店,美国哥伦比亚特区西雅图,2013年10月18日至21日。 [ 谷歌学者 ] Saxena,A。; 特里帕蒂,A。; Talukdar,P.使用知识库嵌入改进知识图上的多跳问答。 《计算语言学协会(ACL)年度会议记录》,美国华盛顿州西雅图,2020年7月5日至10日。 [ 谷歌学者 ] Ren,H。; 戴,H。; 戴,B。; 陈,X。; Yasunaga,M。; Sun,H。; 舒尔曼斯,D。; Leskovec,J。; 周,D.乐高:知识图上多跳问答的潜在执行引导推理。 机器学习国际会议(ICML)会议记录,奥地利维也纳,2021年7月18日至24日。 [ 谷歌学者 ] 林,B.Y。; 陈,X。; 陈,J。; Ren,X.Kagnet:常识推理的知识软件图形网络。 《自然语言处理实证方法学报》,中国香港,2019年11月3日至7日。 [ 谷歌学者 ] Feng,Y。; 陈,X。; 林,B.Y。; 王,P。; 严,J。; Ren,X.用于知识感知问题回答的可伸缩多跳关系推理。《自然语言处理实证方法学报》,中国香港,2020年11月3日至7日。 [ 谷歌学者 ] Yasunaga,M。; Ren,H。; Bosselut,A。; 梁,P。; Leskovec,J.Qa-gnn:用语言模型和知识图进行推理以回答问题。《计算语言学协会北美分会年会论文集》,在线,2021年6月6日至11日。 [ 谷歌学者 ] 吕,S。; 郭,D。; 徐,J。; 唐·D。; Duan,N。; 龚,M。; 寿,L。; 江,D。; 曹,G。; Hu,S.基于图形的异质外部知识推理,用于常识性问题的回答。《AAAI人工智能会议论文集》,美国纽约州纽约市,2020年2月7日至12日。 [ 谷歌学者 ] 鲁伊斯,C。; Zitnik,M。; Leskovec,J.通过多尺度相互作用组识别疾病治疗机制。 国家公社。 2021 , 12 , 1796. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] 齐特尼克,M。; 阿格拉瓦尔,M。; Leskovec,J.用图卷积网络建模多极化副作用。 生物信息学 2018 , 34 ,i457–i466。 [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] [ 绿色版本 ] 艾奥尼迪斯,V.N。; 宋,X。; Manchanda,S。; 李,M。; 潘,X。; 郑,D。; 宁,X。; 曾,X。; Karypis,G.Drkg-新型冠状病毒药物再利用知识图。 2020年。在线提供: https://github.com/gnn4dr/DRKG/ (2022年7月27日访问)。 博德斯,A。; Usunier,N。; 加西亚·杜兰,a。; 韦斯顿,J。; Yakhnenko,O.翻译用于多关系数据建模的嵌入。 《神经信息处理系统学报》,美国内华达州塔霍湖,2013年12月5日至8日。 [ 谷歌学者 ] 镍,M。; Tresp,V。; Kriegel,H.-P.多元关系数据集体学习的三向模型。 2011年6月28日至7月2日在美国华盛顿州贝尔维尤举行的第28届国际机器学习会议记录; 第809-816页。 [ 谷歌学者 ] 杨,B。; Yih,W。; 何,X。; 高杰。; Deng,L.在知识库中嵌入学习和推理的实体和关系。 2015年5月7日至9日,美国加利福尼亚州圣地亚哥,机器学习国际会议(ICLR)(海报)会议记录。 [ 谷歌学者 ] 洛杉矶加拉拉加。; 特弗卢迪,C。; 软管,K。; Suchanek,F.M.AMIE:本体知识库中不完全证据下的关联规则挖掘。 2013年5月13日至17日在巴西里约热内卢举行的第22届国际万维网会议记录; 第413-422页。 [ 谷歌学者 ] Muggleton,S.H.归纳逻辑编程。 新一代。 计算。 1991 , 8 , 295–318. [ 谷歌学者 ] [ 交叉参考 ] Socher,R。; 陈,D。; 曼宁,C.D。; Ng,A.Y.用神经张量网络推理完成知识库。 《神经信息处理系统学报》,美国内华达州塔霍湖,2013年12月5日至8日。 [ 谷歌学者 ] Schlichtkrull,医学博士。; Kipf,T.N。; 布隆,P。; 伯格,R.v。; 蒂托夫,I。; Welling,M.用图卷积网络建模关系数据。 《扩展语义网络会议(ESWC)会议记录》,希腊赫拉克利翁,2018年6月3日至7日; 第593-607页。 [ 谷歌学者 ] 王,P.-W。; 斯蒂芬诺娃,D。; 多莫科斯,C。; Kolter,J.Z.知识图中数值规则的可微学习。 第八届国际学习代表大会(ICLR)会议记录,埃塞俄比亚亚的斯亚贝巴,2020年4月26日至30日。 [ 谷歌学者 ] 熊,W。; Hoang,T。; Wang,W.Y.DeepPath:知识图推理的强化学习方法。 《自然语言处理实证方法会议录》,丹麦哥本哈根,2017年9月9日至11日; 第564-573页。 [ 谷歌学者 ] 达斯·R。; Dhuliawala,S。; Zaheer,M。; 维利斯,L。; 杜鲁加尔,I。; 克里希纳穆尔西,A。; Smola,A。; McCallum,A.走走,找到答案:使用强化学习在知识库中的路径上进行推理。 《自然语言处理经验方法学报》,丹麦哥本哈根,2018年9月9-11日。 [ 谷歌学者 ] 郭,S。; 王,Q。; Wang,L。; 王,B。; Guo,L.知识图嵌入来自软规则的迭代指导。 2018年2月2日至7日在美国洛杉矶新奥尔良举行的第三十二届AAAI人工智能会议记录; 第4816–4823页。 [ 谷歌学者 ] Vrandecic,D。; Krötzsch,M.Wikidata:一个免费的协作知识库。 Commun公司。 ACM公司 2022 , 57 , 78–85. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 斯佩尔,R。; Havasi,C.ConceptNet5:关系知识的大型语义网络。 在 人民网遇到NLP,合作构建语言资源 ; 施普林格:德国柏林/海德堡,2013年; 第161-176页。 [ 谷歌学者 ] Lin,Y。; 刘,Z。; 卢安,H。; Sun,M。; Rao,S。; Liu,S.为知识库的表示学习建模关系路径。 2015年9月17日至21日,葡萄牙里斯本,《自然语言处理实证方法汇编》; 第705-714页。 [ 谷歌学者 ] 郑S。; 王,F。; Bao,H。; Hao,Y。; 周,P。; Xu,B.基于新标记方案的实体和关系联合提取。 2017年7月30日至8月4日,加拿大不列颠哥伦比亚省温哥华市,计算语言学协会(ACL)第55届年会会议记录; 第1卷:长篇论文,第1227-1236页。 [ 谷歌学者 ] 冯,J。; 黄,M。; 赵,L。; 杨,Y。; 朱,X.基于噪声数据的关系分类强化学习。 2018年2月2日至7日在美国洛杉矶新奥尔良举行的第三十二届AAAI人工智能会议记录; 第5779–5786页。 [ 谷歌学者 ] Morwal,S。; 北加汉。; 使用隐马尔可夫模型(HMM)进行命名实体识别。 国际期刊自然语言计算。 (IJNLC) 2012 , 1 , 15–23. [ 谷歌学者 ] [ 交叉参考 ] 黄,Z。; 徐伟(Xu,W.)。; Yu,K.序列标记的双向LSTM-CRF模型。 arXiv公司 2015 ,arXiv:1508.01991。 [ 谷歌学者 ] 德夫林,J。; Chang,M。; Lee,K。; Toutanova,K.BERT:语言理解深度双向变形金刚的预训练。 《计算语言学协会北美分会会议记录:人类语言技术》,NAACL-HLT 2019,明尼阿波利斯,明尼苏达州,美国,2019年6月2-7日; 第1卷,第4171–4186页。 [ 谷歌学者 ] 孙,Y。; 王,S。; 李毅。; Feng,S。; Tian,H。; Wu,H。; Wang,H.Ernie 2.0:语言理解的持续预培训框架。 美国纽约州纽约市AAAI人工智能会议记录,2020年2月7日至12日; 第8968–8975页。 [ 谷歌学者 ] 郑S。; Hao,Y。; 卢·D。; Bao,H。; 徐,J。; 郝,H。; Xu,B.基于混合神经网络的联合实体和关系提取。 神经计算 2017 , 257 , 59–66. [ 谷歌学者 ] [ 交叉参考 ] 苏亚雷斯,L.B。; 菲茨杰拉德,N。; Ling,J。; Kwiatkowski,T.匹配空白:关系学习的分布相似性。 计算语言学协会第57届会议论文集,ACL 2019,意大利佛罗伦萨,2019年7月28日至8月2日; 第1卷:长篇论文,第2895–2905页。 [ 谷歌学者 ] 蔡,R。; 张,X。; Wang,H.用于关系分类的双向递归卷积神经网络。 2016年8月7日至12日,德国柏林,ACL,计算语言学协会第54届年会会议记录; 2016; 第一卷:长篇论文。 [ 谷歌学者 ] Miwa,M。; Bansal,M.使用LSTM对序列和树结构进行端到端关系提取。 2016年8月7日至12日,德国柏林,ACL,计算语言学协会第54届年会会议记录; 第一卷:长篇论文。 [ 谷歌学者 ] Wang,Y。; 孙,Y。; 刘,Z。; Sarma,S.E.公司。; Bronstein,医学博士。; Solomon,J.M.《CNN点云学习动态图》。 ACM变速器。 图表。 2019 , 38 , 146:1–146:12. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 曾博士。; 刘凯。; 陈,Y。; Zhao,J.通过分段卷积神经网络进行关系提取的远程监控。 《2015年自然语言处理实证方法会议论文集》,EMNLP 2015,葡萄牙里斯本,2015年9月17日至21日; 第1753-1762页。 [ 谷歌学者 ] Agichtein,E。; Gravano,L.Snowball:从大型纯文本集合中提取关系。 2000年6月2日至7日在美国德克萨斯州圣安东尼奥举行的第五届ACM数字图书馆会议记录; 第85-94页。 [ 谷歌学者 ] A.卡尔森。; Betteridge,J。; 基西尔,B。; 沉降,B。; 赫鲁晓卡,E.R.,Jr。; 走向永无止境的语言学习架构。 2010年7月11日至15日在美国佐治亚州亚特兰大举行的第二十四届AAAI人工智能会议记录。 [ 谷歌学者 ] Wu,L。; 彼得罗尼,F。; Josifoski,M。; 里德尔,S。; Zettlemoyer,L.可扩展零快照实体链接与密集实体检索。 《2020年自然语言处理实证方法会议论文集》,在线,2020年11月16日至20日; 第6397–6407页。 [ 谷歌学者 ] Li,C。; 曹毅。; Hou,L。; 史J。; Li,J.等人。; Chua,T.-S.通过联合知识嵌入模型和交叉粒度模型进行半监督实体对齐。 2019年自然语言处理实证方法会议和第九届国际自然语言处理联合会议论文集,EMNLP-IJCNLP 2019,中国香港,2019年11月3-7日; 第2723–2732页。 [ 谷歌学者 ] 曾伟。; X.赵。; Tang,J。; 李,X。; 罗,M。; Zheng,Q.走向开放世界中的实体结盟:一种无监督的方法。 《高级应用数据库系统会议录》,台湾台北,2021年4月11日至14日; 第272-289页。 [ 谷歌学者 ] 朱,H。; 谢瑞。; 刘,Z。; Sun,M.通过联合知识嵌入迭代实体对齐。 2017年8月19日至25日在澳大利亚墨尔本举行的第二十六届国际人工智能联合会议记录; 第4258–4264页。 [ 谷歌学者 ] Lin,Y。; 刘,Z。; Sun,M。; 刘,Y。; Zhu,X.学习实体和关系嵌入以完成知识图。 2015年1月25日至30日在美国德克萨斯州奥斯汀举行的第二十届AAAI人工智能会议记录; 第2181–2187页。 [ 谷歌学者 ] Nguyen,D.Q。; Vu,T。; Nguyen,T.D。; Nguyen,D.Q。; Phung,D.Q.一种基于胶囊网络的知识图完成和搜索个性化嵌入模型。 2019年6月2日至7日,美国明尼阿波利斯,计算语言学协会北美分会:人类语言技术(NAACL-HLT)年会论文集; 第2180–2189页。 [ 谷歌学者 ] 张,Z。; 庄,F。; 朱,H。; Shi,Z。; 熊,H。; He,Q.用于知识图完成的层次关注关系图神经网络。 美国纽约州纽约市第三十四届AAAI人工智能会议论文集,2020年2月7日至12日; 第9612–9619页。 [ 谷歌学者 ] Mikolov,T。; Sutskever,I。; Chen,K。; Corrado,G.S。; Dean,J.单词和短语的分布式表示及其组成。 2013年12月5日至8日在美国内华达州塔霍湖举行的第27届神经信息处理系统年会论文集; 第3111–3119页。 [ 谷歌学者 ] 吉,G。; He,S。; 徐,L。; 刘凯。; Zhao,J.通过动态映射矩阵嵌入知识图。2015年7月26日至31日,中国北京,计算语言学协会第53届年会论文集; 第687-696页。 [ 谷歌学者 ] 王,Z。; 张杰。; 冯,J。; Chen,Z.在超平面上通过翻译嵌入知识图。 2014年7月27日至31日,加拿大魁北克省魁北克市,第二十八届AAAI人工智能会议记录。 [ 谷歌学者 ] Cohen,W.W.TensorLog:差异演绎数据库。 arXiv公司 2016 ,arXiv:1605.06523。 [ 谷歌学者 ] Wang,W.Y。; Mazaitis,K。; Cohen,W.W.具有个性化pagerank的编程:一个局部有根据的一阶概率逻辑。 2013年10月27日至11月1日在美国加利福尼亚州旧金山举行的第22届ACM信息和知识管理国际会议记录; 第2129-2138页。 [ 谷歌学者 ] Wang,W.Y。; Mazaitis,K。; 老挝,N。; Cohen,W.W.在大型知识库中进行高效推理和学习——使用局部可根据的一阶概率逻辑对提取的信息进行推理。 机器。 学习。 2015 , 100 , 101–126. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 保罗海姆,H。; Bizer,C.使用统计分布提高关联数据的质量。 国际期刊Semant。 Web信息系统。 2014 , 10 , 63–86. [ 谷歌学者 ] [ 交叉参考 ] Jang,S。; 梅加瓦蒂; Choi,J。; Yi,M.Y.,链接数据的半自动质量评估,无需本体。 第14届国际语义网络会议(ISWC)会议记录,美国宾夕法尼亚州伯利恒,2015年10月11日; 第45-55页。 [ 谷歌学者 ] 沈毅。; 黄,P.-S。; Chang,M。; Gao,J.隐式推理网:用共享记忆建模大规模结构化关系。 arXiv公司 2016 ,arXiv:1611.04642v1。 [ 谷歌学者 ] Shi,B。; Weninger,T.开放世界知识图完成。 2018年2月2日至7日在美国洛杉矶新奥尔良举行的第三十二届AAAI人工智能会议记录; 第1957-1964页。 [ 谷歌学者 ] 王,X。; 何,X。; 曹毅。; 刘,M。; Chua,T.-S.KGAT:推荐知识图注意力网络。 第25届ACM SIGKDD知识发现与数据挖掘国际会议论文集,KDD 2019,安克雷奇,美国阿拉斯加州,2019年8月4-8日。 [ 谷歌学者 ] 郭,S。; 王,Q。; Wang,L。; 王,B。; Guo,L.联合嵌入知识图和逻辑规则。 《自然语言处理实证方法会议录》,美国德克萨斯州奥斯汀,2016年11月1日至4日; 第1488-1498页。 [ 谷歌学者 ] Tay,Y。; 卢,A.T。; Hui,S.C.动态知识图上链接预测的多重嵌入的非参数估计。 2017年2月4日至9日在美国加利福尼亚州旧金山举行的第31届AAAI人工智能会议记录; 第1243-1249页。 [ 谷歌学者 ]