×

为关系提取编码隐式关系需求:一种联合推理方法。 (英语) Zbl 1478.68364号

摘要:关系抽取是识别实体之间预定义关系的任务,在信息抽取、知识库构建、问答等方面起着至关重要的作用。现有的大多数关系抽取器都会对每个实体对进行局部和单独的预测,而忽略了不同实体对和知识库中可用的隐式全局线索,这往往导致不同实体对的局部预测之间发生冲突。本文提出了一个联合推理框架,利用这种全局线索来解决局部预测之间的分歧。我们利用两种线索来生成约束,这些约束可以捕获关系的隐式类型和基数要求。这些约束可以以硬方式或软方式进行检查,这两种方式都可以在整数线性规划公式中进行有效的探索。在英文和中文数据集上的实验结果表明,我们提出的框架可以有效地利用这两类全局线索,解决局部预测之间的分歧,从而改进了适用于数据集的各种关系提取器。我们的实验还表明,从现有知识库中自动学习的线索的性能与人类提炼的线索相当或更好。

MSC公司:

68立方英尺 知识表示
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Suchanek,F。;范,J。;霍夫曼,R。;里德尔,S。;Talukdar,P.P.,《自动化知识库构建进展》,SIGMOD Rec.J.(2013)
[2] 姚,L。;里德尔,S。;McCallum,A.,《没有标记数据的集体跨文档关系提取》,(自然语言处理经验方法会议论文集。自然语言处理的经验方法会议文献集,EMNLP’10(2010),计算语言学协会:美国宾夕法尼亚州斯特鲁兹堡计算语言学协会),1013-1023
[3] 张,X。;张杰。;曾杰。;严,J。;陈,Z。;Sui,Z.,面向关系事实提取的精确远程监督,(计算语言学协会第51届年会会议记录,第2卷:短文(2013),计算语言学协会:计算语言学协会,保加利亚索非亚),810-815
[4] 科赫,M。;Gilmer,J。;Soderland,S。;Weld,D.S.,带关联参数的类型软件远程监督关系提取,(《2014年自然语言处理经验方法会议论文集》,《2014年天然语言处理实证方法会议论文录》,EMNLP(2014),计算语言学协会:计算语言学协会(卡塔尔多哈),1891-1901
[5] 纪浩。;Grishman,R。;Dang,H.,tac2011知识库人口轨迹概述,(文本分析会议论文集(2011))
[6] Soderland,S。;费希尔,D。;Aseltine,J。;Lehnert,W.,Crystal:归纳概念词典(第14届国际人工智能联合会议论文集,第2卷)。第14届国际人工智能联合会议记录,第2卷,IJCAI'95(1995),Morgan Kaufmann Publishers Inc.:Morgan Koufmann-Publishers Inc.San Francisco,CA,USA),1314-1319
[7] 赵,S。;Grishman,R.,《使用核方法提取与集成信息的关系》,(第43届计算语言学协会年会论文集。第43届计算机语言学协会年会刊论文集,ACL'05(2005),计算语言学协会:美国宾夕法尼亚州斯特鲁兹堡计算语言学协会),419-426
[8] 陈,Y。;郑琦。;Chen,P.,提取中文关系的特征集合方法,Artif。智力。,228, 179-194 (2015) ·Zbl 1346.68225号
[9] 班科,M。;卡瓦雷拉,M.J。;Soderland,S。;布罗德黑德,M。;Etzioni,O.,《从网络中提取开放信息》(《国际人工智能联合会议论文集》,国际人工智能联席会议论文集,IJCAI'07(2007)),2670-2676
[10] Fader,A。;Soderland,S。;Etzioni,O.,《确定开放信息提取的关系》,(自然语言处理经验方法会议论文集。自然语言处理实证方法会议论文,EMNLP’11(2011),计算语言学协会:计算语言学协会,宾夕法尼亚州斯特鲁兹堡,美国),1535-1545
[11] Wu,F。;Weld,D.S.,使用维基百科进行开放信息提取,(计算语言学协会年会论文集。计算语言学协会年度会议论文集,ACL'10(2010),计算语言学协会:计算语言学协会,宾夕法尼亚州斯特鲁兹堡,美国),118-127
[12] 邱,L。;Zhang,Y.,ZORE:一个基于语法的汉语开放关系提取系统,(2014年自然语言处理实证方法会议论文集。2014年自然语言处理实证方法会议论文集,EMNLP(2014),计算语言学协会:计算语言学协会(卡塔尔多哈),1870-1880
[13] Xu,Y。;Kim,M.-Y。;奎因,K。;Goebel,R。;Barbosa,D.,用树核进行开放信息提取,(计算语言学协会北美分会2013年会议记录:人类语言技术(2013),计算语言学协会:计算语言学协会,佐治亚州亚特兰大),868-877
[14] 卡尔森,A。;Betteridge,J。;基西尔,B。;沉降,B。;赫鲁晓卡,E。;Mitchell,T.,《走向永无止境的语言学习架构》,(《人工智能会议论文集》,人工智能会议文献集,AAAI(2010),美国人工智能出版社),1306-1313
[15] Bunescu,R.C.,《学会使用最少的监督从网络中提取关系》,(计算语言学协会第45届年会会议记录,计算语言学学会第45届年度会议记录,ACL07(2007))
[16] 明茨,M。;比尔,S。;斯诺,R。;Jurafsky,D.,《无标记数据关系提取的远程监督》,(《ACL第47届年会和AFNLP第4届IJCNLP联合会议记录》,第2卷。ACL第47届年会和AFNLP第4届IJCNLP联合会议记录,第2卷,ACL’09(2009)),1003-1011
[17] 苏尔迪努,M。;McClosky,D。;Tibshirani,J。;鲍尔,J。;Chang,A.X。;斯皮特科夫斯基,V.I。;Manning,C.D.,《TAC-KBP时隙填充任务的简单远程监督方法》,(第三届文本分析会议论文集。第三届文字分析会议论文,TAC 2010,美国马里兰州盖瑟斯堡(2010))
[18] 霍夫曼,R。;张,C。;Ling,X。;Zettlemoyer,L。;Weld,D.S.,《基于知识的对重叠关系信息提取的弱监督》,(计算语言学协会第49届年会论文集:人类语言技术(2011),计算语言学协会:美国俄勒冈州波特兰计算语言学协会),541-550
[19] 苏尔迪努,M。;Tibshirani,J。;纳拉帕蒂,R。;Manning,C.D.,用于关系提取的多因素多标签学习,(2012年自然语言处理和计算自然语言学习实证方法联合会议论文集(2012),计算语言学协会),455-465
[20] 曾博士。;刘凯。;陈,Y。;赵,J.,通过分段卷积神经网络进行关系提取的远程监督,(2015年自然语言处理经验方法会议论文集,计算语言学协会:葡萄牙里斯本计算语言学协会),1753-1762
[21] Lin,Y。;沈,S。;刘,Z。;卢安,H。;Sun,M.,《对实例进行选择性关注的神经关系提取》(《计算语言学协会第54届年会论文集》,第1卷:长篇论文(2016),计算语言学协会:计算语言学协会,德国柏林),2124-2133
[22] 高松,S。;佐藤,I。;Nakagawa,H.,减少关系抽取远程监督中的错误标签,(计算语言学协会第50届年会会议记录:长篇论文,第1卷)。计算语言学协会第50届年会会议记录:长篇论文,第1卷,ACL’12(2012),计算语言学协会:计算语言学协会,宾夕法尼亚州斯特鲁兹堡,美国),721-729
[23] 徐伟(Xu,W.)。;霍夫曼,R。;赵,L。;Grishman,R.,《填补关系抽取远程监督的知识库缺口》,(计算语言学协会第51届年会会议记录,第2卷:短文(2013),计算语言学协会:计算语言学协会,保加利亚索菲亚),665-670
[24] Pershina,M。;Min,B。;徐伟(Xu,W.)。;Grishman,R.,将标记数据注入远程监管以提取关系,(计算语言学协会第52届年会会议记录,第2卷:短文(2014),计算语言学协会:计算语言学协会,马里兰州巴尔的摩),732-738
[25] Angeli,G。;Tibshirani,J。;吴杰。;Manning,C.D.,将远程和部分监督结合起来用于关系提取,(《2014年自然语言处理经验方法会议论文集》,《2014年天然语言处理实证方法会议论文录》,EMNLP(2014),计算语言学协会:计算语言学协会(卡塔尔多哈),1556-1567
[26] 王,C。;范,J。;Kalyanpur,A。;Gondek,D.,关系主题的关系提取,(2011年自然语言处理经验方法会议论文集(2011年),计算语言学协会:计算语言学协会爱丁堡,苏格兰,英国),1426-1436
[27] 里德尔,S。;姚,L。;马林,B.M。;McCallum,A.,使用矩阵分解和通用模式的关系提取,(人类语言技术联合会议/计算语言学协会北美分会年会。人类语言技术联合会议/计算语言学协会北美分会年会,HLT-NAACL'13(2013))
[28] Ye,H。;Chao,W。;罗,Z。;Li,Z.,通过有效的深度排名联合提取与阶级关系,(计算语言学协会第55届年会论文集,第1卷:长篇论文(2017),计算语言学协会:加拿大温哥华计算语言学协会),1810-1820
[29] Krompass,D。;拜尔,S。;Tresp,V.,知识图中的类型约束表示学习,(国际语义网会议(1)。国际语义网络会议(1),计算机科学讲稿,第9366卷(2015年),施普林格),640-655
[30] 谢瑞。;刘,Z。;贾,J。;卢安,H。;Sun,M.,带实体描述的知识图表示学习,(第三十届AAAI人工智能会议论文集。第三十届人工智能AAAI会议论文集,2016年2月12日至17日,美国亚利桑那州凤凰城(2016)),2659-2665
[31] 李,Q。;Anzaroot,S。;林,W.-P。;李,X。;Ji,H.,跨文档信息提取的联合推断,(《第20届ACM国际信息与知识管理会议论文集》,第20届美国ACM国际会议论文集,CIKM’11(2011),ACM:美国纽约州纽约市ACM),2225-2228
[32] 李,Q。;纪浩。;Huang,L.,通过具有全局特征的结构化预测进行联合事件提取,(计算语言学协会年会论文集(2013),计算机语言学协会),73-82
[33] de Lacalle,O.L。;Lapata,M.,用一般领域知识进行无监督关系提取,(自然语言处理经验方法会议论文集(2013),计算语言学协会),415-425
[34] Kulczynski,S.,Die pflanzenassoziationen der pieninen,公牛。国际学术界。波兰。科学。莱特。,Cl.科学。数学。《自然》,B(科学与自然)增刊II,57-203(1927)
[35] 里德尔,S。;姚,L。;McCallum,A.,《无标签文本的建模关系及其提及》,(数据库中的机器学习和知识发现,数据库中的计算机学习和知识探索,计算机科学讲义,第6323卷(2010年),施普林格:施普林格柏林/海德堡),148-163
[36] Sandhaus,E.,《纽约时报》注释语料库ldc2008t19,(语言数据联合会,语言数据联合体,费城(2008))
[37] C.比彻。;莱曼,J。;Kobilarov,G。;奥尔,S。;贝克尔,C。;Cyganiak,R。;Hellmann,S.,DBpedia-数据网络的结晶点,网络语义。,7, 154-165 (2009)
[38] Berger,A.L。;Pietra,V.J.D。;Pietra,S.A.D.,自然语言处理的最大熵方法,计算。语言学家。,22, 1, 39-71 (1996)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。