计算机科学››2018,第45卷››发行(12):130-136。数字对象标识:10.11896/j.issn.1002-137X.2018.12.020

•人工智能• 以前的文章   下一篇文章

基于事件触发器的Twitter事件引用解析的选择性表达方法

魏平1,赵文翰1,罗准晨2,李周军1  

  1. (北京航空航天大学计算机科学与工程学院,北京100191)1
    (中国人民解放军军事科学院军事科学信息研究中心,北京100142)2
  • 收到:2018-01-24 在线:2018-12-15 出版:2019-02-25

摘要:随着社交媒体的发展和普及,如何识别短文本中两个事件提及之间的共指关系是一个紧迫的问题。在传统的事件引用解析研究中,需要从已有的NLP工具和各种知识库中提取丰富的语言特征,这限制了领域的可扩展性,并导致错误的传播。为了克服这些局限性,本文提出了一种新的基于事件触发器的选择性表达方法来探索Twitter上的共指关系。首先,利用双向长短期记忆(bi-LSTM)提取句子级和提及级的特征。然后,通过在句子级特征上应用门来生成潜在特征,使其有选择性地表达。其次,设计了两个辅助特征,即触发器和时间间隔的重叠字。最后,将所有这些特征连接起来并输入到一个简单的分类器中,以预测共指关系。为了评估这种方法,本文对一个新的数据集EventCoreOnTweet(ECT)进行了注释。实验结果表明,选择性表达方法显著提高了短文本的共指消解性能。

关键词: 双向长短期记忆, 事件引用解析, 神经网络, 短文本

CLC编号:

  • 第三百九十一页
[1] BEJAN C A,HARABAGIU S。具有丰富语言特征的无监督事件指代消解[C]‖计算语言学协会会议。计算语言学协会,2010:1412-1422。
[2] HOVY E、MITAMURA T、VERDEJO F等。事件并不简单:同一性、非同一性和准同一性。http://aclweb.org/antology/w13-1203。
[3] 艾伦J.《话题检测与跟踪试点研究:DARPA广播新闻转录与理解研讨会论文集》1998:194-218。
[4] HUMPHREYS K,GAIZAUSKAS R,AZZAM S.信息提取的事件关联[C]‖无限制文本实际稳健回指解析中的操作因素研讨会。计算语言学协会,1997:75-81。
[5] TELLEX S,KATZ B,LIN J,等。问答过程检索算法的定量评估[C]‖国际ACM SIGIR信息检索研究与发展会议。美国医学会,2003:41-47。
[6] MCCARTHY D,CARROLL J.使用自动习得的选择前置词消除名词、动词和形容词的歧义。计算语言学,2003,29(4):639-654。
[7] 曾德,刘凯,赖斯,等。基于卷积深度神经网络的关系分类‖COLING 2014年会议论文集,第25届国际计算语言学会议:技术论文。2014:2335-2344。
[8] NGUYEN T H,GRISHMAN R.用卷积神经网络进行事件检测和域适配‖计算语言学协会第53届年会和第7届国际自然语言处理联合会议的处理(第2卷:短文).2015:365-371。
[9] 陈毅,徐磊,刘坤,等.基于动态多池卷积神经网络的事件提取[C]‖.计算语言学协会会议.2015。
[10] KRAUSE S,XU F,USZKOREIT H,等.基于卷积神经网络的事件链接与句子特征[C]‖Signll计算自然语言学习会议.2016:239-249。
[11] HAGHIGHI A,DAN K。以实体为中心的模块化模型中的参照解析[C]‖人类语言技术:计算语言学协会北美分会2010年会议。计算语言学协会,2010:385-393。
[12] RAHMAN A,NG V.与WorldKnowledge的对照解析[C]‖计算语言学协会会议:人类语言技术.2011:814-824。
[13] RAO D,MCNAMEE P,DREDZE M.流媒体跨文档实体参考决议[C]‖国际科林会议2010.2010:1050-1058。
[14] MNIH V,HEESS N,Graves A.视觉注意的递归模型‖神经信息处理系统的进展。2014:2204-2212。
[15] BAHDANAU D,CHO K,BENGIO Y.通过联合学习对齐和翻译进行神经机器翻译。arXiv预印本arXiv:1409.04732014。
[16] BAGGA A,BALDWIN B。交叉文献参考:注释、实验和观察‖ACL-99参考及其应用研讨会论文集。1999:1-8。
[17] CHEN Z,JI H,HARALICK R.事件关联解决的成对事件关联模型、特征影响和评估[C]‖新兴文本类型事件研讨会。计算语言学协会,2009:17-22。
[18] CHEN Z,JI H.基于图形的事件参考消解[C]‖自然语言处理基于图形的方法研讨会。计算语言学协会,2009:54-57。
[19] LIU Z,ARAKI J,HOVY E H,等。使用信息传播对文档事件引用进行监督。http://www.lrec-conf.org/proceedings/lrec2014/pdf/646_paper.pdf。
[20] 彭浩,宋毅,丹瑞。事件检测与最小监督协同参考[C]‖自然语言处理经验方法会议。2016:392-402。
[21]TEH Y W,JORDAN M I,BEAL M J等。层次结构Dirichlet过程。美国统计协会出版物,2006101(476):1566-1581。
[22]GAEL J V,TEH Y W,GHAHRAMANI Z.无限事实隐马尔可夫模型[C]‖神经信息处理系统国际会议。Curran Associates Inc.,2008:1697-1704。
[23]YANG B,CARDIE C,FRAZIER P.事件参考解析的层次距离相关贝叶斯模型。arXiv:1504.059292015。
[24]BLEI D M,FRAZIER P I.距离相关的中餐厅流程。机器学习研究杂志,2011,12(1):2461-2488。
[25]LEE H,RECASENS M,CHANG A,et al.跨文件的联合实体和事件引用解决方案‖2012年自然语言处理和计算自然语言学习经验方法联合会议论文集。计算语言学协会,2012:489-500。
[26]PRADHAN S S,RAMSHAW L,WEISCHEDEL R,et al.无限制共指:在OntoNotes‖语义计算国际会议上识别实体和事件。IEEE计算机协会,2007:446-453。
[27]ARAKI J,LIU Z,HOVY E H,等.事件关联解析的子事件结构检测——语言资源与评价国际会议.2014:4553-4558。
[28]MIKOLOV T,SUTSKEVER I,CHEN K,et al.单词和短语的分布式表示及其组成[C]‖神经信息处理系统国际会议。Curran Associates Inc.,2013:3111-3119。
[29]HOCHREITER S,SCHMIDHUBER J.长期短期记忆。神经计算,1997,9(8):1735-1780。
[30]SUTSKEVER I,VINYALS O,LE Q V.神经网络序列到序列学习‖神经信息处理系统进展.2014:3104-3112。
[31]WU Y,SCHUSTER M,CHEN Z,et al.谷歌的神经机器翻译系统:弥合人类和机器翻译之间的鸿沟。arXiv预印本arXiv:1609.081442016。
[32]KINGMA D P,BA J.随机优化的一种方法。arXiv预印本arXiv:1412.6980.2014。
[33]COHEN J.名义量表的一致系数。教育与心理测量,2016,20(1):37-46。
[34]VILAIN M,BURGER J,ABERDEEN J,et al.信息理解模型理论参考评分方案[C]‖会议,1995年,哥伦比亚,马里兰州,美国,11月。DBLP,1995:45-52。
[35]BAGGA A,BALDWIN B.评分参考链的算法‖第一届国际语言资源会议和语言学核心评价研讨会,1998:563-566。
[36]RECASENS M,HOVY E.BLANC:实施Rand指数进行共指评价。自然语言工程,2011,17(4):485-510。
[37]LUO X.关于共指消解性能指标[C]‖HLT/EMNLP 2005,人类语言技术会议和自然语言处理经验方法会议,会议记录,加拿大不列颠哥伦比亚省温哥华。DBLP,2005:25-32。
[38]PRADHAN S,LUO X,RECASENS M等。预测提及的核心划分评分:参考实施[C]‖计算语言学协会会议。2014:30。
[1] 宁汉阳、马苗、杨波、刘世昌。智能密码学的研究进展与分析[J] ●●●●。计算机科学,2022,49(9):288-296。
[2] 吕晓峰、赵树良、高恒达、吴永良、张宝琦。基于异构信息网络的短文本特征丰富方法[J] ●●●●。计算机科学,2022,49(9):92-100。
[3] 郝志荣、陈龙、黄家成。文本分类中的类鉴别通用对抗攻击[J] ●●●●。计算机科学,2022,49(8):323-329。
[4] 朱成章,黄嘉尔,肖亚龙,王涵,邹蓓姬。基于注意机制的医学图像深度散列检索算法[J] ●●●●。计算机科学,2022,49(8):113-119。
[5] 王建明、陈祥佑、杨自忠、史晨阳、张玉杭、钱正坤。不同数据增强方法对模型识别精度的影响[J] ●●●●。计算机科学,2022,49(6A):418-423。
[6] 孙洁琪、李亚峰、张文波、刘鹏辉。基于离散小波变换的双域特征融合深度卷积神经网络[J] ●●●●。计算机科学,2022,49(6A):434-440。
[7] 邵新新。TI-FastText自动商品分类算法[J] ●●●●。计算机科学,2022,49(6A):206-210。
[8] 张红敏、李平平、方晓兵、刘红。基于改进YOLOv3网络模型的人体异常行为检测方法[J] ●●●●。计算机科学,2022,49(4):233-238。
[9] 刘硕,王耿润,彭建华,李可。基于字词混合特征的中文短文本分类算法[J] ●●●●。计算机科学,2022,49(4):282-287。
[10] 李勇,吴京鹏,张忠英,张强。基于快速注意机制的节点无特征网络链路预测[J] ●●●●。计算机科学,2022,49(4):43-48。
[11] 张虎、白平。短文分类句子中长距离词依赖的图卷积网络[J] ●●●●。计算机科学,2022,49(2):279-284。
[12] 陈志毅、苏杰。用于多模态谣言检测的DeepFM和卷积神经网络集成[J] ●●●●。计算机科学,2022,49(1):101-107。
[13] 范洪杰、李学东、叶松涛。用于电子病历语义分析的疾病辅助诊断方法[J] ●●●●。计算机科学,2022,49(1):153-158。
[14] 王超、魏祥林、田青、焦香、魏楠、段强。基于特征梯度的调制识别深度神经网络对抗攻击[J] ●●●●。计算机科学,2021,48(7):25-32。
[15] 史伟、傅岳。考虑上下文的微博短文本挖掘:一种情感分析方法[J] ●●●●。计算机科学,2021,48(6A):158-164。
已查看
全文


摘要

引用

  共享   
  讨论   
找不到建议阅读的文章!