基于触发词语义选择的Twitter事件共指消解研究

doi:10.11896／j.issn.1002-137X.2018.12.020

摘要

摘要：随着社交媒体的发展和普及，如何识别短文本中两个事件提及之间的共指关系是一个紧迫的问题。在传统的事件引用解析研究中，需要从已有的NLP工具和各种知识库中提取丰富的语言特征，这限制了领域的可扩展性，并导致错误的传播。为了克服这些局限性，本文提出了一种新的基于事件触发器的选择性表达方法来探索Twitter上的共指关系。首先，利用双向长短期记忆（bi-LSTM）提取句子级和提及级的特征。然后，通过在句子级特征上应用门来生成潜在特征，使其有选择性地表达。其次，设计了两个辅助特征，即触发器和时间间隔的重叠字。最后，将所有这些特征连接起来并输入到一个简单的分类器中，以预测共指关系。为了评估这种方法，本文对一个新的数据集EventCoreOnTweet（ECT）进行了注释。实验结果表明，选择性表达方法显著提高了短文本的共指消解性能。

关键词： 双向长短期记忆，事件引用解析，神经网络，短文本

CLC编号：

第三百九十一页

魏平，赵文翰，罗准晨，李周军.基于事件触发器的选择性表达方法在推特事件参考解析中的应用[J]。计算机科学，2018，45（12）：130-136。

工具书类

[1] BEJAN C A，HARABAGIU S。具有丰富语言特征的无监督事件指代消解[C]‖计算语言学协会会议。计算语言学协会，2010:1412-1422。
[2] HOVY E、MITAMURA T、VERDEJO F等。事件并不简单：同一性、非同一性和准同一性。http://aclweb.org/antology/w13-1203。
[3] 艾伦J.《话题检测与跟踪试点研究：DARPA广播新闻转录与理解研讨会论文集》1998:194-218。
[4] HUMPHREYS K，GAIZAUSKAS R，AZZAM S.信息提取的事件关联[C]‖无限制文本实际稳健回指解析中的操作因素研讨会。计算语言学协会，1997:75-81。
[5] TELLEX S，KATZ B，LIN J，等。问答过程检索算法的定量评估[C]‖国际ACM SIGIR信息检索研究与发展会议。美国医学会，2003:41-47。
[6] MCCARTHY D，CARROLL J.使用自动习得的选择前置词消除名词、动词和形容词的歧义。计算语言学，2003,29（4）：639-654。
[7] 曾德，刘凯，赖斯，等。基于卷积深度神经网络的关系分类‖COLING 2014年会议论文集，第25届国际计算语言学会议：技术论文。2014:2335-2344。
[8] NGUYEN T H，GRISHMAN R.用卷积神经网络进行事件检测和域适配‖计算语言学协会第53届年会和第7届国际自然语言处理联合会议的处理（第2卷：短文）.2015:365-371。
[9] 陈毅，徐磊，刘坤，等.基于动态多池卷积神经网络的事件提取[C]‖.计算语言学协会会议.2015。
[10] KRAUSE S，XU F，USZKOREIT H，等.基于卷积神经网络的事件链接与句子特征[C]‖Signll计算自然语言学习会议.2016:239-249。
[11] HAGHIGHI A，DAN K。以实体为中心的模块化模型中的参照解析[C]‖人类语言技术：计算语言学协会北美分会2010年会议。计算语言学协会，2010:385-393。
[12] RAHMAN A，NG V.与WorldKnowledge的对照解析[C]‖计算语言学协会会议：人类语言技术.2011:814-824。
[13] RAO D，MCNAMEE P，DREDZE M.流媒体跨文档实体参考决议[C]‖国际科林会议2010.2010:1050-1058。
[14] MNIH V，HEESS N，Graves A.视觉注意的递归模型‖神经信息处理系统的进展。2014:2204-2212。
[15] BAHDANAU D，CHO K，BENGIO Y.通过联合学习对齐和翻译进行神经机器翻译。arXiv预印本arXiv:1409.04732014。
[16] BAGGA A，BALDWIN B。交叉文献参考：注释、实验和观察‖ACL-99参考及其应用研讨会论文集。1999:1-8。
[17] CHEN Z，JI H，HARALICK R.事件关联解决的成对事件关联模型、特征影响和评估[C]‖新兴文本类型事件研讨会。计算语言学协会，2009:17-22。
[18] CHEN Z，JI H.基于图形的事件参考消解[C]‖自然语言处理基于图形的方法研讨会。计算语言学协会，2009:54-57。
[19] LIU Z，ARAKI J，HOVY E H，等。使用信息传播对文档事件引用进行监督。http://www.lrec-conf.org/proceedings/lrec2014/pdf/646_paper.pdf。
[20] 彭浩，宋毅，丹瑞。事件检测与最小监督协同参考[C]‖自然语言处理经验方法会议。2016:392-402。
[21]TEH Y W，JORDAN M I，BEAL M J等。层次结构Dirichlet过程。美国统计协会出版物，2006101（476）：1566-1581。
[22]GAEL J V，TEH Y W，GHAHRAMANI Z.无限事实隐马尔可夫模型[C]‖神经信息处理系统国际会议。Curran Associates Inc.，2008:1697-1704。
[23]YANG B，CARDIE C，FRAZIER P.事件参考解析的层次距离相关贝叶斯模型。arXiv:1504.059292015。
[24]BLEI D M，FRAZIER P I.距离相关的中餐厅流程。机器学习研究杂志，2011,12（1）：2461-2488。
[25]LEE H，RECASENS M，CHANG A，et al.跨文件的联合实体和事件引用解决方案‖2012年自然语言处理和计算自然语言学习经验方法联合会议论文集。计算语言学协会，2012:489-500。
[26]PRADHAN S S，RAMSHAW L，WEISCHEDEL R，et al.无限制共指：在OntoNotes‖语义计算国际会议上识别实体和事件。IEEE计算机协会，2007:446-453。
[27]ARAKI J，LIU Z，HOVY E H，等.事件关联解析的子事件结构检测——语言资源与评价国际会议.2014:4553-4558。
[28]MIKOLOV T，SUTSKEVER I，CHEN K，et al.单词和短语的分布式表示及其组成[C]‖神经信息处理系统国际会议。Curran Associates Inc.，2013:3111-3119。
[29]HOCHREITER S，SCHMIDHUBER J.长期短期记忆。神经计算，1997，9（8）：1735-1780。
[30]SUTSKEVER I，VINYALS O，LE Q V.神经网络序列到序列学习‖神经信息处理系统进展.2014:3104-3112。
[31]WU Y，SCHUSTER M，CHEN Z，et al.谷歌的神经机器翻译系统：弥合人类和机器翻译之间的鸿沟。arXiv预印本arXiv:1609.081442016。
[32]KINGMA D P，BA J.随机优化的一种方法。arXiv预印本arXiv:1412.6980.2014。
[33]COHEN J.名义量表的一致系数。教育与心理测量，2016,20（1）：37-46。
[34]VILAIN M，BURGER J，ABERDEEN J，et al.信息理解模型理论参考评分方案[C]‖会议，1995年，哥伦比亚，马里兰州，美国，11月。DBLP，1995:45-52。
[35]BAGGA A，BALDWIN B.评分参考链的算法‖第一届国际语言资源会议和语言学核心评价研讨会，1998:563-566。
[36]RECASENS M，HOVY E.BLANC：实施Rand指数进行共指评价。自然语言工程，2011,17（4）：485-510。
[37]LUO X.关于共指消解性能指标[C]‖HLT/EMNLP 2005，人类语言技术会议和自然语言处理经验方法会议，会议记录，加拿大不列颠哥伦比亚省温哥华。DBLP，2005:25-32。
[38]PRADHAN S，LUO X，RECASENS M等。预测提及的核心划分评分：参考实施[C]‖计算语言学协会会议。2014:30。

相关文章15

[1]	宁汉阳、马苗、杨波、刘世昌。智能密码学的研究进展与分析[J] ●●●●。计算机科学，2022，49（9）：288-296。
[2]	吕晓峰、赵树良、高恒达、吴永良、张宝琦。基于异构信息网络的短文本特征丰富方法[J] ●●●●。计算机科学，2022，49（9）：92-100。
[3]	郝志荣、陈龙、黄家成。文本分类中的类鉴别通用对抗攻击[J] ●●●●。计算机科学，2022，49（8）：323-329。
[4]	朱成章，黄嘉尔，肖亚龙，王涵，邹蓓姬。基于注意机制的医学图像深度散列检索算法[J] ●●●●。计算机科学，2022，49（8）：113-119。
[5]	王建明、陈祥佑、杨自忠、史晨阳、张玉杭、钱正坤。不同数据增强方法对模型识别精度的影响[J] ●●●●。计算机科学，2022，49（6A）：418-423。
[6]	孙洁琪、李亚峰、张文波、刘鹏辉。基于离散小波变换的双域特征融合深度卷积神经网络[J] ●●●●。计算机科学，2022，49（6A）：434-440。
[7]	邵新新。TI-FastText自动商品分类算法[J] ●●●●。计算机科学，2022，49（6A）：206-210。
[8]	张红敏、李平平、方晓兵、刘红。基于改进YOLOv3网络模型的人体异常行为检测方法[J] ●●●●。计算机科学，2022，49（4）：233-238。
[9]	刘硕，王耿润，彭建华，李可。基于字词混合特征的中文短文本分类算法[J] ●●●●。计算机科学，2022，49（4）：282-287。
[10]	李勇，吴京鹏，张忠英，张强。基于快速注意机制的节点无特征网络链路预测[J] ●●●●。计算机科学，2022，49（4）：43-48。
[11]	张虎、白平。短文分类句子中长距离词依赖的图卷积网络[J] ●●●●。计算机科学，2022，49（2）：279-284。
[12]	陈志毅、苏杰。用于多模态谣言检测的DeepFM和卷积神经网络集成[J] ●●●●。计算机科学，2022，49（1）：101-107。
[13]	范洪杰、李学东、叶松涛。用于电子病历语义分析的疾病辅助诊断方法[J] ●●●●。计算机科学，2022，49（1）：153-158。
[14]	王超、魏祥林、田青、焦香、魏楠、段强。基于特征梯度的调制识别深度神经网络对抗攻击[J] ●●●●。计算机科学，2021，48（7）：25-32。
[15]	史伟、傅岳。考虑上下文的微博短文本挖掘：一种情感分析方法[J] ●●●●。计算机科学，2021，48（6A）：158-164。

韵律学

已查看

全文

摘要

引用

共享

讨论

基于事件触发器的Twitter事件引用解析的选择性表达方法

PDF（PC）

摘要

引用这篇文章

分享这篇文章

工具书类

相关文章15

韵律学

评论

推荐0