计算机科学››2024,第51卷››问题(5): 208-215.数字对象标识:10.11896/jsjkx.230200131

•人工智能• 以前的文章   下一篇文章

基于跨层次多视角特征融合的多语言事件检测

张志远、张伟彦、宋玉秋、阮彤  

  1. 华东理工大学信息科学与工程学院,上海,200237
  • 收到:2023-02-19 修订过的:2023-06-21 在线:2015年5月24日 出版:2024-05-08
  • 关于作者:张志远,1998年生,研究生。他的主要研究兴趣包括自然语言处理和多语言预训练模型。
    阮彤,1973年生,教授,博士生导师。她的主要研究兴趣包括文本提取知识边图和数据质量评估。

摘要:多语言事件检测任务的目标是将多语言新闻文档集合组织成不同的关键事件,其中每个事件可以包含不同语言的新闻文档。该任务有助于各种下游任务应用,如多语言知识图构建、事件推理、信息检索等。目前,多语言事件检测主要分为两种方法:先翻译后事件检测,首先进行单语言检测,然后跨多语言对齐。前者依赖于翻译的效果,而后者需要针对每种语言单独的训练模式。为此,本文提出了一种基于跨层多视图特征融合的多语种事件检测方法,该方法可以执行端到端的多语态事件检测任务。该方法利用不同层次文档的多视图特征来获得高可靠性。它提高了低资源语言事件检测的泛化性能。在九种语言混合的新闻数据集上的实验表明,该方法将BCubed F1值提高了4.63%。

关键词: 多语言预培训模式, 多语言事件检测, 新闻文档聚类, 加权相似性, 增量群集

CLC编号:

  • TP391型
[1] 黄泽,李泽,姜浩,等.基于自监督自适应图对齐的多语言知识图补全[C]//计算语言学协会第六十届年会论文集.2022:474-485。
[2] AHUJA K,KUMAR S,DANDAPAT S,等.多语言模型零启动性能预测的多任务学习[C]//计算语言学协会第60届年会论文集.2022:5454-5467。
[3] FUJINUMA Y,JORDAN L,KANN K,et al.匹配脚本,如果使用多种语言进行调整:分析多语预设对跨语言迁移的影响[C]//计算语言学协会第60届年会论文集.2022:1500-1512。
[4] GUZMAN L,LAI V,POURAN A,等.基于事件检测的自杀理解[C]//计算语言学协会北美分会2022年会议论文集.2022:1952-1961。
[5] 杨伟,BOYD-GRABER J,PHILIP R.一种用于学习低可比性语料库中加权主题链接的多语言主题模型[C]//2019年自然语言处理实证方法会议论文集.2019:1243-1248。
[6] 刘杰,陈毅,刘凯,等.基于最小并行资源的神经跨语言事件检测[C]//2019年自然语言处理实证方法会议论文集.2019:738-748。
[7] MIRANDA S,ZNOTINS A,COHEN S,等.流媒体新闻的多语言聚类[C]//2018年自然语言处理实证方法会议论文集.2018:4535-4544。
[8] LINGER M,HAJAIEJ M.多语言新闻流的批量聚类[C]//Text2Story’20研讨会论文集。2020:55-61。
[9] LABAN P,HEARST M.newsLens:构建和可视化长期新闻故事[C]//《新闻研讨会中的事件和故事》2017:1-9。
[10] STAYKOVSKI T,BARRON-CEDENO A,MARTINO G,et al.新闻流聚类的密集与稀疏表示[C]//文本故事研讨会论文集2019:47-52。
[11] LI Y,YU Z,GAO S,et al.基于案例元素和深度聚类方法的案件相关新闻检测[J]。中国信息处理杂志,2021,35(11):60-69。
[12] 郭华,王泽,朱强,等.基于半监督学习的中文社会文本事件聚类方法[J]。中国信息处理杂志,2022,36(2):152-159。
[13] SARAVANAKUMAR K,BALLESTEROS M,CHANDRAS-EKARAN M,et al.使用实体感知上下文嵌入的事件驱动新闻流聚类[C]//计算语言学协会欧洲分会第十六届会议论文集.2021:2330-2340。
[14] DEVLIN J,CHANG M,LEE K,et al.BERT:语言理解深度双向转换的预训练[C]//计算语言学协会北美分会2019年会议论文集.2019:4171-4186。
[15] 张毅,郭飞,沈杰,等.基于海量文本语料库的无监督关键事件检测[C]//第28届ACM SIGKDD知识发现与数据挖掘会议论文集.2022:2535-2544。
[16] REIMERS N,GUREVYCH I.句子-BERT:使用连词BERT-Networks的句子加连词[C]//2019年自然语言处理实证方法会议论文集。2019:3980-3990。
[17] 杨伟,于泽,高S,等.基于跨语言神经主题模型的中文-中文新闻主题发现方法[J]。计算机应用杂志,2021,41(10):2879-2884。
[18] CONNEAU A,LAMPLE G,DENOYER L,等.无平行数据的单词翻译[C]//第六届学习表征国际会议论文集.2018:1-14。
[19] 冯凤,杨毅,CER D,等.语言认知BERTSentence嵌入[C]//计算语言学协会第60届年会论文集.2022:878-891。
[20] XUE L,CONSTANT N,ROBERTS A,et al.mT5:一种大规模多语言预训练文本到文本转换器[C]//计算语言学协会北美分会2021年会议论文集.2021:483-498。
[21]YANG Z,DAI Z,YANG Y,et al.XLNet:语言理解的广义自回归预训练[C]//神经信息处理系统的进展32.2019:5754-5764。
[1] 王沙沙、姜峰和王文鹏。基于相对决策熵和加权相似度的粗糙集数据补全方法[J] ●●●●。计算机科学,2014,41(2):245-248。
[2] 毛国军和曹永春。基于数据概要的分布式数据流聚类模型与算法[J] ●●●●。计算机科学,2013,40(6):187-191。
[3] .基于增量聚类的三维网格模型检索[J] ●●●●。计算机科学,2011,38(11):248-251。
[4] .基于加权相似度的粗糙集数据补全方法[J] ●●●●。计算机科学,2011,38(11):167-170。
[5] SIJ Xiao-ke、LAN Yang、QIN Yu ming、CHENG Yao-dong。混合数据流中基于阻尼模型的孤立点检测[J] ●●●●。计算机科学,2010,37(5):157-162。
[6] 张千生、姜生义。基于模糊双向近似推理的系统决策方法[J] ●●●●。计算机科学,2010,37(4):219-。
[7] . [J] ●●●●。计算机科学,2009,36(1):198-200。
已查看
全文


摘要

引用

  共享   
  讨论   
找不到建议阅读的文章!