计算机科学››2022,第49卷››发行(8): 330-335.数字对象标识:10.11896/jsjkx.210600046

• 信息安全 • 上一篇   下一篇

基于改进位置编码的谣言检测模型

姜梦函, 李邵梅, 郑洪浩, 张建朋  

  1. 中国人民解放军战略支援部队信息工程大学信息技术研究所 郑州 450000
  • 收稿日期:2021-06-07 修回日期:2021-10-20 发布日期:2022-08-02
  • 通讯作者:李邵梅(m19139795259@163.com)
  • 作者简介:(13513127249@163.com)
  • 基金资助:
    国家自然基金青年科学基金(62002384);郑州市协同创新重大专项(162/32410218);中国博士后科学基金面上项目(47698)

基于改进位置嵌入的谣言检测模型

蒋梦翰、李绍美、郑红浩、张建鹏  

  1. 解放军战略保障部队信息工程大学信息技术研究所,郑州450000
  • 收到:2021-06-07 修订过的:2021-10-20 出版:2022-08-02
  • 关于作者:姜梦汉,1996年生,研究生。她的主要研究兴趣包括自然语言处理等。
    李少梅,1982年生,博士,副教授。她的主要研究方向包括自然语言处理等。
  • 支持单位:
    国家自然科学基金青年基金(62002384)、郑州协同创新重大项目(162/3240218)、中国博士后科学基金(47698)。

摘要:随着在线社交网络的兴起,人们传播和获取信息的方式发生了翻天覆地的变化。社交媒体在方便人们生活的同时,也加速了谣言的产生和传播。因此,如何准确高效地检测谣言成为了亟待解决的问题。为了提高谣言检测的精度,对基于全局-局部注意网络的谣言检测模型进行了改进,考虑到文本中词与词之间的位置关系对谣言检测的影响,引入了一种新的相对位置编码方法来改进原有模型的局部特征提取模块。该方法能够更准确地提取谣言中文本的语义信息和位置信息并将它们聚合,得到更优的区分谣言与非谣言的文本特征,将该特征和描述转发行为的全局特征相结合,进而提升对谣言的检测效果。实验结果表明,与其他主流检测方法相比,所提方法在微博数据集上的一层楼值可达95.0%,具有更好的检测效果。

关键词: 深度学习, 相对位置编码, 谣言检测, 谣言文本特征, 注意力机制

摘要:随着在线社交网络的兴起,人们传播和获取信息的方式发生了巨大变化。社交媒体在促进人们生活的同时,也加速了谣言的产生和传播。因此,准确有效地检测谣言成为一个亟待解决的问题。为了提高谣言检测的准确性,对基于全局-局部注意网络的谣言检测模型进行了改进。考虑到文本中单词之间的位置关系对谣言检测的影响,引入了一种新的相对位置编码方法来改进原始模型的局部特征提取模块。该方法可以更准确地提取和聚集谣言中文本的语义信息和位置信息,并获得更好的区分谣言和非谣言的文本特征。特征和描述转发行为的全局特征的结合提高了谣言的检测效果。实验结果表明,与其他主流检测方法相比F类该方法的1值在微博数据集上可以达到95.0%,具有较好的检测效果。

关键词: 注意机制, 深度学习, 相对位置嵌入, 谣言检测, 谣言文本特征

中图分类号: 

  • TP391型
[1] 刘志勇,张磊,屠春秋,等。中国社交媒体谣言的统计与语义分析[J]。中科信息,2015,45(12):1536-1546。
[2] 刘志勇,宋朝晖,杨C.社交媒体谣言的早期发现[J]。《全球媒体杂志》,2018,5(4):65-80。
[3] 中国互联网络信息中心。第47次中国互联网发展统计报告[R]。北京:CNNIC,2020年。
[4] CASTILLO C,MENDOZA M,POBLETE B.推特上的信息可信度[C]//第20届万维网国际会议论文集。美国医学会,2011:675-684。
[5] 杨峰,刘毅,于欣,等.新浪微博谣言的自动检测[C]//ACM SIGKDD数据语义挖掘研讨会论文集。美国医学会,2012:13-20。
[6] KWON S,CHA M,JUNG K,et al.网络社交媒体谣言传播的主要特征[C]//第13届IEEE数据挖掘国际会议论文集。ICDM,2013:1103-1108。
[7] 吴坤,杨斯,朱克强。基于传播结构的新浪微博虚假谣言检测[C]//第31届IEEE国际会议数据工程会议论文集。ICDE,2015:651-662。
[8] 马杰,高伟,黄金凤。利用传播结构通过核心学习检测微博帖子中的谣言[C]//计算语言学协会第55届年会的议事录。ACL,2017:708-717。
[9] MA J,GAO W,MITRA P,等.利用递归神经网络检测微博谣言[C]//第25届国际人工智能联合会议论文集。IJCAI,2016:3818-3824。
[10] MA J,GAO W,WONG K F.基于树结构递归神经网络的Twitter谣言检测[C]//计算语言学协会第56届年会论文集。墨尔本。ACL,2018:1980-1989年。
[11] MA J,GAO W.用树变换器揭穿推特上的谣言[C]//第28届国际计算语言学会议论文集。科尔林,2020:5455-5466。
[12] BIAN T,XIAO X,XU T Y,等.基于双向图卷积网络的社交媒体谣言检测[C]//第三十四届AAAI人工智能会议论文集。AAAI,2020:549-556。
[13] 袁春英,马庆伟,周伟,等.联合嵌入异构图的局部和全局关系用于谣言检测[C]//第19届IEEE数据挖掘国际会议论文集。ICDM,2019:796-805。
[14] VASWANI A,SHAZEER N,PARMAR N,et al.Attention is All You Need[C]//第31届国际神经信息处理系统大会论文集。NIPS,2017:5998-6008。
[15] 维利科维奇·P,吉勒姆·C,卡萨诺娃·A等.图形注意力网络[J].arXiv:1710.109032017。
[16] 戴振华,杨振林,杨永明,等.Transformer-XL:固定长度语境下的注意语言模型[C]//计算语言学协会第57届年会论文集。ACL,2019:2978-2989年。
[17] 马J,高伟,魏振英,等.利用微博网站上的社会背景信息时间序列检测谣言[C]//第24届ACM信息与知识管理国际会议论文集。美国医学会,2015:1751-1754。
[18] 刘毅,吴玉凤.基于递归网络和卷积网络传播路径分类的社交媒体虚假新闻早期检测[C]//第32届AAAI人工智能会议论文集。AAAI,2018:354-361。
[1] 饶志双, 贾真, 张凡, 李天瑞.
基于键值关联记忆网络的知识图谱问答方法
用于知识图问题回答的键值关系存储网络
计算机科学, 2022, 49(9): 202-207.https://doi.org/10.11896/jsjkx.220300277
[2] 汤凌韬, 王迪, 张鲁飞, 刘盛云.
基于安全多方计算和差分隐私的联邦学习方案
基于安全多方计算和差异隐私的联合学习方案
计算机科学, 2022, 49(9): 297-305.https://doi.org/10.11896/jsjkx.210800108
[3] 周芳泉, 成卫青.
基于全局增强图神经网络的序列推荐
基于全局增强图神经网络的序列推荐
计算机科学, 2022, 49(9): 55-63.https://doi.org/10.11896/jsjkx.210700085
[4] 戴禹, 许林峰.
基于文本行匹配的跨图文本阅读方法
基于文本行匹配的跨图像文本阅读方法
计算机科学, 2022, 49(9): 139-145.https://doi.org/10.11896/jsjkx.220600032
[5] 周乐员, 张剑华, 袁甜甜, 陈胜勇.
多层注意力机制融合的序列到序列中国连续手语识别和翻译
基于多层注意机制融合的汉语连续手语识别与翻译
计算机科学, 2022, 49(9): 155-161.https://doi.org/10.11896/jsjkx.210800026
[6] 徐涌鑫, 赵俊峰, 王亚沙, 谢冰, 杨恺.
时序知识图谱表示学习
时间知识图表示学习
计算机科学, 2022, 49(9): 162-171.https://doi.org/10.11896/jsjkx.220500204
[7] 熊丽琴, 曹雷, 赖俊, 陈希亮.
基于值分解的多智能体深度强化学习综述
基于值分解的多智能体深度强化学习综述
计算机科学, 2022, 49(9): 172-182.https://doi.org/10.11896/jsjkx.210800112
[8] 王剑, 彭雨琦, 赵宇斐, 杨健.
基于深度学习的社交网络舆情信息抽取方法综述
基于深度学习的社会网络舆情信息提取研究综述
计算机科学, 2022, 49(8): 279-293.https://doi.org/10.11896/jsjkx.220300099
[9] 郝志荣, 陈龙, 黄嘉成.
面向文本分类的类别区分式通用对抗攻击方法
文本分类中的类鉴别通用对抗攻击
计算机科学, 2022, 49(8): 323-329.https://doi.org/10.11896/jsjkx.220200077
[10] 汪鸣, 彭舰, 黄飞虎.
基于多时间尺度时空图网络的交通流量预测模型
用于交通流预测的多时间尺度时空图神经网络
计算机科学, 2022, 49(8): 40-48.https://doi.org/10.11896/jsjkx.220100188
[11] 朱承璋, 黄嘉儿, 肖亚龙, 王晗, 邹北骥.
基于注意力机制的医学影像深度哈希检索算法
基于注意机制的医学图像深度散列检索算法
计算机科学, 2022, 49(8): 113-119.https://doi.org/10.11896/jsjkx.210700153
[12] 孙奇, 吉根林, 张杰.
基于非局部注意力生成对抗网络的视频异常事件检测方法
基于非局部注意的视频异常事件检测生成对抗网络
计算机科学, 2022, 49(8): 172-177.https://doi.org/10.11896/jsjkx.210600061
[13] 闫佳丹, 贾彩燕.
基于双图神经网络信息融合的文本分类方法
基于双图神经网络信息融合的文本分类方法
计算机科学, 2022, 49(8): 230-236.https://doi.org/10.11896/jsjkx.210600042
[14] 侯钰涛, 阿布都克力木·阿布力孜, 哈里旦木·阿布都克里木.
中文预训练模型研究进展
中国预训练模型研究进展
计算机科学, 2022, 49(7): 148-163.https://doi.org/10.11896/jsjkx.211200018
[15] 周慧, 施皓晨, 屠要峰, 黄圣君.
基于主动采样的深度鲁棒神经网络学习
基于主动采样的鲁棒深度神经网络学习
计算机科学, 2022, 49(7): 164-169.https://doi.org/10.11896/jsjkx.210600044
已查看
全文


摘要

引用

  共享   
  讨论   
找不到建议阅读的文章!