跳到主要内容

确定推特上谣言的真实性

乔治·贾塞米迪斯(Georgios Giasemidis)、科林·辛格尔顿(Colin Singleton)、伊奥尼斯·阿格拉菲奥蒂斯(Ioannis Agrafiotis)、杰森·R.C.护士(Jason R.C.Nurse)、艾伦·皮尔格林(Alan Pilgrim)和克里斯·威

摘要

虽然社交网络可以为来自世界各地个人的最新信息提供一个理想的平台,但事实证明,社交网络也是一个谣言不断蔓延、意外或蓄意误导信息经常出现的地方。在本文中,我们的目标是支持从社交媒体数据中获取意义的任务,特别是寻求构建一个自主的消息分类器,用于过滤推特中相关和可信的信息。在我们的工作中,我们收集了大约1亿条公共推文,包括用户过去的推文,从中我们确定了72条谣言(41条是真的,31条是假的)。我们考虑了80多个可信度指标,包括作者的个人资料和过去的行为、社交网络连接(图表)以及推文本身的内容。我们使用现代机器学习分类器对这些措施进行分类,以在谣言爆发后的不同时间窗口生成可信度分数。这样的时间窗口是关键,因为它们可以对谣言的进展进行有用的洞察。从我们的发现中,我们发现我们的模型比文献中的类似研究更准确。我们还确定了数据的关键属性,这些属性会导致指定的可信度得分。最后,我们开发了一个软件演示,它提供了一个可视化的用户界面,允许用户检查分析。

书籍标题
第八届社会信息学国际会议(SocInfo 2016)
185–205
出版商
施普林格
年份
2016