Modeling Users and Online Communities for Abuse Detection: A Position on Ethics and Explainability

Pushkar Mishra; Helen Yannakoudakis; Ekaterina Shutova

doi:10.18653/v1/2021.findings-emnlp.287

为用户和在线社区建立滥用检测模型：关于道德和可解释性的立场

摘要

互联网上的虐待是我们这个时代的一个重要社会问题。数百万互联网用户面临各种平台上的骚扰、种族主义、人身攻击和其他类型的虐待。虐待对个人的心理影响可能是深刻和持久的。因此，在过去的几年里，在NLP领域，针对自动滥用语言检测进行了大量的研究工作。在本立场文件中，我们讨论了用户和在线社区建模在滥用检测中的作用。具体来说，我们回顾并分析了利用用户或社区信息来增强对滥用语言的理解和检测的最新方法。然后，我们探讨了合并用户和社区信息的道德挑战，提出了指导未来研究的考虑因素。最后，我们讨论了滥用语言检测中的可解释性问题，提出了一种可解释方法应该展示的属性。我们描述了用户和社区信息如何促进这些属性的实现，并从属性的角度讨论了可解释性的有效操作。

选集ID：: 2021.结果-emnlp.287
体积：: 计算语言学协会的发现：EMNLP 2021
月份：: 十一月
年份：: 2021
地址：: 多米尼加共和国卡纳角
编辑：: 玛丽·弗朗辛·莫恩斯,黄宣景,露西娅·斯佩西亚,斯科特·文涛（Scott Wen-tau Yih）
地点：: 调查结果
SIG公司：: SIGDAT公司
出版商：: 计算语言学协会
注：
页：: 3374–3385
语言：
网址：: https://acl选集.org/2021.findings-emnlp.287
内政部：: 10.18653/v1/2021.查找-emnlp.287
比比键：
引用（ACL）：: Pushkar Mishra、Helen Yannakoudakis和Ekaterina Shutova。2021为滥用检测建模用户和在线社区：关于道德和可解释性的立场.英寸计算语言学协会的发现：EMNLP 2021，第3374–3385页，多米尼加共和国卡纳角。计算语言学协会。
引用（非正式）：: 建模用户和在线社区以检测虐待行为：道德和可解释性立场（Mishra等人，结果2021）
复制引文：
PDF格式：: https://aclantology.org/2021.findings-emnlp.287.pdf

PDF格式引用搜索