文化指南针:预测具有文化特征的攻击性语言检测中的迁移学习成功率

李周,安东尼娅·卡拉莫利古,陈文宇(Wenyu Chen),丹尼尔·赫什科维奇


摘要
语言技术的日益普及需要在机器学习领域转向考虑文化多样性,特别是对于严重依赖文化细微差别的主观任务,如攻击性语言检测(OLD)。目前的理解强调,这些任务在很大程度上受到文化价值观的影响,然而,在确定文化特征能否准确预测此类主观任务的跨文化迁移学习的成功方面存在着显著差距。针对这一点,我们的研究深入探讨了文化特征和迁移学习有效性的交叉点。研究结果表明,文化价值调查确实对OLD任务中跨文化迁移学习的成功具有预测能力,并且可以通过使用冒犯性单词距离来进一步提高这一能力。基于这些结果,我们主张将文化信息整合到数据集中。此外,我们建议利用丰富的文化信息数据源,如调查,以增强文化适应性。我们的研究标志着在寻求更具包容性和文化敏感性的语言技术方面向前迈进了一步。
选集ID:
2023.结果-emnlp.845
体积:
计算语言学协会的发现:EMNLP 2023
月份:
十二月
年份:
2023
地址:
新加坡
编辑:
Houda Bouamor公司,胡安·皮诺,卡利卡-巴厘岛
地点:
调查结果
SIG公司:
出版商:
计算语言学协会
注:
页:
12684–12702
语言:
网址:
https://aclantology.org/2023.findings-emnlp.845
内政部:
10.18653/v1/2023.查找-emnlp.845
比比键:
引用(ACL):
Li Zhou、Antonia Karamolegkou、Wenyu Chen和Daniel Hershcovich。2023文化指南针:预测具有文化特征的攻击性语言检测中的迁移学习成功率.英寸计算语言学协会的发现:EMNLP 2023第12684–12702页,新加坡。计算语言学协会。
引用(非正式):
文化指南针:预测具有文化特征的攻击性语言检测中的迁移学习成功率(Zhou等人,发现2023)
复制引文:
PDF格式:
https://aclantology.org/2023.findings-emnlp.845.pdf