翻译系统对额外的语境有多敏感?通过相关上下文缓解神经机器翻译模型中的性别偏见。

沙尼亚·夏尔马,马南·戴伊,库斯图夫·辛哈


摘要
在基于Transformer的体系结构之上构建的神经机器翻译系统通常根据单词重叠度量来提高最先进的翻译质量。然而,越来越多的研究也强调了这些模型在培训期间所包含的固有性别偏见,这在其翻译中反映得很差。在这项工作中,我们研究了是否可以指示这些模型在使用有针对性的、有指导的指令作为上下文的推理过程中修复其偏差。通过在推理过程中翻译相关的上下文句子以及输入,我们发现在三个流行的测试套件(WinoMT、BUG、SimpleGen)中,在减少翻译中的性别偏见方面有了很大的改进。我们进一步提出了一种新的度量标准,以评估几个大型预训练模型(OPUS-MT,M2M-100)对在翻译过程中使用上下文纠正其偏见的敏感性。我们的方法不需要微调,因此可以很容易地在生产系统中使用,从陈规定型的性别职业偏见中去除偏见。我们希望我们的方法和度量可以用于构建更好的、无偏见的翻译系统。
选集ID:
2022.结果-emnlp.143
体积:
计算语言学协会的发现:EMNLP 2022
月份:
十二月
年份:
2022
地址:
阿拉伯联合酋长国阿布扎比
编辑:
约夫·戈德伯格,佐尔尼萨·科扎列娃,张岳(音)
地点:
调查结果
SIG公司:
出版商:
计算语言学协会
注:
页:
1968–1984
语言:
网址:
https://aclantology.org/2022.findings-emnlp.143
内政部:
10.18653/v1/2022.查找-emnlp.143
比比键:
引用(ACL):
Shanya Sharma、Manan Dey和Koustuv Sinha。2022翻译系统对额外的语境有多敏感?通过相关上下文缓解神经机器翻译模型中的性别偏见。.英寸计算语言学协会的研究结果:EMNLP 2022第1968-1984页,阿拉伯联合酋长国阿布扎比。计算语言学协会。
引用(非正式):
翻译系统对额外的语境有多敏感?通过相关上下文缓解神经机器翻译模型中的性别偏见。(Sharma等人,《2022年调查结果》)
复制引文:
PDF格式:
https://aclantology.org/2022.findings-emnlp.143.pdf
视频:
 https://aclantology.org/2022.findings-emnlp.143.mp4网址