@在建项目{bawden-sagot-2023-rocs,title=“{R}o{CS}-{MT}:机器翻译的健壮性挑战集”,author=“鲍登、瑞秋和萨戈,贝诺{^i}t“,editor=“Koehn、Philipp和哈多、巴里和科米、汤姆和蒙兹,克里斯托夫“,booktitle=“第八届机器翻译会议论文集”,月=12月,年=“2023”,address=“新加坡”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.wmt-1.21”,doi=“10.18653/v1/2023.wmt-1.21”,pages=“198--216”,abstract=“RoCS-MT是机器翻译(MT)的强大挑战集,旨在测试机器翻译系统翻译显示非标准特征的用户生成内容(UGC)的能力,如拼写错误、去中心化、缩写等。RoCS-MT由Reddit的英文评论组成,这些评论因其非标准性质而被选中,这些评论已被手动规范化并被专业翻译成五种语言:法语、德语、捷克语、乌克兰语和俄语。在WMT23测试套件共享任务的背景下,我们分析了提交给所有from-English语言对的通用机器翻译任务的模型,从而对最先进的机器翻译模型在处理非标准UGC文本时所面临的问题类型提供了一些见解。我们比较了机器翻译质量的自动度量,包括质量估计,以了解在没有参考文献的情况下是否可以得出相同的结论。就稳健性而言,我们发现许多系统与非标准的单词变体发生冲突(例如,由于受语音启发的拼写、收缩、截断等),但这取决于系统和训练数据量,最好的整体系统在所有现象中表现得更好。GPT4是清晰的前车手。然而,我们告诫不要对推广能力得出结论,因为它和其他系统可以在RoCS的源端以及类似数据上进行培训。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“bawden-sagot-2023-rocs”><标题信息>RoCS-MT:机器翻译的稳健性挑战集</titleInfo><name type=“personal”>蕾切尔<namePart type=“family”>巴登</namePart><角色>作者</角色></name><name type=“personal”><namePart type=“given”>贝诺Sagot系列<角色>作者</角色></name><originInfo>2023-12发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第八届机器翻译会议记录</titleInfo><name type=“personal”>飞利浦科恩<角色>编辑器</角色></name><name type=“personal”>巴里哈多<角色>编辑器</角色></name><name type=“personal”>汤姆科克米<角色>编辑器</角色></name><name type=“personal”>克里斯托夫蒙兹<角色>编辑器</角色></name><originInfo><publisher>计算语言学协会</publisher><位置>新加坡</place></originInfo><type-authority=“marcgt”>会议出版物</type></relatedItem>RoCS-MT是机器翻译(MT)的强大挑战集,旨在测试机器翻译系统翻译用户生成内容(UGC)的能力,这些内容具有非标准特征,如拼写错误、偏移、缩写等,根据其非标准性质选择,这些标准已手动标准化并专业翻译成五种语言:法语、德语、捷克语、乌克兰语和俄语。在WMT23测试套件共享任务的背景下,我们分析了提交给所有from-English语言对的通用机器翻译任务的模型,从而对最先进的机器翻译模型在处理非标准UGC文本时所面临的问题类型提供了一些见解。我们比较了机器翻译质量的自动度量,包括质量估计,以了解在没有参考文献的情况下是否可以得出相同的结论。就稳健性而言,我们发现许多系统与非标准的单词变体发生冲突(例如,由于受语音启发的拼写、收缩、截断等),但这取决于系统和训练数据量,最好的整体系统在所有现象中表现得更好。GPT4是清晰的前车手。然而,我们警告不要得出关于泛化能力的结论,因为它和其他系统可以在RoCS的源端以及类似的数据上进行训练</摘要>bawden-sagot-2023-rocs10.18653/v1/2023.wmt-1.21<位置><网址>https://aclantology.org/2023.wmt-1.21</url></位置><部分>2023-12年<扩展单元=“page”><开始>198<end>216</范围></部分></mods></modsCollection>
%0会议记录%T RoCS-MT:机器翻译的稳健性挑战集%瑞秋,鲍登%西红柿,贝诺%Y Koehn,菲利普%巴里·Y·哈多%Y Kocmi,汤姆%克里斯托夫·蒙兹%第八届机器翻译会议论文集%2023年4月%12月8日%计算语言学协会%C新加坡%F淫秽歌曲-2023-rocs%X RoCS-MT是机器翻译(MT)的强大挑战集,旨在测试机器翻译系统翻译用户生成的内容(UGC)的能力,这些内容显示出非标准特征,如拼写错误、脱落、缩写等。RoCS-MT由Reddit的英文注释组成,这些注释是根据其非标准性质而选择的,这些语言已被手动标准化并被专业翻译成五种语言:法语、德语、捷克语、乌克兰语和俄语。在WMT23测试套件共享任务的背景下,我们分析了提交给所有from-English语言对的通用机器翻译任务的模型,从而对最先进的机器翻译模型在处理非标准UGC文本时所面临的问题类型提供了一些见解。我们比较了机器翻译质量的自动度量,包括质量估计,以了解在没有参考文献的情况下是否可以得出相同的结论。就稳健性而言,我们发现许多系统与非标准的单词变体发生冲突(例如,由于受语音启发的拼写、收缩、截断等),但这取决于系统和训练数据量,最好的整体系统在所有现象中表现得更好。GPT4是清晰的前车手。然而,我们告诫不要对推广能力得出结论,因为它和其他系统可以在RoCS的源端以及类似数据上进行培训。%R10.18653/v1/2023.wmt-1.21%U型https://aclantology.org/2023.wmt-1.21%U型https://doi.org/10.18653/v1/2023.wmt-1.21%电话198-216
降价(非正式)
[RoCS-MT:机器翻译的鲁棒性挑战集](https://aclantology.org/2023.wmt-1.21)(Bawden&Sagot,WMT 2023)
国际计算语言学协会