@正在进行{aepli-etal-2023基准,title=“在没有标准正字法的方言上评估机器翻译度量标准的基准”,author={Aepli,No{\“e}mi和Amrhein、Chantal和肖特曼、弗洛里安和里科·森里奇,editor=“Koehn、Philipp和哈多、巴里和科米、汤姆和蒙兹,克里斯托夫“,booktitle=“第八届机器翻译会议论文集”,月=12月,年=“2023”,address=“新加坡”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.wmt-1.99”,doi=“10.18653/v1/2023.wmt-1.99”,pages=“1045--1065”,抽象=“为了在自然语言处理方面取得明智的进展,我们必须意识到我们使用的评估指标的局限性。在这项工作中,我们评估了非标准化方言的稳健指标,即没有标准正字法的语言变体的拼写差异。为了对此进行调查,我们收集了一份数据从英语到两种瑞士德语方言的自动机器翻译的人工翻译和人工判断。我们进一步为方言变化创建了一个挑战集,并对现有度量{'}性能进行基准测试。我们的研究结果表明,现有的指标无法可靠地评估瑞士德语文本生成输出,尤其是在细分市场层面。我们建议对初始设计进行调整,以提高在面对非标准化方言时的稳健性,尽管仍有很大的改进空间。数据集、代码和模型可在此处获得:https://github.com/textshuttle/dispection{\_}eval“,}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“aepli-etal-2023-基准”><标题信息>不使用标准正字法的方言机器翻译度量标准评估基准</titleInfo><name type=“personal”>没有Aepli(Aepli)<角色>作者</角色></name><name type=“personal”>Chantal公司Amrhein公司<角色>作者</角色></name><name type=“personal”><namePart type=“given”>弗洛里安</namePart>肖特曼<角色>作者</角色></name><name type=“personal”>Rico(Rico)Sennrich<角色>作者</角色></name><originInfo>2023-12发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第八届机器翻译会议记录</titleInfo><name type=“personal”>飞利浦科恩<角色>编辑器</角色></name><name type=“personal”>巴里哈多<角色>编辑器</角色></name><name type=“personal”>汤姆科克米<角色>编辑器</角色></name><name type=“personal”>克里斯托夫蒙兹<角色>编辑器</角色></name><originInfo><publisher>计算语言学协会</publisher><位置>新加坡</place></originInfo><type-authority=“marcgt”>会议出版物</type></relatedItem><abstract>对于自然语言处理的合理进展,我们必须意识到我们使用的评估指标的局限性。在这项工作中,我们评估了非标准化方言的健壮性指标,即没有标准正字法的语言变体的拼写差异。为了研究这一点,我们收集了从英语到两种瑞士德语方言的自动机器翻译的人类翻译和人类判断数据集。我们进一步为方言变化创建了一个挑战集,并对现有指标的性能进行了基准测试。我们的结果表明,现有的指标无法可靠地评估瑞士-德国文本生成输出,尤其是在段级别。我们提出了初步的设计调整,以提高面对非标准化方言的鲁棒性,尽管仍有很大的改进空间。数据集、代码和模型可从以下位置获得:https://github.com/textshuttle/dialect_eval</摘要>aepli-etal-2023-基准10.18653/v1/2023.wmt-1.99<位置><网址>https://aclantology.org/2023.wmt-1.99</url></位置><部分>2023-12年<扩展单元=“page”><开始>1045</开始><end>1065</范围></部分></mods></modsCollection>
%0会议记录%无标准正字法方言机器翻译度量标准的评估基准%A Aepli,诺伊米%A Amrhein,尚塔尔%弗洛里安·肖特曼%A Sennrich,里科%Y Koehn,菲利普%巴里·Y·哈多%Y Kocmi,汤姆%克里斯托夫·蒙兹%第八届机器翻译会议论文集%2023年4月%12月8日%计算语言学协会%C新加坡%F aepli-etal-2023基准%X为了在自然语言处理方面取得明智的进展,我们必须意识到我们使用的评估指标的局限性。在这项工作中,我们评估了非标准化方言的健壮性指标,即没有标准正字法的语言变体的拼写差异。为了研究这一点,我们收集了从英语到两种瑞士德语方言的自动机器翻译的人类翻译和人类判断数据集。我们进一步为方言变化创建了一个挑战集,并对现有指标的性能进行了基准测试。我们的结果表明,现有的指标无法可靠地评估瑞士-德国文本生成输出,尤其是在段级别。我们提出了初步的设计调整,以提高面对非标准化方言的鲁棒性,尽管仍有很大的改进空间。数据集、代码和模型可从以下位置获得:https://github.com/textshuttle/dialect_eval%R10.18653/v1/2023.wmt-1.99%U型https://aclantology.org/2023.wmt-1.99%U型https://doi.org/10.18653/v1/2023.wmt-1.99%电话:1045-1065
降价(非正式)
[无标准正字法方言机器翻译度量标准评估基准](https://aclantology.org/2023.wmt-1.99)(Aepli等人,WMT 2023)
国际计算语言学协会