@正在进行{德意志电信-2023培训,title=“段落级培训和元评估机器翻译评估指标”,author=“Deutsch、Daniel和Juraska、Juraj和芬克尔斯坦、马拉和马库斯·弗雷塔格“,editor=“Koehn、Philipp和哈多、巴里和科米、汤姆和蒙兹,克里斯托夫“,booktitle=“第八届机器翻译会议论文集”,月=12月,年份=“2023”,address=“新加坡”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.wmt-1.96”,doi=“10.18653/v1/2023.wmt-1.96”,pages=“996--1013”,抽象=“随着机器翻译研究转向句子级以外的文本翻译,自动评估指标在为较长翻译评分方面的有效性尚不清楚。在这项工作中,我们首先提出了一种方法,用于从现有句子级数据中创建用于训练的段落级数据和元评估指标。然后,我们使用这些新数据集用于对现有句子级指标进行基准测试,并在段落级训练学习的指标。有趣的是,我们的实验结果表明,使用句子级指标对整个段落进行评分与使用设计用于段落级的指标同样有效。我们推测,这一结果可归因于基于参考的评估任务的特性以及我们的数据集在捕捉段落级翻译中出现的所有类型的现象方面的局限性。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“deutsch-etal-2023培训”><标题信息><title>段落级培训和元评估机器翻译评估指标</titleInfo><name type=“personal”>丹尼尔德国<角色>作者</角色></name><name type=“personal”>朱拉吉(Juraj)尤拉斯卡<角色>作者</角色></name><name type=“personal”>马拉芬克尔斯坦<角色>作者</角色></name><name type=“personal”>马库斯弗雷塔格<角色>作者</角色></name><originInfo>2023-12发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第八届机器翻译会议记录</titleInfo><name type=“personal”>飞利浦科恩<角色>编辑器</角色></name><name type=“personal”>巴里哈多<角色>编辑器</角色></name><name type=“personal”>汤姆科克米<角色>编辑器</角色></name><name type=“个人”>克里斯托夫蒙兹<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>新加坡</地点></originInfo>会议出版物</relatedItem><摘要>随着机器翻译研究转向句子级以外的文本翻译,目前尚不清楚自动评估指标在为较长翻译评分方面的有效性。在这项工作中,我们首先提出了一种从现有句子级数据创建段落级数据用于训练和元评估指标的方法。然后,我们使用这些新数据集对现有句子级指标以及段落级训练学习指标进行基准测试。有趣的是,我们的实验结果表明,使用句子级指标对整个段落进行评分与使用设计用于段落级的指标同样有效。我们推测,这一结果可归因于基于参考的评估任务的特性以及我们的数据集在捕捉段落级翻译中出现的所有类型的现象方面的局限性</摘要><identifier type=“citekey”>deutsch-etal-2023培训<identifier type=“doi”>10.18653/v1/2023。wmt-1.96</identifier><位置><网址>https://aclantology.org/2023.wmt-1.96</url></位置><部分>2023-12年<扩展单元=“page”><开始>996<end>1013</范围></部分></mods></modsCollection>
%0会议记录%T训练和元评估机器翻译段落级评估指标%A Deutsch,丹尼尔%尤拉斯卡,尤拉杰%A Finkelstein,马拉%马库斯·弗雷塔格%Y Koehn,菲利普%巴里·Y·哈多%Y Kocmi,汤姆%克里斯托夫·蒙兹%第八届机器翻译会议论文集%D 2023年%12月8日%计算语言学协会%C新加坡%F德意志-2023培训%X随着机器翻译研究转向句子级以外的文本翻译,目前尚不清楚自动评估指标在为较长翻译评分方面的有效性。在这项工作中,我们首先提出了一种从现有句子级数据创建段落级数据用于训练和元评估指标的方法。然后,我们使用这些新数据集对现有句子级指标以及段落级训练学习指标进行基准测试。有趣的是,我们的实验结果表明,使用句子级指标对整个段落进行评分与使用设计用于段落级的指标同样有效。我们推测,这一结果可归因于基于参考的评估任务的特性以及我们的数据集在捕捉段落级翻译中出现的所有类型的现象方面的局限性。%R10.18653/v1/2023.wmt-1.96%U型https://aclantology.org/2023.wmt-1.96%U型https://doi.org/10.18653/v1/2023.wmt-1.96%电话996-2013
降价(非正式)
[段落级别的培训和元评估机器翻译评估指标](https://aclantology.org/2023.wmt-1.96)(Deutsch等人,WMT 2023)
国际计算语言学协会
- Daniel Deutsch、Juraj Juraska、Mara Finkelstein和Markus Freitag。2023段落级训练和元评估机器翻译评估指标.英寸第八届机器翻译会议记录,第996-1013页,新加坡。计算语言学协会。