扩大规模C类金属氧化物半导体K(K)iwi:取消标记-IST公司2023年提交质量估算共享任务

里卡多·雷,努诺·M·格雷罗,Jos©Pombal版权所有,Daan van Stigt公司,马科斯·特雷维索,路易莎·科厄,何塞·G·C·德·苏扎,安德烈·马丁斯


摘要
我们介绍了Unbabel和Instituto Superior Técnico对WMT 2023质量评估共享任务(QE)的共同贡献。我们的团队参与了所有任务:句子和单词级质量预测和细粒度错误跨度检测。对于所有任务,我们都基于CometKiwi模型(rei等人,2022年)。我们的多语言方法在所有任务中排名第一,在单词、跨度和句子级别的粒度上达到了最先进的质量评估性能。与之前最先进的CometKiwi相比,我们在与人类判断的相关性方面有了很大改进(最高可达10个Spearman分数),并以3.8个绝对分数超越了第二好的多语言提交。
选集ID:
2023.wmt-1.73年
体积:
第八届机器翻译会议记录
月份:
十二月
年份:
2023
地址:
新加坡
编辑:
菲利普·科恩,巴里·哈多,汤姆·科米,克里斯托夫·蒙兹
地点:
WMT公司
SIG公司:
SIGMT公司
出版商:
计算语言学协会
注:
页码:
841–848
语言:
网址:
https://aclantology.org/2023.wmt-1.73
内政部:
10.18653/v1/2023.wmt-1.73
比比键:
引用(ACL):
里卡多·雷(Ricardo Rei)、努诺·M·格雷罗(Nuno M.Guerreiro)、何塞·蓬巴尔(Jos©Pombal)、达安·范·斯蒂格特(Daan van Stigt)、马科斯·特雷维索(Marcos Treviso)、路易萨·科厄(Luisa Coheur)、何塞·G·C·德。2023扩大彗星Kiwi:Unbabel-IST 2023提交质量评估共享任务.英寸第八届机器翻译会议记录,第841-848页,新加坡。计算语言学协会。
引用(非正式):
扩大CometKiwi:质量评估共享任务的无标签IST 2023提交(Rei等人,WMT 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.wmt-1.73.pdf