我们用一个能走多远全球采购单位100小时内?C类o个AS公司助教L(左)M(M)多用途国家数据中心机器翻译共享任务

拉胡尔·阿拉利卡特,Héctor Ricardo Murrieta Bello先生,Miryam de Lhoneux公司,丹尼尔·赫什科维奇,马塞尔·博尔曼,安德斯·索加德


摘要
这项工作表明,通过结合记忆和计算优化方面的最新进展,可以在受限的环境下获得有竞争力的翻译结果。我们使用单个GPU对大型多语言翻译模型进行培训和评估,最长时间为100小时,与排行榜上的顶级提交相比,我们的BLEU得分在4-5分以内。我们还对PMI语料库的标准基线进行了基准测试,并重新发现了翻译系统和度量标准的众所周知的缺点。
选集ID:
2021.瓦-1.24
体积:
第八届亚洲翻译研讨会论文集(WAT2021)
月份:
八月
年份:
2021
地址:
在线的
编辑:
中泽俊一(Toshiaki Nakazawa),中山秀树,Isao Goto先生,Hideya Mino公司,丁晨晨,拉吉·达布雷,阿诺普·昆楚库坦,东山昭平,广岛万鸦老,温帕帕,Shantipriya Parida公司,Ondřej Bojar公司,朱晨晖,沟口昭子,Kaori Abe公司,尤素克·奥达,胜下洙(Katsuhito Sudoh),黑桥贞道,普什巴克·巴塔查里亚
地点:
WAT公司
SIG公司:
出版商:
计算语言学协会
注:
页:
205–211
语言:
网址:
https://aclcollectory.org/2021.wat-1.24
内政部:
10.18653/v1/2021.瓦-1.24
比比键:
引用(ACL):
Rahul Aralikatte、Héctor Ricardo Murrieta Bello、Miryam de Lhoneux、Daniel Hershcovich、Marcel Bollmann和Anders Sögaard。2021一个GPU在100小时内能跑多远?多指标共享任务的CoAStaL.英寸第八届亚洲翻译研讨会论文集(WAT2021),第205-211页,在线。计算语言学协会。
引用(非正式):
一个GPU在100小时内能跑多远?多指标共享任务的CoAStaL(Aralikatte等人,WAT 2021)
复制引文:
PDF格式:
https://aclantology.org/2021.wat-1.24.pdf
数据
PM-印度mC4型