How far can we get with one GPU in 100 hours? CoAStaL at MultiIndicMT Shared Task

Rahul Aralikatte; Héctor Ricardo Murrieta Bello; Miryam de Lhoneux; Daniel Hershcovich; Marcel Bollmann; Anders Søgaard

doi:10.18653/v1/2021.wat-1.24

我们用一个能走多远全球采购单位100小时内？C类o个AS公司助教L（左）在M（M）多用途我国家数据中心机器翻译共享任务

拉胡尔·阿拉利卡特,Héctor Ricardo Murrieta Bello先生,Miryam de Lhoneux公司,丹尼尔·赫什科维奇,马塞尔·博尔曼,安德斯·索加德

摘要

这项工作表明，通过结合记忆和计算优化方面的最新进展，可以在受限的环境下获得有竞争力的翻译结果。我们使用单个GPU对大型多语言翻译模型进行培训和评估，最长时间为100小时，与排行榜上的顶级提交相比，我们的BLEU得分在4-5分以内。我们还对PMI语料库的标准基线进行了基准测试，并重新发现了翻译系统和度量标准的众所周知的缺点。

选集ID：: 2021.瓦-1.24
体积：: 第八届亚洲翻译研讨会论文集（WAT2021）
月份：: 八月
年份：: 2021
地址：: 在线的
编辑：: 中泽俊一（Toshiaki Nakazawa）,中山秀树,Isao Goto先生,Hideya Mino公司,丁晨晨,拉吉·达布雷,阿诺普·昆楚库坦,东山昭平,广岛万鸦老,温帕帕,Shantipriya Parida公司,Ondřej Bojar公司,朱晨晖,沟口昭子,Kaori Abe公司,尤素克·奥达,胜下洙（Katsuhito Sudoh）,黑桥贞道,普什巴克·巴塔查里亚
地点：: WAT公司
SIG公司：
出版商：: 计算语言学协会
注：
页：: 205–211
语言：
网址：: https://aclcollectory.org/2021.wat-1.24
内政部：: 10.18653/v1/2021.瓦-1.24
比比键：
引用（ACL）：: Rahul Aralikatte、Héctor Ricardo Murrieta Bello、Miryam de Lhoneux、Daniel Hershcovich、Marcel Bollmann和Anders Sögaard。2021一个GPU在100小时内能跑多远？多指标共享任务的CoAStaL.英寸第八届亚洲翻译研讨会论文集（WAT2021），第205-211页，在线。计算语言学协会。
引用（非正式）：: 一个GPU在100小时内能跑多远？多指标共享任务的CoAStaL（Aralikatte等人，WAT 2021）
复制引文：
PDF格式：: https://aclantology.org/2021.wat-1.24.pdf
数据: PM-印度, mC4型

PDF格式引用搜索