@进行中{aralikatte-etal-2021-far,title=“100小时内使用一个{GPU}我们能走多远?{C}o{AS}ta{L}at{M}ulti{I}ndic{MT}共享任务”,author=“Aralikatte、Rahul和Murrieta Bello,H{'e}ctor Ricardo和de Lhoneux、Miryam和赫什科维奇、丹尼尔和Bollmann、Marcel和S{\o}gaard,Anders“,editor=“中泽、东崎和中山秀树Goto、Isao和Mino、Hideya和丁、陈晨和Dabre、Raj和Kunchukuttan、Anoop和东山、Shohei和Manabe、Hiroshi和Pa、Win Pa和Parida、Shantipriya和Bojar、Ond{\v{r}}ej和Chu、Chenhui和Eriguchi、Akiko和Abe、Kaori和Oda、Yusuke和Sudoh、Katsuhito和Kurohashi、Sadao和巴塔查里亚(Bhattacharyya,Pushpak)“,booktitle=“第八届亚洲翻译研讨会论文集(WAT2021)”,月=八月,年=“2021”,address=“在线”,publisher=“计算语言学协会”,url=“https://aclantology.org/2021.wat-1.24”,doi=“10.18653/v1/2021.wat-1.24”,pages=“205--211”,抽象=“这项工作表明,通过结合内存和计算优化方面的最新进展,可以在有限的环境下获得有竞争力的翻译结果。我们使用单个GPU训练和评估大型多语言翻译模型,最长时间为100个小时,与排行榜上的顶级提交相比,只差4-5个BLEU分。我们还对PMI语料库上的标准基线进行基准测试,并重新发现翻译系统和度量标准的众所周知的缺点。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“网址:http://www.loc.gov/mods/v3"><mods ID=“aralikatte-etal-2021-far”><标题信息><title>100小时内使用一个GPU可以走多远?MultiIndicMT共享任务的CoAStaL</titleInfo><name type=“personal”>拉胡尔阿拉利卡特<角色>作者</角色></name><name type=“personal”>Héctor李嘉图Murrieta Bello<角色>作者</角色></name><name type=“personal”>Miryamde Lhoneux系列<角色>作者</角色></name><name type=“personal”><namePart type=“given”>Daniel</namePart>丹尼尔</namePart赫什科维奇<角色>作者</角色></name><name type=“personal”>马塞尔博尔曼<角色>作者</角色></name><name type=“personal”>安德斯瑟加德<角色>作者</角色></name><originInfo><发布日期>2021-08</发布日期></originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第八届亚洲翻译研讨会(WAT2021)会议记录</titleInfo><name type=“personal”>Toshiaki中泽<namePart type=“family”><角色>编辑器</角色></name><name type=“personal”>Hideki(Hideki)<namePart type=“family”>Nakayama</namePart><角色>编辑器</角色></name><name type=“personal”>Isao转到<角色>编辑器</角色></name><name type=“personal”>HideyaMino(米诺)<角色>编辑器</角色></name><name type=“personal”>陈晨<namePart type=“given”>丁<namePart type=“family”><角色>编辑器</角色></name><name type=“personal”>拉吉达布雷<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>Anoop</namePart>无效Kunchukuttan<角色>编辑器</角色></name><name type=“personal”>Shohei(Shohei)东山<namePart type=“family”><角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>宏</namePart>马纳贝<角色>编辑器</角色></name><name type=“personal”>赢<namePart type=“given”>Pa</namePart><namePart type=“family”>Pa</namePart><角色>编辑器</角色></name><name type=“personal”>香蒂普利亚帕里达<角色>编辑器</角色></name><name type=“personal”>Ondřej<namePart type=“family”>Bojar</namePart><角色>编辑器</角色></name><name type=“personal”>陈慧楚<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>Akiko</namePart>沟口<namePart type=“family”><角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>考瑞<namePart type=“family”>Abe<角色>编辑器</角色></name><name type=“personal”>优素克奥达<角色>编辑器</角色></name><name type=“personal”>胜本<namePart type=“given”><namePart type=“family”>数独</namePart><角色>编辑器</角色></name><name type=“personal”>萨多<namePart type=“given”>Kurohashi<角色>编辑器</角色></name><name type=“personal”>Pushpak巴塔查里亚<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>在线</place></originInfo>会议出版物</relatedItem>这项工作表明,通过结合记忆和计算优化方面的最新进展,可以在受限环境下获得竞争性翻译结果。我们使用单个GPU对大型多语言翻译模型进行培训和评估,最长时间为100小时,与排行榜上的顶级提交相比,我们的BLEU得分在4-5分以内。我们还对PMI语料库上的标准基线进行了基准测试,并重新发现了翻译系统和度量的众所周知的缺点</摘要>aralikatte-etal-2021-far10.18653/v1/2021.wat-1.24<位置><网址>https://aclantology.org/2021.wat-1.24</url></位置><部分>2021-08年<扩展单元=“page”><开始>205</开始><end>211</end></范围></部分></模块></modsCollection>
%0会议记录%T一个GPU在100小时内我们能走多远?多指标共享任务的CoAStaL%阿拉利卡特,拉胡尔%A Murrieta Bello,赫克托·里卡多%米里亚姆·A de Lhoneux%丹尼尔·赫什科维奇%马赛尔·博尔曼%安德斯·索加德%Y Nakazawa,Toshiaki先生%Y中山秀树%伊索·Y·戈托%伊迪娅·米诺%Y Ding,陈晨%拉杰·达布雷%Y Kunchukuttan,阿诺普%Y东山秀平%Y Manabe,广岛%是的,温帕%Y Parida,Shantipriya公司%Y Bojar,Ondřej%Y Chu、Chenhui%Y Eriguchi、Akiko%Y Abe,考里%Yusuke的Y Oda%Y Sudoh,Katsuhito先生%Y Kurohashi,佐藤%Y Bhattacharyya,普什巴克%第八届亚洲翻译研讨会论文集(WAT2021)%D 2021年%8月8日%计算语言学协会%C在线%F aralikatte-etal-2021-far公司%X这项工作表明,通过结合内存和计算优化的最新进展,可以在受限环境下获得有竞争力的翻译结果。我们使用单个GPU对大型多语言翻译模型进行培训和评估,最长时间为100小时,与排行榜上的顶级提交相比,我们的BLEU得分在4-5分以内。我们还对PMI语料库的标准基线进行了基准测试,并重新发现了翻译系统和度量标准的众所周知的缺点。%R 10.18653/v1/2021.瓦-1.24%U型https://aclantology.org/2021.wat-1.24%U型https://doi.org/10.18653/v1/2021-wat-1.24%电话:205-211
降价(非正式)
[一个GPU在100小时内我们能走多远?CoAStaL at MultiIndicMT Shared Task](https://aclantology.org/2021.wat-1.24)(Aralikatte等人,WAT 2021)
国际计算语言学协会
- Rahul Aralikatte、Héctor Ricardo Murrieta Bello、Miryam de Lhoneux、Daniel Hershcovich、Marcel Bollmann和Anders Sögaard。2021一个GPU在100小时内能跑多远?多指标共享任务的CoAStaL.英寸第八届亚洲翻译研讨会论文集(WAT2021),第205-211页,在线。计算语言学协会。