@进料{soto-etal-2020-ixameds,title=“Ixamed{'}为{WMT}20生物医学共享任务提交的描述:使用术语进行领域自适应的好处和局限性”,author=“Soto、Xabier和Perez-de-Vi{\~n}aspre、Olatz和拉巴卡、戈尔卡和奥罗诺兹,迈特“,editor={Barrault,Lo{\“\i}c和Bojar、Ond{\v{r}}ej和布加尔、费蒂和Chatterjee、Rajen和Costa-juss{\`a},Marta R.和费德曼、克里斯蒂安和费舍尔、马克和弗雷泽、亚历山大和格雷厄姆、伊维特和古兹曼、帕科和哈多、巴里和哈克、马提亚斯和是的,安东尼奥·吉梅诺和Koehn、Philipp和马丁斯、安德烈和Morishita、Makoto和蒙兹、克里斯托夫和长田、Masaaki和中泽、Toshiaki和内格里·马特奥,booktitle=“第五届机器翻译会议记录”,月=11月,年份=“2020”,address=“在线”,publisher=“计算语言学协会”,url=“https://aclantology.org/2020.wmt-1.96”,pages=“875--880”,abstract=“在本文中,我们用en-eu、en-es和es-en三种语言对描述了Ixa为我们参与WMT20生物医学共享任务而开发的系统。在定义我们的方法时,我们将重点放在有效利用最近编译的语料库来训练机器翻译(MT)翻译Covid-19相关文本的系统,以及重用先前编译的语料库和生物医学或临床领域开发的系统。关于所使用的技术,我们基于之前将临床文本翻译成巴斯克语的工作中的发现,利用临床术语将机器翻译系统适应临床领域。然而,在手动检查了我们的系统生成的一些输出后,对于大多数提交,我们最终使用的是仅使用基本语料库训练的系统,因为包括临床术语在内的系统生成输出的长度比相应的参考短。因此,我们提出了在英语和西班牙语之间翻译摘要的简单基准;在将英文摘要和术语翻译成巴斯克语(en-eu)时,我们将每种文本的最佳en-es系统与我们的es-eu系统连接起来。我们根据BLEU评分给出了自动评估结果,并分析了包括临床术语对生成输出的平均句子长度的影响。根据最近关于负责任地使用GPU进行NLP研究的建议,我们根据训练MT系统所消耗的功率估算了产生的CO2排放量。”,}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“网址:http://www.loc.gov/mods/v3"><mods ID=“soto-etal-2020-ixameds”><标题信息>Ixamed对WMT20生物医学共享任务的提交说明:使用领域适应术语的优点和局限性</titleInfo><name type=“personal”><namePart type=“given”>Xabier</namePart>索托<角色>作者</角色></name><name type=“personal”>奥拉茨Perez-de-Viñaspre<角色>作者</角色></name><name type=“personal”>高尔卡拉巴卡<角色>作者</角色></name><name type=“personal”>Maite公司奥罗诺兹<角色>作者</角色></name><originInfo><发布日期>2020-11</发布日期></originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第五届机器翻译会议记录</titleInfo><name type=“personal”><namePart type=“given”>低成本巴罗<namePart type=“family”>Barrault<角色>编辑器</角色></name><name type=“personal”>Ondřej博加尔<角色>编辑器</角色></name><name type=“personal”>费蒂布加尔<角色>编辑器</角色></name><name type=“personal”>拉詹查特吉<角色>编辑器</角色></name><name type=“personal”>玛尔塔<namePart type=“given”>R</namePart>Costa-jussá<角色>编辑器</角色></name><name type=“personal”>克里斯蒂安费德曼<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>标记</namePart>费舍尔<角色>编辑器</角色></name><name type=“personal”>亚历山大弗雷泽<角色>编辑器</角色></name><name type=“personal”>Yvette(伊维特)格雷厄姆<角色>编辑器</角色></name><name type=“personal”>Paco公司古兹曼<角色>编辑器</角色></name><name type=“personal”>巴里哈多<角色>编辑器</角色></name><name type=“personal”>马提亚斯<namePart type=“family”>哈克</namePart><角色>编辑器</角色></name><name type=“personal”>安东尼奥<namePart type=“given”>Jimeno</namePart>是的<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>Philipp</namePart>科恩<角色>编辑器</角色></name><name type=“personal”>安德烈马丁斯<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>Makoto森田(Morishita)<角色>编辑器</角色></name><name type=“personal”>克里斯托夫蒙兹<角色>编辑器</角色></name><name type=“personal”>马萨基长田<角色>编辑器</角色></name><name type=“personal”>Toshiaki中泽<namePart type=“family”><角色>编辑器</角色></name><name type=“personal”>马蒂奥Negri(奈格里)<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>在线</place></originInfo>会议出版物</relatedItem>在本文中,我们用en-eu、en-es和es-en三种语言对描述了Ixa为参与WMT20生物医学共享任务而开发的系统。在定义我们的方法时,我们将重点放在有效利用最近为训练机器翻译(MT)系统编译的语料库来翻译Covid-19相关文本,以及重用以前编译的语料和生物医学或临床领域开发的系统。关于所使用的技术,我们基于之前将临床文本翻译成巴斯克语的工作中的发现,利用临床术语将机器翻译系统适应临床领域。然而,在手动检查了我们的系统生成的一些输出后,对于大多数提交,我们最终使用的是仅使用基本语料库训练的系统,因为包括临床术语在内的系统生成输出的长度比相应的参考短。因此,我们提出了在英语和西班牙语之间翻译摘要的简单基准;在将英文摘要和术语翻译成巴斯克语(en-eu)时,我们将每种文本的最佳en-es系统与我们的es-eu系统连接起来。我们根据BLEU评分给出了自动评估结果,并分析了包括临床术语对生成输出的平均句子长度的影响。根据最近关于负责任地使用GPU进行NLP研究的建议,我们根据训练MT系统所消耗的功率,对产生的CO2排放量进行了估计</摘要>soto-etal-2020-ixameds<位置><网址>https://aclantology.org/2020.wmt-1.96</url></位置><部分><日期>2020-11</date><扩展单元=“page”><开始>875</开始><end>880</范围></部分></mods></modsCollection>
%0会议记录%T Ixamed对WMT20生物医学共享任务的提交说明:使用领域适应术语的优点和局限性%夏比尔·A·索托%A Perez-de-Viñaspre,奥拉茨%戈尔卡,拉巴卡%A Oronoz,梅特%洛伊茨州Y Barrault%Y Bojar,Ondřej%Y Bougares,费蒂%拉金·查特吉%Y Costa jussà,玛尔塔·R。%Y Federmann,克里斯蒂安%Y Fishel,马克%亚历山大·弗雷泽%伊维特·Y·格雷厄姆%帕科·Y·古兹曼%巴里·Y·哈多%Y哈克,马提亚斯%Y Yepes,安东尼奥·吉梅诺%Y Koehn,菲利普%安德烈·马丁斯%Y Morishita,Makoto公司%克里斯托夫·蒙兹%Y长田,Masaaki%Y Nakazawa,Toshiaki先生%Y Negri,马蒂奥%第五届机器翻译会议论文集%D 2020年%11月8日%计算语言学协会%C在线%F soto-etal-2020-ixameds公司%在本文中,我们用en-eu、en-es和es-en三种语言对描述了Ixa为参与WMT20生物医学共享任务而开发的系统。在定义我们的方法时,我们将重点放在有效利用最近为训练机器翻译(MT)系统编译的语料库来翻译Covid-19相关文本,以及重用以前编译的语料和生物医学或临床领域开发的系统。关于所使用的技术,我们基于之前将临床文本翻译成巴斯克语的工作结果,利用临床术语使MT系统适应临床领域。然而,在手动检查了我们的系统生成的一些输出后,对于大多数提交,我们最终使用的是仅使用基本语料库训练的系统,因为包括临床术语在内的系统生成输出的长度比相应的参考短。因此,我们提出了在英语和西班牙语之间翻译摘要的简单基准;在将英文摘要和术语翻译成巴斯克语(en-eu)时,我们将每种文本的最佳en-es系统与我们的es-eu系统连接起来。我们根据BLEU评分给出了自动评估结果,并分析了包括临床术语对生成输出的平均句子长度的影响。根据最近关于负责任地使用GPU进行NLP研究的建议,我们根据训练MT系统所消耗的功率估算了产生的CO2排放量。%U型https://aclantology.org/2020.wmt-1.96%电话875-880
降价(非正式)
[Ixamed对WMT20生物医学共享任务的提交说明:使用领域适应术语的优点和局限性](https://aclantology.org/2020.wmt-1.96)(Soto等人,WMT 2020)
国际计算语言学协会