@正在进行{paetzold-2018-utfpr-wmt,title=“{UTFPR}在{WMT}2018:机器翻译的极简主义监督语料库过滤”,author=“Paetzold,Gustavo”,editor=“Bojar,Ond{\v{r}}ej和Chatterjee、Rajen和费德曼、克里斯蒂安和费舍尔、马克和格雷厄姆、伊维特和哈多、巴里和哈克、马蒂亚斯和是的,安东尼奥·吉梅诺和Koehn、Philipp和蒙兹、克里斯托夫和Negri、Matteo和N{\'e}v{\'e}ol,Aur{\e}谎言和内维斯、玛丽安娜和Post、Matt和Specia、Lucia和图尔奇、马尔科和卡琳·弗斯普尔”,booktitle=“第三届机器翻译会议论文集:共享任务文件”,月=10月,年份=“2018”,address=“比利时,布鲁塞尔”,publisher=“计算语言学协会”,url=“https://aclantology.org/W18-6483”,doi=“10.18653/v1/W18-6483”,pages=“923--927”,抽象=“我们在WMT 2018并行语料库过滤任务中展示了UTFPR系统。我们的监督方法通过在人工生成的二进制分类数据集上训练经典的二进制分类模型来区分好的和坏的翻译,该数据集来自高质量的翻译集,以及由6个语义距离特征组成的最小集仅依赖易收集资源的ures。我们根据{`}好{''}标签的概率对翻译进行排序。我们的结果表明,logistic回归对与我们的方法最为吻合,在评估的不同环境中产生更一致的结果。”,}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“paetzold-2018-utfpr-wmt”><标题信息>2018年WMT上的UTFPR:机器翻译的极简监督语料库过滤</titleInfo><name type=“personal”>古斯塔沃Paetzold<角色>作者</角色></name><originInfo>2018-10发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第三届机器翻译会议论文集:共享任务文件</titleInfo><name type=“personal”>Ondřej博加尔<角色>编辑器</角色></name><name type=“personal”>拉詹查特吉<角色>编辑器</角色></name><name type=“personal”>克里斯蒂安<namePart type=“family”>费德曼</namePart><角色>编辑器</角色></name><name type=“personal”>标记费舍尔<角色>编辑器</角色></name><name type=“personal”><namePart type=“给定”>Yvette</namePart>格雷厄姆<角色>编辑器</角色></name><name type=“personal”>巴里哈多<角色>编辑器</角色></name><name type=“personal”>马提亚斯哈克<角色>编辑器</角色></name><name type=“personal”>安东尼奥Jimeno是的<角色>编辑器</角色></name><name type=“personal”>飞利浦科恩<角色>编辑器</角色></name><name type=“personal”>克里斯托夫蒙兹<角色>编辑器</角色></name><name type=“personal”>马蒂奥Negri(奈格里)<角色>编辑器</角色></name><name type=“personal”>奥雷利内维尔<角色>编辑器</角色></name><name type=“personal”>玛丽安娜内维斯<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>马特帖子<角色>编辑器</角色></name><name type=“personal”>露西娅Specia系列<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>马可图尔奇<namePart type=“family”><角色>编辑器</角色></name><name type=“personal”>卡琳Verspoor公司<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>比利时、布鲁塞尔</地点></originInfo>会议出版物</relatedItem>我们在WMT 2018并行语料库过滤任务中展示了UTFPR系统。我们的监督方法通过在人工生成的二进制分类数据集上训练经典的二进制分类模型来区分好翻译和坏翻译,该数据集源自高质量的翻译集,以及由6个语义距离特征组成的最小集,这些特征仅依赖于易于收集的资源。我们根据“好”标签的概率对翻译进行排名。我们的结果表明,logistic回归对与我们的方法最为吻合,在评估的不同环境中产生更一致的结果</摘要>paetzold-2018-utfpr-wmt10.18653/v1/W18-6483<位置><网址>https://aclantology.org/W18-6483</url></位置><部分>2018-10年<扩展单元=“page”><开始>923927年</范围></部分></mods></modsCollection>
%0会议记录%2018年WMT大会上的T UTFPR:机器翻译的极简监督语料库过滤%A Paetzold,古斯塔沃%Y Bojar,Ondřej%拉金·查特吉%Y Federmann,克里斯蒂安%Y Fishel,马克%伊维特·Y·格雷厄姆%巴里·Y·哈多%Y哈克,马提亚斯%Y Yepes,安东尼奥·吉梅诺%Y Koehn,菲利普%克里斯托夫·蒙兹%Y Negri,马蒂奥%奥雷利·Y·内维尔%玛丽亚娜·尼维斯%Y Post,马特%露西娅·Y·斯佩西亚%马尔科·图尔奇%Y Verspoor,卡琳%第三届机器翻译会议论文集:共享任务文件%2018年D月%10月8日%计算语言学协会%C比利时,布鲁塞尔%F paetzold-2018-utfpr-wmt公司%X我们在WMT 2018并行语料库过滤任务中展示了UTFPR系统。我们的监督方法通过在人工生成的二进制分类数据集上训练经典的二进制分类模型来区分好翻译和坏翻译,该数据集源自高质量的翻译集,以及由6个语义距离特征组成的最小集,这些特征仅依赖于易于收集的资源。我们根据“好”标签的概率对翻译进行排名。我们的结果表明,logistic回归对与我们的方法最为吻合,在评估的不同环境中产生更一致的结果。%10.18653/v1/W18-6483兰特%U型https://aclantology.org/W18-6483%U型https://doi.org/10.18653/v1/W18-6483%电话923-927
降价(非正式)
【UTFPR在WMT 2018:机器翻译的极简主义监督语料库过滤】(https://aclantology.org/W18-6483)(Paetzold,WMT 2018)
国际计算语言学协会