@进行中{khayrallah-etal-2018-jhu,title=“2018年{WMT}的{JHU}并行语料库过滤系统”,author=“Khayrallah、Huda和徐,海南和菲利普·科恩”,editor=“Bojar,Ond{\v{r}}ej和Chatterjee、Rajen和费德曼、克里斯蒂安和费舍尔、马克和格雷厄姆、伊维特和哈多、巴里和哈克、马蒂亚斯和是的,安东尼奥·吉梅诺和Koehn、Philipp和蒙兹、克里斯托夫和Negri、Matteo和N{\'e}v{\'e}ol,Aur{\e}谎言和内维斯、玛丽安娜和Post、Matt和Specia、Lucia和图尔奇、马尔科和卡琳·弗斯普尔”,booktitle=“第三届机器翻译会议论文集:共享任务文件”,月=10月,年份=“2018”,address=“比利时,布鲁塞尔”,publisher=“计算语言学协会”,url=“https://aclantology.org/W18-6479”,doi=“10.18653/v1/W18-6479”,pages=“896--899”,abstract=“这项工作描述了我们提交给WMT18并行语料库过滤共享任务的情况。我们使用稍微修改过的Zipporah语料库筛选工具包(Xu和Koehn,2017),该工具包计算句子对的适当性分数和流利性分数,并使用分数的加权和作为选择标准。这项工作与Zipporah的不同之处在于,我们尝试使用要过滤的噪声语料库来计算组合权重,从而避免像标准Zippora那样生成合成数据。”,}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“khayrallah-etal-2018-jhu”><标题信息>2018年WMT的JHU并行语料库过滤系统</titleInfo><name type=“个人”>Huda哈拉拉(Khayrallah)<角色>作者</角色></name><name type=“个人”>海南<namePart type=“family”>徐</namePart><角色>作者</角色></name><name type=“个人”>飞利浦科恩<角色>作者</角色></name><originInfo>2018-10发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第三届机器翻译会议论文集:共享任务文件</titleInfo><name type=“个人”>Ondřej博加尔<角色>编辑器</角色></name><name type=“个人”>拉詹查特吉<角色>编辑器</角色></name><name type=“个人”>克里斯蒂安<namePart type=“family”>费德曼</namePart><角色>编辑器</角色></name><name type=“个人”>标记费舍尔<角色>编辑器</角色></name><name type=“个人”><namePart type=“给定”>Yvette</namePart>格雷厄姆<角色>编辑器</角色></name><name type=“个人”>巴里哈多<角色>编辑器</角色></name><name type=“个人”>马提亚斯哈克<角色>编辑器</角色></name><name type=“个人”>安东尼奥Jimeno是的<角色>编辑器</角色></name><name type=“个人”>飞利浦科恩<角色>编辑器</角色></name><name type=“个人”>克里斯托夫蒙兹<角色>编辑器</角色></name><name type=“个人”>马蒂奥Negri(奈格里)<角色>编辑器</角色></name><name type=“个人”>奥雷利内维尔<角色>编辑器</角色></name><name type=“个人”>玛丽安娜内维斯<角色>编辑器</角色></name><name type=“个人”><namePart type=“given”>马特帖子<角色>编辑器</角色></name><name type=“个人”>露西娅Specia系列<角色>编辑器</角色></name><name type=“个人”><namePart type=“given”>马可图尔奇<namePart type=“family”><角色>编辑器</角色></name><name type=“个人”>卡琳Verspoor公司<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>比利时、布鲁塞尔</place></originInfo>会议出版物</relatedItem>这项工作描述了我们提交给WMT18并行语料库过滤共享任务的情况。我们使用稍微修改过的Zipporah语料库过滤工具包(Xu和Koehn,2017),该工具包计算句子对的适当性分数和流利性分数,并使用分数的加权和作为选择标准。这项工作与Zipporah的不同之处在于,我们尝试使用要过滤的噪声语料库来计算组合权重,从而避免像标准Zippora那样生成合成数据</摘要><identifier type=“citekey”>khayrallah-etal-2018-jhu</identifier>10.18653/v1/W18-6479<位置><网址>https://aclantology.org/W18-6479</url></位置><部分>2018-10年<扩展单元=“page”><开始>896</开始><end>899</范围></部分></mods></modsCollection>
%0会议记录%2018年WMT的JHU并行语料库过滤系统%哈拉拉,胡达%阿旭,海南%菲利普·科恩%Y Bojar,Ondřej%拉金·查特吉%Y Federmann,克里斯蒂安%Y Fishel,马克%伊维特·Y·格雷厄姆%巴里·Y·哈多%Y哈克,马提亚斯%Y Yepes,安东尼奥·吉梅诺%Y Koehn,菲利普%克里斯托夫·蒙兹%Y Negri,马蒂奥%奥雷利·Y·内维尔%玛丽亚娜·尼维斯%Y Post,马特%露西娅·Y·斯佩西亚%马尔科·图尔奇%Y Verspoor,卡琳%第三届机器翻译会议论文集:共享任务文件%2018年D月%10月8日%计算语言学协会%C比利时,布鲁塞尔%F khayrallah-etal-2018-jhu公司%这项工作描述了我们提交给WMT18并行语料库过滤共享任务的情况。我们使用稍微修改过的Zipporah语料库过滤工具包(Xu和Koehn,2017),该工具包计算句子对的适当性分数和流利性分数,并使用分数的加权和作为选择标准。这项工作与Zipporah的不同之处在于,我们尝试使用要过滤的噪声语料库来计算组合权重,从而避免像标准Zippora那样生成合成数据。%10.18653/v1/W18-6479兰特%U型https://aclantology.org/W18-6479%U型https://doi.org/10.18653/v1/W18-6479%电话:896-899
降价(非正式)
【用于WMT 2018的JHU并行语料库过滤系统】(https://aclantology.org/W18-6479)(Khayrallah等人,WMT 2018)
国际计算语言学协会
- Huda Khayrallah、Hainan Xu和Philipp Koehn。20182018年WMT的JHU并行语料库过滤系统.英寸第三届机器翻译会议记录:共享任务文件,第896–899页,比利时,布鲁塞尔。计算语言学协会。