最小监督形态学分割及其在机器翻译中的应用

杰森·里萨,大卫·亚罗斯基


摘要
低资源环境中的受感染语言为统计机器翻译带来了数据稀疏问题。在本文中,我们提出了一种用于阿拉伯语方言语素切分的最小监督算法,与以前最先进的基于短语的统计机器翻译系统相比,该算法在翻译时减少了50%以上的未知单词,总词汇量减少了40%以上,并显著提高了BLEU分数。
选集ID:
2006.amta-papers.21年
体积:
美洲机器翻译协会第七届会议论文集:技术论文
月份:
8月8日至12日
年份:
2006
地址:
美国马萨诸塞州剑桥
地点:
AMTA公司
SIG公司:
发布者:
美洲机器翻译协会
注:
页码:
185–192
语言:
网址:
https://aclantology.org/2006.amta-papers.21
内政部:
比比键:
引用(ACL):
杰森·里萨和大卫·亚罗斯基。2006最小监督形态学分割及其在机器翻译中的应用.英寸美洲机器翻译协会第七届会议记录:技术论文,第185-192页,美国马萨诸塞州剑桥市。美洲机器翻译协会。
引用(非正式):
最小监督形态学分割及其在机器翻译中的应用(Riesa&Yarowsky,AMTA 2006)
复制引文:
PDF格式:
https://aclantology.org/2006.amta-papers.21.pdf