国际标准协会 存档 2006年Interspeech
国际标准协会 存档 2006年Interspeech

为有限资源的口语构建英语-阿拉伯语机器翻译系统

杰森·里萨(Jason Riesa)、贝兰·莫希特(Behrang Mohit)、凯文·奈特(Kevin Knight)、丹尼尔·马库(Daniel Marcu)

本文介绍了一个使用有限资源的英语-阿拉伯语语音统计机器翻译系统。在这篇文章中,我们探讨了所涉及的限制因素,以及我们如何努力缓解非标准拼写和高度屈折语法等问题,并讨论了如何利用现代标准阿拉伯语现有的丰富资源来帮助完成这项任务。与使用相同的口语平行训练语料库的先前最先进的系统相比,这些组合技术在翻译时使未知单词减少了40%以上,BLEU得分增加了+3.65。


doi:10.21437/Interspeech.2006-261

引自:Riesa,J.、Mohit,B.、Knight,K.、Marcu,D.(2006),为资源有限的口语构建英语-阿拉伯语机器翻译系统。程序。Interspeech 2006,论文2012-Tue1A1O.1,doi:10.21437/Interspeech.2006-261

@正在处理{riesa06_interspeech,author={贾森·里萨(Jason Riesa)、贝兰·莫希特(Behrang Mohit)、凯文·奈特(Kevin Knight)和丹尼尔·马尔库(Daniel Marcu}),title={{为资源有限的口语构建英语-阿拉伯语机器翻译系统}},年份=2006,booktitle={Proc.Interspeech 2006},pages={论文2012-Tue1A1O.1},doi={10.21437/Interspeech.2006-261},issn={2308-457X}}