×

编辑后场景中统计机器翻译的在线适应策略。 (英语) Zbl 1242.68274号

摘要:机器翻译最有前途的方法之一是通过模式识别方法来描述问题。通过这样做,有些任务需要在线调整,以使系统适应不断变化的场景。在目前的工作中,我们对四种在线学习算法进行了详尽的比较,并将其与两种自适应策略相结合,用于统计机器翻译中的在线自适应任务。其中两种算法在模式识别界已经很有名了,比如感知器和被动攻击算法,但这里对它们在统计机器翻译任务中的适用性进行了全面分析。此外,我们还将它们与两种新方法进行了比较,即贝叶斯预测自适应和判别岭回归。在统计机器翻译中,最成功的方法是基于后验分布的对数线性近似。根据实验结果,使用判别岭回归或贝叶斯预测自适应调整此模型的对数线性组合的比例因子可以获得最佳性能。

MSC公司:

68吨10 模式识别、语音识别
68T05型 人工智能中的学习和自适应系统
68T50型 自然语言处理
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] H.Christensen,使用最大似然线性回归的隐马尔可夫模型的说话人自适应,博士论文,奥尔堡大学,丹麦,1996年。;H.Christensen,使用最大似然线性回归的隐马尔可夫模型的说话人自适应,博士论文,奥尔堡大学,丹麦,1996年。
[2] C.Callison-Burch等人,《2010年统计机器翻译和机器翻译度量联合研讨会的结果》,载于:SMT和MetricsMATR第五次联合研讨会会议记录,2010年,第17-53页。;C.Callison-Burch等人,《2010年统计机器翻译和机器翻译度量联合研讨会的结果》,载于:SMT和MetricsMATR第五次联合研讨会会议记录,2010年,第17-53页。
[3] A.Blum,机器学习中的在线算法,摘自:在线算法研讨会论文集,Dagstuhl,1996年,第306-325页。;A.Blum,机器学习中的在线算法,摘自:在线算法研讨会论文集,Dagstuhl,1996年,第306-325页。
[4] Zhang,Y。;Scordilis,M.S.,《高斯混合模型的有效在线无监督自适应及其在语音分类中的应用》,《模式识别快报》,29735-744(2008)
[5] 霍,Q。;Lee,C.-H.,基于近似递归贝叶斯估计的连续密度隐马尔可夫模型的在线自适应学习,IEEE语音和音频处理学报,5161-172(1997)
[6] Lee,K.C。;Kriegman,D.,基于视频识别和跟踪的概率外观流形在线学习,(IEEE计算机视觉和模式识别会议论文集(2005)),852-859
[7] Callison-Burch,C。;巴纳德,C。;Schroeder,J.,《通过编辑改进统计翻译》,(第九届EAMT研讨会论文集《拓宽机器翻译及其应用的视野》(2004年),26-32
[8] Barrachina,S.,《计算机辅助翻译的统计方法》,计算语言学,35,3-28(2009)
[9] Koehn,P.,《统计机器翻译》(2010),剑桥大学出版社·Zbl 1202.68446号
[10] Och,F.J。;Ney,H.,统计机器翻译的判别训练和最大熵模型,(计算语言学协会第40届年会论文集(2002)),295-302
[11] Gauvane,J.L。;Lee,C.H.,马尔可夫链多元高斯混合观测值的最大后验估计,IEEE语音和音频处理汇刊,2291-298(1994)
[12] DauméIII,H.,令人沮丧的简单领域适应,(计算语言学协会第45届年会论文集(2007)),256-263
[13] Dempster,A。;莱尔德,N。;Rubin,D.,《通过EM算法从不完整数据中获取最大似然》,《皇家统计学会杂志》,39,1-38(1977)·Zbl 0364.62022号
[14] Ortiz-Martínez,D。;García-Varea一世。;Casacuberta,F.,交互式统计机器翻译的在线学习,(计算语言学协会北美分会年会论文集(2010)),546-554
[15] Rosenblatt,F.,《感知器:大脑中信息存储和组织的概率模型》,《心理学评论》,65386-408(1958)
[16] Crammer,K.,在线被动攻击算法,机器学习研究杂志,7551-585(2006)·Zbl 1222.68177号
[17] G.Reverberi等人,《计算机辅助翻译的在线学习算法》。可交付成果D4.2,SMART:检索和翻译的统计多语言分析,2008年。;G.Reverberi等人,《计算机辅助翻译的在线学习算法》。可交付成果D4.2,SMART:检索和翻译的统计多语言分析,2008年。
[18] Sanchis-Trilles,G。;Casacuberta,F.,统计机器翻译中基于贝叶斯自适应的对数线性权重优化,(计算语言学国际会议论文集(2010)),1077-1085
[19] 梁,P。;布沙尔德·科特,A。;克莱因,D。;Taskar,B.,《机器翻译的端到端区别方法》(计算语言学协会第44届年会(2006年)会议记录),761-768
[20] 渡边,T。;铃木,J。;Tsukada,H。;Isozaki,H.,统计机器翻译的在线大边缘培训,(自然语言处理经验方法会议论文集(2007)),764-773
[21] 蒋,D。;马顿,Y。;Resnik,P.,《句法和结构翻译特征的在线大边缘训练》(自然语言处理经验方法会议论文集(2008)),224-233
[22] Arun,A。;Koehn,P.,基于短语的统计机器翻译辨别训练的在线学习方法,(第十一届机器翻译峰会(2007年)论文集),15-20
[23] Snover,M.,《有针对性的人工注释对翻译编辑率的研究》,(美洲机器翻译协会第七届两年期会议论文集(2006)),223-231
[24] Papineni,K。;Roukos,S。;沃德,T。;朱伟杰,布莱:机器翻译的自动评价方法,(计算语言学协会第40届年会论文集(2002)),311-318
[25] 斯塔弗,C。;Grimson,E.,使用实时跟踪学习活动模式,IEEE模式分析和机器智能汇刊,22747-757(2000)
[26] Martínez-Gómez,P。;Sanchis-Trilles,G。;Casacuberta,F.,统计机器翻译中在线学习的被动攻击,(伊比利亚模式识别和图像分析会议论文集(2011)),240-247
[27] Collins,M.,《隐马尔可夫模型的判别训练方法:感知器算法的理论和实验》(自然语言处理经验方法会议论文集(2002)),1-8
[28] España-Bonet,C。;Márquez,L.,统计机器翻译中特征权重的稳健估计,(欧洲机器翻译协会第十四届年会论文集(2010))
[29] Kung,S。;Taur,J.,具有信号/图像分类应用的基于决策的神经网络,IEEE神经网络汇刊,6170-181(1995)
[30] Brown,R.D.,《驯服野生特征向量上的结构化感知器》(SMT和MetricsMATR(2010)第五届联合研讨会论文集),384-391
[31] Martínez-Gómez,P。;Sanchis-Trilles,G。;Casacuberta,F.,《通过动态重新分类进行计算机辅助翻译的在线学习》,(第十二届计算语言学和智能文本处理国际会议论文集——第二卷(2011年)),93-105
[32] Koehn,P.,《Europarl:统计机器翻译的平行语料库》,(第十届机器翻译峰会(2005年)论文集),79-86
[33] 保罗,M。;费德里科,M。;Stüker,S.,IWSLT 2010评估活动概述,(2010年国际口语翻译研讨会论文集(2011)),3-27
[34] Koehn,P.,Moses:用于统计机器翻译的开源工具包,(ACL演示和海报会议记录(2007)),177-180
[35] 奥奇,F.J。;Ney,H.,《各种统计比对模型的系统比较》,计算语言学,29,19-51(2003)·Zbl 1234.68428号
[36] Koehn,P.,《2005年IWSLT语音翻译评估的爱丁堡系统描述》(《国际口语翻译研讨会论文集》(2005))
[37] Chen,S.F。;Goodman,J.,《语言建模平滑技术的实证研究》,《计算机语音与语言》,4359-393(1999)
[38] Stolcke,A.,SRILM——一种可扩展的语言建模工具包,(第七届国际口语处理会议论文集(2002)),901-904
[39] Och,F.J.,统计机器翻译的最小错误率训练,(计算语言学协会第41届年会论文集(2003)),160-167
[40] Zaidan,O.F.,Z-MERT:一个用于机器翻译系统最小错误率训练的完全可配置的开源工具,《布拉格数学语言学公报》,91,79-88(2009)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。