×

在跨语言信息检索中嵌入基于web的统计翻译模型。 (英语) Zbl 1234.68416号

摘要:尽管机器翻译(MT)服务涵盖了越来越多的语言对,但仍有许多语言对缺乏翻译资源。跨语言信息检索(CLIR)是一种需要相对较低复杂度的翻译功能的应用程序,因为当前的信息检索(IR)模型仍然基于一组单词。Web为自动构建可用于自动训练统计翻译模型的并行语料库提供了大量资源。由此产生的翻译模型可以以多种方式嵌入到检索模型中。在本文中,我们将研究从Web自动挖掘并行文本的问题,以及在检索过程中集成翻译模型的不同方法。我们在CLIR标准测试集上的实验表明,基于Web的翻译模型可以在CLIR任务中超越商业机器翻译系统。这些结果为以非常低的成本构建CLIR的全自动查询翻译设备开辟了前景。

MSC公司:

68T50型 自然语言处理
68英里11 互联网主题
68T05年 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Baum L.E.,不等式3,第1页–(1972)
[2] 布罗格利奥·约翰(Broglio John),国家标准与技术研究所特别出版物500-236,马里兰州盖瑟斯堡,第29页–(1995)
[3] Brown Peter F,计算语言学16(2)pp 79–(1990)
[4] Harman Donna K,国家标准与技术研究所特别出版物pp 500–(1995)
[5] DOI:10.1002/(SICI)1097-4571(199601)47:1<70::AID-ASI7>3.0.CO;2-# ·doi:10.1002/(SICI)1097-4571(199601)47:1<70::AID-ASI7>3.0.CO;2-#
[6] Jansen Bernard J,《美国信息科学与技术学会杂志》53(3)pp 226–(2001)
[7] DOI:10.1075/目标4.1.03laf·doi:10.1075/target.4.1.03laf
[8] 聂建云,《美国信息科学与技术学会杂志》54(4)pp 340–(2002)
[9] 内政部:10.1108/eb046814·doi:10.1108/eb046814
[10] Tague-Sutcliffe Jean,国家标准与技术研究所特别出版物500-236,马里兰州盖瑟斯堡,第385页–(1995)
[11] DOI:10.1016/S0004-3702(98)00063-0·Zbl 0910.68068号 ·doi:10.1016/S0004-3702(98)00063-0
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。