×

用于机器翻译的L&H词典编纂工具包。 (英语) 兹比尔1044.68923

White,John S.(编辑),《展望未来信息时代的机器翻译》。美洲机器翻译协会第四届会议,AMTA 2000,墨西哥库埃纳瓦卡,2000年10月10日至14日。诉讼程序。柏林:施普林格出版社(ISBN 3-540-41117-8)。莱克特。注释计算。科学。1934, 213-218 (2000).
摘要:翻译词典是任何机器翻译系统中最重要的组成部分之一。词典的大小和质量,以及特定用途的词典覆盖范围,极大地影响了机器翻译对用户的适用性。词典开发的高成本限制了即使是成熟的机器翻译供应商也可以扩展和专门化其词典的程度,并经常阻止用户构建大量词典。为了解决机器翻译词典编纂的高成本问题,L&H正在构建一个词典编纂工具包,其中包括可以显著改进创建自定义词典过程的工具。该工具包基于使用自动数据采集方法、使用文本语料库生成词典条目的概念。当然,词典条目必须准确,因此工具箱的工作必须由人类专家在几个阶段进行检查。然而,这种检查主要包括删除错误结果,而不是添加数据和整个条目。本文将探讨如何使用Lexicography Toolkit创建特定于用户域的词典。
关于整个系列,请参见[Zbl 0998.68626号].

MSC公司:

68单位99 计算方法和应用
68T50型 自然语言处理
PDF格式BibTeX公司 XML格式引用
全文: 链接