标题 |
BUCEADOR,数字图书馆的多语言搜索引擎 |
作者 |
乔迪·阿德尔,安东尼奥·博纳方特,安东尼奥·卡德纳尔,Marta R.Costa-Jussá,何塞·A·R·福诺洛萨,亚松森·莫雷诺,伊娃·纳瓦斯和爱德华多·班加 |
摘要 |
本文介绍了在Buceador(www.Buceador.org)研究项目中构建的基于web的多媒体搜索引擎。实施了一个概念验证工具,能够从由西班牙四种官方语言(西班牙语、巴斯克语、加泰罗尼亚语和加利西亚语)的多媒体文档构成的数字图书馆中检索信息。检索到的文档在翻译和配音后以用户语言呈现(之前的四种语言+英语)。本文介绍了该工具的功能、体系结构、数字图书馆,并提供了有关自动语音识别、统计机器翻译、文本到语音合成和信息检索领域所涉及的技术的一些信息。每种技术都已根据所示工具的目的进行了调整,并与其他相关技术进行了交互。 |
话题 |
工具、系统、应用程序,多媒体文档处理,计算机处理 |
完整的纸张 |
BUCEADOR,数字图书馆的多语言搜索引擎 |
Biptex公司 |
@诉讼中{ADELL12.828, 作者={Jordi Adell和Antonio Bonafonte以及Antonio Cardenal和Marta R.Costa-Jussá以及JoséA.R.Fonollosa和Asunción Moreno以及Eva Navas和Eduardo R.Banga}, title={BUCEADOR,数字图书馆的多语言搜索引擎}, booktitle={第八届国际语言资源与评价会议(LREC'12)会议记录}, 年份={2012}, 月={may}, 日期={23-25}, address={土耳其伊斯坦布尔}, editor={尼科莱塔·卡尔佐拉里(会议主席)、哈立德·乔克里(Khalid Choukri)、蒂埃里·德克勒克(Thierry Declerck)、梅赫迈特·乌尔·多安(Mehmet Uur Doan)、本特·马加德(Bente Maegaard)、约瑟夫·马里亚尼(Joseph Mariani)、亚松森·莫, publisher={欧洲语言资源协会(ELRA)}, isbn={978-2-9517408-7-7}, 语言={英语} } |