论文摘要

标题 Tézaurs.lv:拉脱维亚最大的开放词汇数据库
作者 安德烈·斯佩克托斯,伊尔兹·奥齐,罗伯特·达尔是,规范Gróztis,佩特里斯·佩肯斯,劳马·普雷特卡尼,劳拉·里图玛拜巴·索利特
摘要 我们为拉脱维亚语描述了一种广泛而通用的词汇资源,拉脱维亚语是一种资源不足的印欧语言,我们称之为Tezaurs(拉脱维亚语中“词库”的意思)。它由一个大型解释性词典组成,其中包含来自280多个外部来源的250000多个词条。词典丰富了语音、形态、语义和其他注释,并通过各种语言处理工具进行了扩充,允许生成屈折形式和发音、即时选择语料库示例、建议同义词等。Tezaurs可作为最终用户的公共和广泛使用的web应用程序,作为语言技术(LT)中使用的开放数据集,以及作为API(用于集成到第三方应用程序的一组web服务)。Tezaurs的最终目标是成为拉脱维亚语的中心计算词典,将所有拉脱维亚单词和常用的多单词单位结合在一起,并允许集成其他LT资源和工具。
话题 词汇,词汇数据库,形态学,Web服务
全文 Tāzaurs.lv:拉脱维亚最大的开放式词汇数据库
Biptex公司 @会议记录{SPEKTORS16.1095,
author={Andrejs Spektors、Ilze Auziņa、Roberts Darģis、Normunds Grázétis、Péteris Paikens、Lauma Pretkalni೅a和Laura Rituma、Baiba Sauléte},
title={Tízaurs.lv:拉脱维亚最大的开放词汇数据库},
booktitle={第十届国际语言资源与评价会议(LREC 2016)会议记录},
年份={2016年},
月={may},
日期={23-28},
地点={斯洛文尼亚波托罗日},
editor={尼科莱塔·卡尔佐拉里(会议主席)、哈立德·乔克里(Khalid Choukri)、蒂埃里·德克莱克(Thierry Declerck)、萨拉·戈吉(Sara Goggi)、马克·格罗贝尔尼克(Marko Grobelnik)、本特·马加德(Bente Maegaard)、约瑟夫·马里亚尼(Joseph Mariani)、海伦·马佐(Helene Mazo)、亚松,
publisher={欧洲语言资源协会(ELRA)},
address={法国巴黎},
isbn={978-2-9517408-9-1},
语言={英语}
 }
技术支持ELDA公司©2016 ELDA/ELRA版权所有