总结:第P11-WME课时

 

标题 构建斯洛文尼亚文字网
作者 T.Erjavec、T.Fi er
摘要 WordNet是一个词汇数据库,其中名词、动词、形容词和副词按概念层次结构进行组织,从语义和词汇上链接相关概念。这些语义词典已经成为NLP广泛研究和应用的最有价值的资源之一,例如语义标注、自动词义消歧、信息检索和文档总结。继普林斯顿大学为英语开发的WordNet设计之后,在过去十年中开发了许多其他语言的WordNetwork,将这一理念纳入了多语言处理领域。本文报告了SloveneWordNet原型,该原型目前包含约5000个顶级概念。在双语词典的帮助下,该资源已从塞尔维亚语WordNet自动翻译出来,根据语料库出现的频率对同义词进行排序,并手动更正结果。本文介绍了所获得的结果,讨论了在此过程中遇到的一些问题,并指出了未来自动获取和细化同义词集的一些可能性。
关键词 语义词典、WordNet、斯洛文尼亚WordNets、塞尔维亚WordNet
全文 构建斯洛文尼亚文字网