安娜·科霍宁 自动词汇分类:衔接研究和实践。 (英语) Zbl 1202.68350号 菲洛斯。事务处理。英国皇家学会。,序列号。A、 数学。物理学。工程科学。 368,编号1924,3621-3632(2010). 摘要:自然语言处理(NLP)——计算机对人类语言的自动分析、理解和生成,在很大程度上取决于对单词的准确了解。由于单词会在文本类型、领域和子语言之间改变其行为,因此无法获得完全准确的静态词汇资源(例如字典、单词分类)。研究人员目前正在开发可用于从文本数据自动获取或更新词汇资源的技术。如果成功,自动方法可以大大提高语言技术的准确性和可移植性,例如机器翻译、文本挖掘和摘要。本文综述了词汇自动习得的最新研究进展。本文以词汇分类为重点,讨论了在该方法大规模造福NLP之前仍需面对的许多挑战。 MSC公司: 68吨10 模式识别、语音识别 91层20 语言学 68页99 数据理论 关键词:自然语言处理;自动词汇习得;词汇分类 PDF格式BibTeX公司 XML格式引用 \textit{A.Korhonen},菲洛斯。事务处理。英国皇家学会。,序列号。A、 数学。物理学。工程科学。368,编号1924,3621--3632(2010;Zbl 1202.68350) 全文: 内政部 参考文献: [1] NAT LANG ENG 14第337页–(2008年) [2] LANG RES EVAL 42第21页–(2008年) [3] 计算机语言34第145页–(2008) [4] 计算机语言27第373页–(2001) [5] COMMUN公司。ACM 38(11)第39页–(1995) [6] INT J CORPUS LINGUIST 2第65页–(1997)·数字对象标识代码:10.1075/ijcl.2.1.05ois [7] 计算机语言32第159页–(2006) [8] 计算机语言19 pp 365–(2005)·doi:10.1016/j.csl.2005.05.001 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。