|
对于全文PDF,如果您是IEICE的成员,请登录, 或者,如果您不是IEICE的会员,请转到菜单列表上的按次付费。 |
基于递归消去的共聚类算法在大文本语料库动词同义词提取中的应用
高崎光一 高桥秀吉
出版物
信息和系统的IEICE交易 第卷。E92-D型 不。12
第页。2334-2340 出版日期:2009/12/01 在线ISSN:1745-1361
内政部:10.1587/传输。图92.D.2334 打印ISSN:0916-8532 手稿类型:专题论文(自然语言处理及其应用专题) 类别:语言知识习得 关键词: 动词同义词, 联合群集, 多义, 递归消去,
全文:PDF格式(272.2KB)>>
总结:
动词同义词的提取是构建动词词典作为语言资源的关键技术。本文提出了一种基于联合聚类的动词同义词提取方法,该方法增加了从大型文本语料库中提取多义动词意义的数量。对于动词同义词的提取,使用聚类方法处理多义动词可能是一个问题,因为每个多义动词应根据每个含义分类为不同的簇;因此,很可能无法提取多义动词的某些含义。我们提出的方法可以通过递归地消除从初始数据集中提取的簇来提取多义动词的不同含义。动词同义词提取的实验结果表明,与之前的方法相比,该方法将正确的动词簇增加了约50%,准确率提高了0.9%,召回率提高了1.5%。
|
|
|