基于递归消去的共聚类算法在大文本语料库动词同义词提取中的应用

高崎光一
高桥秀吉

出版物
信息和系统的IEICE交易  第卷。E92-D型  不。12   第页。2334-2340
出版日期:2009/12/01
在线ISSN:1745-1361
内政部:10.1587/传输。图92.D.2334
打印ISSN:0916-8532
手稿类型:专题论文(自然语言处理及其应用专题)
类别:语言知识习得
关键词:
动词同义词,  联合群集,  多义,  递归消去,  

全文:PDF格式(272.2KB)>>
购买此文章



总结:
动词同义词的提取是构建动词词典作为语言资源的关键技术。本文提出了一种基于联合聚类的动词同义词提取方法,该方法增加了从大型文本语料库中提取多义动词意义的数量。对于动词同义词的提取,使用聚类方法处理多义动词可能是一个问题,因为每个多义动词应根据每个含义分类为不同的簇;因此,很可能无法提取多义动词的某些含义。我们提出的方法可以通过递归地消除从初始数据集中提取的簇来提取多义动词的不同含义。动词同义词提取的实验结果表明,与之前的方法相比,该方法将正确的动词簇增加了约50%,准确率提高了0.9%,召回率提高了1.5%。


开放存取发布