基于序列模型和词汇资源的歧义多词表达识别

马农·肖利维特,卡洛斯·拉米施


摘要
我们提出了一种简单有效的标记器,能够识别法语文本中高度模糊的多词表达式(MWE)。它基于条件随机场(CRF),使用局部上下文信息作为特征。我们表明,在某些情况下,这种方法可以获得更复杂的基于解析器的MWE识别方法,而不需要树库中的语法树。此外,我们还研究了CRF对来自词典的外部信息的考虑程度。
选集ID:
第17页至第1723页
体积:
第十三届多词表达研讨会会议记录(MWE 2017)
月份:
四月
年份:
2017
地址:
西班牙巴伦西亚
编辑:
斯特拉·马克安托纳图,卡洛斯·拉米施,阿加塔·萨瓦里,维罗妮卡·文泽
地点:
MWE公司
SIG公司:
SIGLEX公司
出版商:
计算语言学协会
注:
页:
167–175
语言:
网址:
https://aclantology.org/W17-1723
内政部:
10.18653/v1/W17-1723
比比键:
引用(ACL):
马诺·肖利维特和卡洛斯·拉米施。2017基于序列模型和词汇资源的歧义多词表达识别.英寸第十三届多词表达研讨会会议记录(MWE 2017),第167-175页,西班牙巴伦西亚。计算语言学协会。
引用(非正式):
基于序列模型和词汇资源的歧义多词表达识别(Scholivet&Ramisch,MWE 2017)
复制引文:
PDF格式:
https://aclcollectory.org/W17-1723.pdf