Identification of Ambiguous Multiword Expressions Using Sequence Models and Lexical Resources

基于序列模型和词汇资源的歧义多词表达识别

我们提出了一种简单有效的标记器，能够识别法语文本中高度模糊的多词表达式（MWE）。它基于条件随机场（CRF），使用局部上下文信息作为特征。我们表明，在某些情况下，这种方法可以获得更复杂的基于解析器的MWE识别方法，而不需要树库中的语法树。此外，我们还研究了CRF对来自词典的外部信息的考虑程度。

选集ID：: 第17页至第1723页
体积：: 第十三届多词表达研讨会会议记录（MWE 2017）
月份：: 四月
年份：: 2017
地址：: 西班牙巴伦西亚
编辑：: 斯特拉·马克安托纳图,卡洛斯·拉米施,阿加塔·萨瓦里,维罗妮卡·文泽
地点：: MWE公司
SIG公司：: SIGLEX公司
出版商：: 计算语言学协会
注：
页：: 167–175
语言：
网址：: https://aclantology.org/W17-1723
内政部：: 10.18653/v1/W17-1723
比比键：
引用（ACL）：: 马诺·肖利维特和卡洛斯·拉米施。2017基于序列模型和词汇资源的歧义多词表达识别.英寸第十三届多词表达研讨会会议记录（MWE 2017），第167-175页，西班牙巴伦西亚。计算语言学协会。
引用（非正式）：: 基于序列模型和词汇资源的歧义多词表达识别（Scholivet&Ramisch，MWE 2017）
复制引文：
PDF格式：: https://aclcollectory.org/W17-1723.pdf