词汇语义识别

尼尔森·F·刘,丹尼尔·赫什科维奇,迈克尔·克兰兹林,内森·施耐德


摘要
在词汇语义学中,各种现象的完整句子切分和段标记通常被分开处理,尽管它们是相互依存的。我们假设,统一的词汇语义识别任务是封装以前不同风格注释的有效方法,包括多词表达式识别/分类和超义标记。使用STREUSLE语料库,我们训练了一个神经CRF序列标记器,并评估了它在各个注释轴上的性能。由于标签集概括了以前的任务(PARSEME、DiMSUM),我们还评估了模型对这些测试集的概括程度,发现尽管只对STREUSLE进行了培训,但它接近或超过了现有模型。我们的工作还为词汇语义的集成和准确建模建立了基线模型和评估指标,为这一领域的未来工作提供了便利。
选集ID:
2021年mwe-1.6
体积:
第17届多词表达研讨会会议记录(MWE 2021)
月份:
八月
年份:
2021
地址:
在线
编辑:
保罗·库克,杰琳娜·米特罗维奇,卡拉·帕拉·埃斯卡廷,阿什维尼·维迪娅,佩蒂亚·奥塞诺娃,湿婆·塔斯利米波,卡洛斯·拉米施
地点:
MWE公司
SIG公司:
SIGLEX公司
出版商:
计算语言学协会
注:
页:
49–56
语言:
网址:
https://aclantology.org/2021.mwe-1.6
内政部:
10.18653/v1/2021.mwe-1.6
比比键:
引用(ACL):
Nelson F.Liu、Daniel Hershcovich、Michael Kranzlein和Nathan Schneider。2021词汇语义识别.英寸第17届多词表达研讨会会议记录(MWE 2021),第49-56页,在线。计算语言学协会。
引用(非正式):
词汇语义识别(Liu等人,MWE 2021)
复制引文:
PDF格式:
https://aclantology.org/2021.mwe-1.6.pdf
可选补充材料:
2021.mwe-1.6可选补充材料.zip
代码
nert-nlp/streusle公司+附加社区代码
数据
STRUSLE公司