洛美:大型本体多语言提取

帕特里克·夏秦广惠悉达斯·瓦西西塔陈云墨陈同飞钱德勒·梅克雷格·哈曼凯尔·罗林斯亚伦·史蒂文·怀特本杰明·范·杜姆


摘要
我们提出了LOME,一个用于执行多语言信息提取的系统。给定文本文档作为输入,我们的核心系统使用FrameNet(Baker et al.,1998)解析器识别文本实体和事件提及的跨度。随后,它执行共引用解析、细粒度实体类型化和事件之间的时间关系预测。通过这样做,系统构建了一个以事件和实体为中心的知识图。我们可以进一步将第三方模块应用于其他类型的注释,如关系提取。我们的(多语言)第一方模块要么表现出色,要么与(单语)最先进的技术相竞争。我们通过使用XLM-R(Conneau等人,2020年)等多语言编码器以及利用多语言培训数据来实现这一点。LOME是Docker Hub上的Docker容器。此外,该系统的轻量级版本可以作为web演示进行访问。
选集ID:
2021.每个演示19
体积:
计算语言学协会欧洲分会第16届会议记录:系统演示
月份:
四月
年份:
2021
地址:
在线的
编辑:
迪米特拉·格卡齐亚杰梅·塞达
地点:
出口许可证
SIG公司:
出版商:
计算语言学协会
注:
页码:
149–159
语言:
网址:
https://aclantology.org/2021.eacl-demos.19
内政部:
10.18653/v1/2021.eacl-demos.19
比比键:
引用(ACL):
Patrick Xia、Guanghui Qin、Siddharth Vashishtha、Yunmo Chen、Tongfei Chen、Chandler May、Craig Harman、Kyle Rawlins、Aaron Steven White和Benjamin Van Durme。2021LOME:大型本体多语言抽取.英寸计算语言学协会欧洲分会第16届会议记录:系统演示,第149-159页,在线。计算语言学协会。
引用(非正式):
LOME:大型本体多语言抽取(Xia等人,EACL 2021)
复制引文:
PDF格式:
https://aclantology.org/2021.eacl-demos.19.pdf
数据
菲格框架网OntoNotes 5.0