一种简单而稳健的主从协议错误检测方法

西蒙·弗拉赫斯,奥菲莉·拉克鲁瓦,马雷克·雷,海伦·扬纳库达基斯,安德斯·索加德


摘要
虽然基于规则的主题-动词一致性(SVA)错误检测对句法分析错误、不规则性和主要规则的异常非常敏感,但神经序列标记器有过多训练数据的倾向。我们观察到,基于规则的错误生成对语法分析错误和不规则性的敏感度低于错误检测,并探索了一种简单而有效的方法,以达到两者的最佳效果:我们训练神经序列标记器组合大量银标准数据,通过基于规则的错误生成和金标准数据获得。我们表明,我们的简单协议可以在域内和域外数据以及其他错误和长距离依赖的情况下,更稳健地检测SVA错误;在四个标准基准中,归纳模型平均达到了一个新的水平。
选集ID:
N19-1251号
体积:
计算语言学协会北美分会2019年会议论文集:人类语言技术,第1卷(长短论文)
月份:
六月
年份:
2019
地址:
明尼苏达州明尼阿波利斯
编辑:
吉尔·伯斯坦,克里斯蒂·多兰,塔马尔·索罗里奥
地点:
NAACL公司
SIG公司:
出版商:
计算语言学协会
注:
页:
2418–2427
语言:
网址:
https://aclantology.org/N19-1251
内政部:
10.18653/v1/N19-1251
比比键:
引用(ACL):
西蒙·弗拉赫斯(Simon Flachs)、奥菲利·拉克鲁瓦(Ophélie Lacroix)、马雷克·雷(Marek Rei)、海伦·亚纳库达基斯(Helen Yannakoudakis)和安德斯·索加德(Anders Sögaard)。2019一种简单而稳健的主从协议错误检测方法.英寸计算语言学协会北美分会2019年会议论文集:人类语言技术,第1卷(长短论文),第2418–2427页,明尼苏达州明尼阿波利斯。计算语言学协会。
引用(非正式):
一种简单而稳健的主从协议错误检测方法(Flachs等人,NAACL 2019)
复制引文:
PDF格式:
https://aclantology.org/N19-1251.pdf
数据
燃料电池JFLEG公司宾州树库