神经和FST公司-语法错误纠正的基本方法

郑元,费利克斯·斯塔尔伯格,马雷克雷,比尔·伯恩,海伦·扬纳库达基斯


摘要
在本文中,我们描述了我们提交给BEA 2019的语法错误更正共享任务。我们提出了一个同时使用错误检测和纠正模型的系统管道。输入文本首先由两个互补的神经机器翻译系统进行校正:一个使用卷积网络和多任务学习,另一个使用基于神经变换器的系统。训练是在公开可用的数据上进行的,还有通过反向翻译生成的人工示例。然后将这两个机器翻译系统的n个最佳列表进行组合,并使用有限状态转换器(FST)进行评分。最后,将一个无监督的重新排序系统应用于FST的n-最佳输出。重新排序器使用许多错误检测功能重新排序FST n最佳列表,并确定最终的1最佳校正假设。在共享任务的受限轨迹中,我们的系统在纠错方面达到了66.75%F0.5(排名第四),在标记级错误检测方面达到了82.52%F0.5(位居第二)。
选集ID:
W19-4424号
体积:
创新使用NLP构建教育应用程序第十四次研讨会会议记录
月份:
八月
年份:
2019
地址:
意大利佛罗伦萨
编辑:
海伦·扬纳库达基斯,叶卡捷琳娜·科奇马尔,克劳迪娅·利科克,尼丁·马德纳尼,伊尔迪科·皮兰,托尔斯滕·泽施
地点:
东亚银行
SIG公司:
西格杜
出版商:
计算语言学协会
注:
页:
228–239
语言:
网址:
https://aclantology.org/W19-4424
内政部:
10.18653/v1/W19-4424
比比键:
引用(ACL):
郑源、Felix Stahlberg、Marek Rei、Bill Byrne和Helen Yannakoudakis。2019基于神经和FST的语法错误纠正方法.英寸创新使用NLP构建教育应用程序第十四次研讨会会议记录,第228-239页,意大利佛罗伦萨。计算语言学协会。
引用(非正式):
基于神经和FST的语法错误纠正方法(袁等,BEA 2019)
复制引文:
PDF格式:
https://aclantology.org/W19-4424.pdf
数据
十亿字基准FCE公司十亿字基准