低资源语法纠错的噪声信道

西蒙·弗拉赫斯,奥菲莉·拉克鲁瓦,安德斯·索加德


摘要
本文描述了我们对BEA 2019语法错误纠正(GEC)共享任务低资源跟踪的贡献。我们的GEC方法基于噪声信道理论,将信道模型和语言模型相结合。我们从维基百科编辑历史中生成混淆集,并使用编辑频率来估计频道模型。此外,我们使用了两个预先训练的语言模型:1)谷歌的BERT模型,我们针对特定的错误类型进行了微调;2)OpenAI的GPT-2模型,利用它可以将前面的句子作为上下文进行操作。此外,我们使用波束搜索搜索最佳校正组合。
选集ID:
W19-4420号
体积:
第十四次NLP创新应用于构建教育应用研讨会论文集
月份:
八月
年份:
2019
地址:
意大利佛罗伦萨
编辑:
海伦·扬纳库达基斯,叶卡捷琳娜·科奇马尔,克劳迪娅·利科克,尼丁·马德纳尼,伊尔迪科·皮兰,托尔斯滕·泽施
地点:
东亚银行
SIG公司:
西格杜
出版商:
计算语言学协会
注:
页:
191–196
语言:
网址:
https://aclantology.org/W19-4420
内政部:
10.18653/v1/W19-4420
比比键:
引用(ACL):
西蒙·弗拉赫斯(Simon Flachs)、奥佩利·拉克鲁瓦(Ophélie Lacroix)和安德斯·索加德(Anders Sögaard)。2019低资源语法纠错的噪声信道.英寸创新使用NLP构建教育应用程序第十四次研讨会会议记录,第191-196页,意大利佛罗伦萨。计算语言学协会。
引用(非正式):
低资源语法纠错的噪声信道(Flachs等人,BEA 2019)
复制引文:
PDF格式:
https://aclantology.org/W19-4420.pdf