Unleash GPT-2 Power for Event Detection

Amir Pouran Ben Veyseh; Viet Lai; Franck Dernoncourt; Thien Huu Nguyen

doi:10.18653/v1/2021.acl-long.490

发泄GPT公司-2事件检测电源

阿米尔·普兰·本·韦瑟,越南莱,弗兰克·德农考特,Thien Huu Nguyen先生

摘要

事件检测（ED）旨在识别文本中提到的事件（即事件触发器）及其类型。最近，提出了多个不同领域的ED数据集。然而，这些资源的主要局限性是缺乏足够的针对单个事件类型的训练数据，这阻碍了对缺乏数据的深度学习模型的有效训练。为了克服这个问题，我们建议利用强大的预训练语言模型GPT-2为ED生成训练样本。为了防止自动生成的数据中不可避免的噪声妨碍训练过程，我们建议开发一种师生结构，在这种结构中，教师应该从原始数据中学习锚定知识。然后，在教师提供的锚定知识的指导下，对学生进行原始数据和GPT生成数据的组合培训。引入了最优传输以促进两个网络之间基于锚的制导。我们在多个ED基准数据集上评估了所建议的模型，获得了一致的改进，并为ED建立了最先进的结果。

选集ID:: 2021.acl长490
体积：: 计算语言学协会第59届年会和第11届国际自然语言处理联合会议记录（第1卷：长篇论文）
月份：: 八月
年份：: 2021
地址：: 在线的
编辑：: 宗成庆,费霞,李文杰,罗伯托·纳维利
场馆：: 国际计算语言学协会|国际JCNLP
SIG公司：
出版商：: 计算语言学协会
注：
页：: 6271–6282
语言：
网址：: https://aclantology.org/2021.acl-long.490
内政部：: 10.18653/v1/2021.acl长490
双钥匙：
引用（ACL）：: 阿米尔·普兰·本·韦瑟（Amir Pouran Ben Veyseh）、越莱（Viete Lai）、弗兰克·德农科特（Franck Dernoncourt）和蒂恩·胡·阮（Thien Huu Nguyen）。2021释放GPT-2的事件检测能力.英寸计算语言学协会第59届年会和第11届国际自然语言处理联合会议记录（第1卷：长篇论文），第6271–6282页，在线。计算语言学协会。
引用（非正式）：: 释放GPT-2的事件检测能力（Pouran Ben Veyseh等人，ACL-IJCNLP 2021）
复制引文：
PDF格式：: https://aclcollectory.org/2021.acl-long.490.pdf
视频：: https://aclantology.org/2021.acl-long.490mp4

PDF格式引用搜索视频