@正在进行中{普兰-贝恩-维西-埃塔尔-2021-release,title=“释放{GPT}-2事件检测能力”,author=“Pouran Ben Veyseh、Amir和黎、越南和德农考特、弗兰克和Nguyen,Thien Huu“,editor=“宗、成清和夏、费和Li、Wenjie和罗伯托·纳维利“,booktitle=“计算语言学协会第59届年会暨第11届国际自然语言处理联合会议论文集(第1卷:长篇论文)”,月=八月,年份=“2021”,address=“在线”,publisher=“计算语言学协会”,url=“https://aclantology.org/2021.acl-long.490”,doi=“10.18653/v1/2021.acl-long.490”,pages=“6271--6282”,abstract=“事件检测(ED)旨在识别事件的提及(即事件触发器)以及它们在文本中的类型。最近,提出了多个不同领域的ED数据集。然而,这些资源的主要局限性是缺乏足够的针对单个事件类型的训练数据,这阻碍了对缺乏数据的深度学习模型的有效训练。为了克服这个问题,我们建议利用强大的预训练语言模型GPT-2为ED生成训练样本。为了防止自动生成的数据中不可避免的噪声妨碍训练过程,我们建议开发一种师生结构,在这种结构中,教师应该从原始数据中学习锚定知识。然后,在教师提供的锚定知识的指导下,对学生进行原始数据和GPT生成数据的组合培训。引入了最优传输以促进两个网络之间基于锚的制导。我们在多个ED基准数据集上评估了所提出的模型,获得了一致的改进,并为ED建立了最先进的结果。”,}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“pouran-ben-veyseh-etal-2021-release”><标题信息>释放GPT-2的事件检测能力</titleInfo><name type=“personal”>Amir(阿米尔)波兰·本·韦瑟<角色>作者</角色></name><name type=“personal”>越南赖<角色>作者</角色></name><name type=“personal”>弗兰克德隆考特<角色>作者</角色></name><name type=“personal”>蒂恩<namePart type=“given”>Huu</namePart>简体中文阮<namePart type=“family”>阮</namePart><角色>作者</角色></name><originInfo><发布日期>2021-08</发布日期></originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>计算语言学协会第59届年会和第11届国际自然语言处理联合会议记录(第1卷:长篇论文)</titleInfo><name type=“personal”>成清<namePart type=“given”>宗族<角色>编辑器</角色></name><name type=“personal”>飞夏<namePart type=“family”><角色>编辑器</角色></name><name type=“personal”>文杰<namePart type=“given”>李<namePart type=“family”><角色>编辑器</角色></name><name type=“personal”>罗伯托Navigli导航部件<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>在线</place></originInfo>会议出版物</relatedItem>事件检测(ED)旨在识别文本中提到的事件(即事件触发器)及其类型。最近,提出了多个不同领域的ED数据集。然而,这些资源的主要局限性是缺乏足够的针对单个事件类型的训练数据,这阻碍了对缺乏数据的深度学习模型的有效训练。为了克服这个问题,我们建议利用强大的预训练语言模型GPT-2为ED生成训练样本。为了防止自动生成的数据中不可避免的噪声妨碍训练过程,我们建议开发一种师生架构,在该架构中,教师应该从原始数据中学习锚定知识。然后,在教师提供的锚定知识的指导下,对学生进行原始数据和GPT生成数据的组合培训。引入了最优传输以促进两个网络之间基于锚的制导。我们在多个ED基准数据集上评估了所建议的模型,获得了一致的改进,并为ED建立了最先进的结果。</abstract>普朗-贝恩-维西-埃塔尔-2021-release10.18653/v1/2021.acl-long.490<位置><网址>https://aclantology.org/2021.acl-long.490</url></位置><部分>2021-08年<扩展单元=“page”><开始>6271<end>6282</范围></部分></mods></modsCollection>
%0会议记录%T释放GPT-2电源用于事件检测%阿米尔·A Pouran Ben Veyseh%越南阿来%法兰克,德隆考特%阮天虎%Y Zong、程青%Y Xia、Fei%Y Li、Wenjie%罗伯托·Y·纳维利%计算语言学协会第59届年会和第11届国际自然语言处理联合会议论文集(第1卷:长篇论文)%D 2021年%8月8日%计算语言学协会%C在线%F pouran-ben-veyseh-etal-2021-释放%X事件检测(ED)旨在识别文本中提到的事件(即事件触发器)及其类型。最近,提出了多个不同领域的ED数据集。然而,这些资源的主要限制是缺乏足够的针对单个事件类型的训练数据,这阻碍了对数据渴求的深度学习模型的有效训练。为了克服这个问题,我们建议利用强大的预训练语言模型GPT-2为ED生成训练样本。为了防止自动生成的数据中不可避免的噪声妨碍训练过程,我们建议开发一种师生结构,在这种结构中,教师应该从原始数据中学习锚定知识。然后,在教师提供的锚定知识的指导下,对学生进行原始数据和GPT生成数据的组合培训。引入了最优传输以促进两个网络之间基于锚的制导。我们在多个ED基准数据集上评估了所建议的模型,获得了一致的改进,并为ED建立了最先进的结果。%R 10.18653/v1/2021.acl长490%U型https://aclantology.org/2021.acl-long.490%U型https://doi.org/10.18653/v1/2021.acl-long.490%电话6271-6282
降价(非正式)
[释放GPT-2事件检测能力](https://aclantology.org/2021.acl-long.490)(Pouran Ben Veyseh等人,ACL-IJCNLP 2021)
国际计算语言学协会
- 阿米尔·普兰·本·韦瑟(Amir Pouran Ben Veyseh)、越莱(Viete Lai)、弗兰克·德农科特(Franck Dernoncourt)和蒂恩·胡·阮(Thien Huu Nguyen)。2021释放GPT-2的事件检测能力.英寸计算语言学协会第59届年会和第11届国际自然语言处理联合会议记录(第1卷:长篇论文),第6271–6282页,在线。计算语言学协会。