@进行中{zhang-etal-2023-继续命名,title=“无灾难性遗忘的连续命名实体识别”,author=“张、都镇和聪、伟和董家华和Yu、Yahan和陈秀仪张永刚和方、珍“,editor=“Bouamor、Houda和皮诺、胡安和巴厘岛,卡利卡”,booktitle=“2023年自然语言处理实证方法会议记录”,月=12月,年=“2023”,address=“新加坡”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.emnlp-main.509”,doi=“10.18653/v1/2023.emnlp-main.509”,pages=“8186--8197”,abstract=“连续命名实体识别(CNER)是一个新兴领域,它涉及通过顺序合并新实体类型来更新现有模型。然而,持续学习方法经常受到灾难性遗忘的严重影响。这一问题在CNER中更加严重,因为在每个步骤中,旧的实体类型从前面的步骤合并为非实体类型,导致了所谓的非实体类型的语义转移问题。在本文中,我们引入了一种混合特征提取损失,它巧妙地在保留旧实体类型的知识和获取新实体类型之间进行权衡,从而更有效地缓解灾难性遗忘的问题。此外,我们为非实体类型开发了一个基于信任的伪标记,即使用旧模型预测实体类型以处理非实体类型的语义转移。根据伪标记过程,我们提出了一种自适应重加权类型平衡学习策略,以处理有偏类型分布问题。我们使用三个不同的数据集对十个CNER设置进行了综合实验。结果表明,我们的方法明显优于先前的最新方法,在Micro和Macro F1分数方面分别平均提高了6.3{\%}和8.0{\%{。",}
<?xml版本=“1.0”编码=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“zhang-etal-2023-continual-named”><标题信息>无灾难性遗忘的连续命名实体识别</titleInfo><name type=“personal”><namePart type=“given”>都镇<namePart type=“family”>张<角色><roleTerm authority=“marcorrator”type=“text”>作者</roleTerm></角色></name><name type=“personal”>魏<namePart type=“given”>Cong公司<角色><roleTerm authority=“marcorrator”type=“text”>作者</roleTerm></角色></name><name type=“personal”>嘉华侗族<角色><roleTerm authority=“marcorrator”type=“text”>作者</roleTerm></角色></name><name type=“personal”>雅韩<namePart type=“family”>余</namePart><角色><roleTerm authority=“marcorrator”type=“text”>作者</roleTerm></角色></name><name type=“personal”>修仪<namePart type=“given”><namePart type=“family”>陈</namePart><角色><roleTerm authority=“marcorrator”type=“text”>作者</roleTerm></角色></name><name type=“personal”>永刚<namePart type=“given”><namePart type=“family”>张<角色><roleTerm authority=“marcorrator”type=“text”>作者</roleTerm></角色></name><name type=“personal”>珍<namePart type=“family”>方</namePart><角色><roleTerm authority=“marcorrator”type=“text”>作者</roleTerm></角色></name><originInfo>2023-12年发布</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>2023年自然语言处理实证方法会议记录</titleInfo><name type=“personal”>侯达布阿莫尔<角色><roleTerm authority=“marcorrator”type=“text”>编辑器</roleTerm></角色></name><name type=“personal”>胡安皮诺<角色><roleTerm authority=“marcorrator”type=“text”>编辑器</roleTerm></角色></name><name type=“personal”>卡利卡语<namePart type=“family”>巴厘岛</namePart><角色><roleTerm authority=“marcorrator”type=“text”>编辑器</roleTerm></角色></name><originInfo>计算语言学协会<位置>新加坡</place></originInfo>会议出版物</relatedItem>连续命名实体识别(CNER)是一个新兴领域,它涉及通过顺序合并新实体类型来更新现有模型。然而,持续学习方法经常受到灾难性遗忘的严重影响。这一问题在CNER中更加严重,因为在每个步骤中,旧的实体类型从前面的步骤合并为非实体类型,导致了所谓的非实体类型的语义转移问题。在本文中,我们引入了一种合并的特征提取损失,它巧妙地在保留旧实体类型的知识和获取新实体类型的信息之间进行权衡,从而更有效地缓解了灾难性遗忘的问题。此外,我们为非实体类型开发了一个基于信任的伪标记,即使用旧模型预测实体类型以处理非实体类型的语义转移。根据伪标记过程,我们提出了一种自适应重加权类型平衡学习策略,以处理有偏类型分布问题。我们使用三个不同的数据集对十个CNER设置进行了综合实验。结果表明,我们的方法明显优于先前最先进的方法,在Micro和Macro F1分数方面分别取得了6.3%和8.0%的平均进步</摘要><identifier type=“citekey”>zhang-etal-2023-continual-named张艺谋10.18653/v1/2023.emnlp-main.509<位置><网址>https://aclantology.org/2023.emnlp-main.509</url></位置><部分>2023-12年<扩展单元=“page”><开始>8186</开始><end>8197</范围></部分></模块></modsCollection>
%0会议记录%无灾难性遗忘的连续命名实体识别%A Zhang,都镇%阿聪,魏%阿东,嘉华%亚汉·阿玉%A Chen,秀仪%A Zhang,永刚%阿芳、珍%Y Bouamor,Houda公司%胡安·皮诺%Y巴厘岛,卡利卡%2023年自然语言处理实证方法会议论文集%D 2023年%12月8日%计算语言学协会%C新加坡%F zhang-etal-2023-续名%X连续命名实体识别(CNER)是一个新兴领域,它涉及通过顺序合并新实体类型来更新现有模型。然而,持续学习方法经常受到灾难性遗忘的严重影响。这一问题在CNER中更加严重,因为在每个步骤中,旧的实体类型从前面的步骤合并为非实体类型,导致了所谓的非实体类型的语义转移问题。在本文中,我们引入了一种合并的特征提取损失,它巧妙地在保留旧实体类型的知识和获取新实体类型的信息之间进行权衡,从而更有效地缓解了灾难性遗忘的问题。此外,我们为非实体类型开发了一个基于信任的伪标记,即使用旧模型预测实体类型以处理非实体类型的语义转移。根据伪标记过程,我们提出了一种自适应重加权类型平衡学习策略,以处理有偏类型分布问题。我们使用三个不同的数据集对十个CNER设置进行了综合实验。结果表明,我们的方法显著优于先前最先进的方法,微观和宏观F1得分分别平均提高了6.3%和8.0%。%R10.18653/v1/2023.emnlp-main.509%U型https://aclantology.org/2023.emnlp-main.509%U型https://doi.org/10.18653/v1/2023.emnlp-main.509%电话:8186-8197
降价(非正式)
[无灾难性遗忘的连续命名实体识别](https://aclantology.org/2023.emnlp-main.509)(Zhang等人,EMNLP 2023)
国际计算语言学协会
- 张都珍、魏聪、董家华、于亚翰、陈秀仪、张永刚和郑芳。2023无灾难性遗忘的连续命名实体识别.英寸2023年自然语言处理实证方法会议记录,第8186–8197页,新加坡。计算语言学协会。