@正在进行{zeng-zubiaga-2023-active,title=“活动{PET}s:活动数据注释优先级,用于通过模式开发培训进行少量快速索赔验证”,author=“曾、夏和阿凯茨·祖比亚加”,editor=“弗拉乔斯、安德烈亚斯和伊莎贝尔·奥根斯坦“,booktitle=“计算语言学协会的发现:EACL 2023”,月=5月,年=“2023”,address=“克罗地亚杜布罗夫尼克”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.findings-eacl.14”,doi=“10.18653/v1/2023.findings-eacl.14”,pages=“190--204”,抽象=“为了减轻标记数据的稀缺性对事实检查系统的影响,我们将重点放在少快照声明验证上。尽管最近通过提出高级语言模型对少快照分类进行了研究,但在数据注释优先级方面缺乏研究,而数据注释优先级可以改进标记的少快照的选择,以实现最佳mod。”el性能。我们提出了主动PET,这是一种新的加权方法,利用基于各种语言模型的模式挖掘训练(PET)模型集合,主动选择未标记的数据作为注释的候选者。在两个技术事实检验数据集和使用六个不同的预处理语言模型上,使用主动PET进行少量快照数据选择显示出与基线方法相比的持续改进。我们展示了主动PETs-o的进一步改进,它进一步集成了过采样策略。我们的方法能够有效地选择未标记数据丰富但用于标记的资源有限的要标记的实例,从而持续改进少量索赔的验证性能。我们的代码可用。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“zeng-zubiaga-2023-active”><标题信息><title>主动PET:通过模式开发培训对少量快照索赔进行主动数据注释优先级验证</titleInfo><name type=“personal”>夏<namePart type=“given”>曾庆红<角色>作者</角色></name><name type=“personal”>Arkaitz公司祖比亚加<角色>作者</角色></name><originInfo>发布日期:2023-05发布日期:</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>计算语言学协会的发现:EACL 2023</titleInfo><name type=“personal”>安德烈亚斯Vlachos公司<角色>编辑器</角色></name><name type=“personal”>伊莎贝尔奥根斯坦<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>克罗地亚杜布罗夫尼克</place></originInfo>会议出版物</relatedItem><abstract>为了减轻标记数据的稀缺性对事实检查系统的影响,我们将重点放在少量索赔验证上。尽管最近通过提出高级语言模型对少数镜头进行了分类,但在数据注释优先级方面缺乏研究,数据注释优先级可以改进标记的少数镜头的选择,以获得最佳模型性能。我们提出了主动PET,这是一种新的加权方法,利用基于各种语言模型的模式开发训练(PET)模型集成,主动选择未标记数据作为注释的候选数据。在两个技术事实检验数据集和使用六个不同的预处理语言模型上,使用主动PET进行少量快照数据选择显示出与基线方法相比的持续改进。我们展示了主动PETs-o的进一步改进,它进一步集成了过采样策略。我们的方法能够有效地选择要标记的实例,其中未标记的数据丰富,但用于标记的资源有限,从而持续提高少枪索赔验证性能。我们的代码可用</摘要>曾祖比亚-2023-active10.18653/v1/2023.findings-eacl.14<位置><网址>https://aclantology.org/2023.findings-eacl.14</url></位置><部分>2023-05年<扩展单元=“page”><开始>190</开始><结束>204</范围></部分></mods></modsCollection>
%0会议记录%T主动PET:利用模式开发训练对少量快照索赔进行主动数据注释优先级验证%阿曾、夏%阿卡伊茨,祖比亚加%安德烈亚斯·瓦拉科斯%伊莎贝尔·Y·奥根斯坦%计算语言学协会的研究结果:EACL 2023%D 2023年%5月8日%计算语言学协会%C杜布罗夫尼克,克罗地亚%F增-祖比亚加-2023-活性%X为了减轻标签数据稀缺对事实检查系统的影响,我们专注于少量索赔验证。尽管最近通过提出高级语言模型对少数镜头进行了分类,但在数据注释优先级方面缺乏研究,数据注释优先级可以改进标记的少数镜头的选择,以获得最佳模型性能。我们提出了主动PET,这是一种新的加权方法,利用基于各种语言模型的模式开发训练(PET)模型集成,主动选择未标记数据作为注释的候选数据。在两个技术事实检验数据集和使用六个不同的预处理语言模型上,使用主动PET进行少量快照数据选择显示出与基线方法相比的持续改进。我们展示了主动PETs-o的进一步改进,它进一步集成了过采样策略。我们的方法能够有效地选择未标记数据丰富但用于标记的资源有限的要标记的实例,从而持续改进少量索赔的验证性能。我们的代码可用。%R 10.18653/v1/2023.结果-每项14%U型https://aclantology.org/2023.findings-eacl.14%U型https://doi.org/10.18653/v1/2023.findings-eacl.14%电话:190-204
降价(非正式)
[活动PET:通过模式开发培训进行少量快照索赔验证的活动数据注释优先级](https://aclantology.org/2023.findings-eacl.14)(曾和祖比亚加,2023年调查结果)
国际计算语言学协会