图上少快照学习的K-hop邻域正则化:文本分类的一个实例研究

尼尔斯·范德海登叶卡捷琳娜·舒托娃海伦·扬纳库达基斯


摘要
我们提出了FewShotTextGCN,这是一种新的方法,旨在有效地利用单词文档图的特性来改进低资源环境中的学习。我们引入了K-hop邻域正则化,这是一个用于异构图的正则化器,并表明当只有少数训练样本可用时,它可以稳定和改进学习。此外,我们还提出了一种简化的图形构造方法,该方法可以使图形的密度降低约7倍,并在低资源设置中产生更好的性能,同时在高资源设置中表现出与当前技术水平相当的性能。最后,我们介绍了一种为文字文档图量身定制的自适应伪标记的新变体。当只使用20个样本进行训练时,我们的表现优于强大的TextGCN基线,在八种语言中平均绝对准确率为17%。我们证明,我们的方法可以应用于文档分类,而无需对各种类型多样的语言进行任何语言模型的预训练,同时与大型预训练的语言模型不相上下。
选集ID:
2023.每条主线85
体积:
计算语言学协会欧洲分会第17届会议记录
月份:
五月
年份:
2023
地址:
克罗地亚杜布罗夫尼克
编辑:
安德烈亚斯·弗拉科斯伊莎贝尔·奥根斯坦
地点:
EACL公司
SIG公司:
出版商:
计算语言学协会
注:
页:
1187–1200
语言:
网址:
https://aclantology.org/2023.eacl-main.85
内政部:
10.18653/v1/2023.eacl-main.85
比比键:
引用(ACL):
尼尔斯·范德海登、叶卡捷琳娜·舒托娃和海伦·扬纳库达基斯。2023图上少快照学习的K-hop邻域正则化:文本分类的一个实例研究.英寸计算语言学协会欧洲分会第17届会议记录第1187-1200页,克罗地亚杜布罗夫尼克。计算语言学协会。
引用(非正式):
图上少快照学习的K-hop邻域正则化:文本分类的一个实例研究(van der Heijden等人,EACL 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.eacl-main.85.pdf
视频:
 https://aclantology.org/2023.eacl-main.85.mp4