计算机科学>计算与语言
标题: 图上少快照学习的K-hop邻域正则化
摘要: 我们提出了FewShotTextGCN,这是一种新的方法,旨在有效地利用单词文档图的特性来改进低资源环境中的学习。 我们引入了K-hop邻域正则化,这是一个用于异构图的正则化器,并表明当只有少数训练样本可用时,它可以稳定和改进学习。 此外,我们还提出了一种简化的图形构造方法,该方法可以使图形密度降低7倍,并在低资源设置中产生更好的性能,同时在高资源设置中的性能与最新技术相当。 最后,我们介绍了一种为文字文档图量身定制的自适应伪标记的新变体。 当只使用20个样本进行训练时,我们的表现优于强大的TextGCN基线,在八种语言中平均绝对准确率为17%。 我们证明,我们的方法可以应用于文档分类,而无需对多种类型多样的语言进行任何语言模型预处理,同时性能与大型预处理语言模型相当。