多语言和跨语言文档分类:一种元学习方法

尼尔斯·范德海登,海伦·扬纳库达基斯,普什卡·米什拉,叶卡捷琳娜·舒托娃


摘要
由于深度学习方法的成功应用,世界上绝大多数语言被视为资源不足。在这项工作中,我们提出了一种用于低资源语言文档分类的元学习方法,并在两种不同的环境中证明了其有效性:对以前看不到的语言进行少量的跨语言适应;在训练过程中,当目标语言数据有限时,进行多语言联合训练。我们对几种元学习方法进行了系统比较,从数据可用性的角度考察了多种设置,并表明元学习在任务分布异质的环境中蓬勃发展。我们建议对现有的元学习方法进行简单而有效的调整,以实现更好、更稳定的学习,并在多种语言上建立一种新的技术水平,同时在其他语言上表现平平,只使用少量标记数据。
选集ID:
2021.每个月168
体积:
计算语言学协会欧洲分会第16届会议记录:主要卷
月份:
四月
年份:
2021
地址:
在线的
编辑:
保拉·梅洛,乔格·蒂德曼,Reut Tsarfaty公司
地点:
EACL公司
SIG公司:
出版商:
计算语言学协会
注:
页:
1966–1976
语言:
网址:
https://aclantology.org/2021.eacl-main.168
内政部:
10.18653/v1/22021.eacl-main.168
比比键:
引用(ACL):
尼尔斯·范德海登(Niels van der Heijden)、海伦·扬纳库达基斯(Helen Yannakoudakis)、普什卡·米什拉(Pushkar Mishra)和叶卡捷琳娜·舒托娃(Ekaterina Shutova)。2021多语言和跨语言文档分类:一种元学习方法.英寸计算语言学协会欧洲分会第16届会议记录:主要卷1966-1976页,在线。计算语言学协会。
引用(非正式):
多语言和跨语言文档分类:一种元学习方法(van der Heijden等人,EACL 2021)
复制引文:
PDF格式:
https://aclantology.org/2021.eacl-main.168.pdf
代码
mrvoh/meta学习多语言doc分类
数据
MLDoc公司