祖先到克理奥尔人的迁移不是在公园里散步

希瑟四旬斋,伊曼纽尔·布利亚雷洛,安德斯·瑟加德


摘要
我们的目标是学习大量数据不可用的克里奥尔语的语言模型,从而探索祖先语言的潜在迁移(“祖先迁移假说”)。我们发现标准的转移方法不利于祖先的转移。令人惊讶的是,与其他非克里奥尔语不同,克里奥尔斯语出现了一种非常独特的两阶段模式:随着我们的训练失去了平台,语言模型开始在源语言上过度,克里欧语的困惑也随之减少。我们探索这个压缩阶段是否能够产生实际有用的语言模型(“祖先瓶颈假说”),但也证明了这一点。此外,我们还发现,克里奥尔语甚至在训练随机、无关的语言时也表现出这种两阶段模式。因此,克里奥尔语似乎是类型学上的离群值,我们推测这两个观察结果之间是否存在联系。
选集ID:
2022.见解-1.9
体积:
第三届NLP负面结果洞察力研讨会会议记录
月份:
五月
年份:
2022
地址:
爱尔兰都柏林
编辑:
沙布纳姆·塔弗雷西,乔·塞多克,安娜·罗杰斯,亚历山大·德罗兹德,安娜·拉姆希斯基,阿琼·阿库拉
地点:
洞察力
SIG公司:
出版商:
计算语言学协会
注:
页:
68–74
语言:
网址:
https://aclantology.org/2022.insights-1.9
内政部:
10.18653/v1/2022.见解-1.9
比比键:
引用(ACL):
希瑟·伦特、伊曼纽尔·布利亚雷洛和安德斯·索加德。2022祖先到克理奥尔人的迁移不是在公园里散步.英寸第三届NLP负面结果洞察力研讨会会议记录,第68-74页,爱尔兰都柏林。计算语言学协会。
引用(非正式):
祖先到克理奥尔人的迁移不是在公园里散步(Lent等人,见解2022)
复制引文:
PDF格式:
https://aclantology.org/2022.insights-1.9.pdf