@正在进行{lent-etal-2021语言,title=“关于克里奥尔语的语言模型”,author=“Lent、Heather和Bugliarello、Emanuele和de Lhoneux、Miryam和邱、陈和S{\o}gaard,Anders“,editor=“比萨扎、阿里安娜和奥姆里·阿本德“,booktitle=“第25届计算自然语言学习会议记录”,月=11月,年=“2021”,address=“在线”,publisher=“计算语言学协会”,url=“https://aclantology.org/2021.conll-1.5”,doi=“10.18653/v1/2021.conll-1.5”,pages=“58--71”,抽象=“克里奥尔语,如尼日利亚的洋泾浜英语和海地的克里奥尔特语,在NLP文献中资源不足,基本上被忽视。克里奥尔斯语通常是由一种外语与多种当地语言融合而成,而克里奥尔尔语的语法和词汇特征是一个复杂的过程。而克里欧语通常是表中,某些特征的突出程度可能会随着某些人口统计数据或某些语言情况而更强。本文的主要贡献是:收集了海地克里奥尔语、尼日利亚洋泾浜英语和新加坡口语的现有语料库和发布模型。我们在内部和外部任务上评估这些模型。受上述文献的启发,我们将标准语言模型与分布健壮模型进行了比较,发现标准语言模型优于分布健壮的模型,这有些令人惊讶。我们研究了这是过度参数化还是相对分布稳定性的影响,发现在没有过度参数化的情况下,差异仍然存在,漂移是有限的,这证实了克里奥尔语言的相对稳定性。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“lent-etal-2021-language”><标题信息>关于克里奥尔语的语言模型</titleInfo><name type=“personal”><namePart type=“given”>希瑟Lent系列<角色>作者</角色></name><name type=“personal”>埃马努埃莱</namePart>布利亚雷洛<角色>作者</角色></name><name type=“personal”>Miryamde Lhoneux系列<角色>作者</角色></name><name type=“personal”><namePart type=“given”>陈邱<namePart type=“family”><角色>作者</角色></name><name type=“personal”>安德斯瑟加德<角色>作者</角色></name><originInfo>发布日期:2021-11发布日期:</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第25届计算自然语言学习会议记录</titleInfo><name type=“personal”>阿里安娜比萨扎<角色>编辑器</角色></name><name type=“personal”>欧姆里Abend(阿本德)<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>在线</place></originInfo><type-authority=“marcgt”>会议出版物</type></relatedItem>克里奥尔语,如尼日利亚洋泾浜英语和海地克里奥尔语,在NLP文献中来源不足,基本上被忽视。克里奥尔语通常是由一种外语与多种当地语言融合而成的,其语法和词汇特征是一个复杂的过程。虽然克里奥尔语总体上是稳定的,但在某些人口统计学或某些语言情况下,某些特征的突出性可能会更强。本文的主要贡献是:收集了海地克里奥尔语、尼日利亚洋泾浜英语和新加坡口语的现有语料库和发布模型。我们在内部和外部任务上评估这些模型。受上述文献的启发,我们将标准语言模型与分布健壮模型进行了比较,发现标准语言模型优于分布健壮的模型,这有些令人惊讶。我们研究了这是过度参数化还是相对分布稳定性的影响,发现在没有过度参数化的情况下,差异仍然存在,漂移是有限的,这证实了克里奥尔语言的相对稳定性</摘要>lent-etal-2021语言10.18653/v1/2021.conll-1.5<位置><网址>https://aclantology.org/2021.conll-1.5</url></位置><部分>2021-11年<扩展单元=“page”><开始>58</开始><end>71</范围></部分></mods></modsCollection>
%0会议记录%克理奥尔语的语言模型%四旬斋,希瑟%A Bugliarello,伊曼纽尔%米里亚姆·A de Lhoneux%陈阿秋%安德斯·索加德%阿里安娜·比萨扎%奥姆里·阿本德%第25届计算自然语言学习会议论文集%D 2021年%11月8日%计算语言学协会%C在线%F lent-etal-2021语言%尼日利亚洋泾浜英语和海地克里奥尔语等克里奥尔语资源不足,在NLP文献中基本上被忽视。克里奥尔语通常是由一种外语与多种当地语言融合而成的,其语法和词汇特征是一个复杂的过程。虽然克里奥尔语总体上是稳定的,但在某些人口统计学或某些语言情况下,某些特征的突出性可能会更强。本文的主要贡献是:收集了海地克里奥尔语、尼日利亚洋泾浜英语和新加坡口语的现有语料库和发布模型。我们在内部和外部任务上评估这些模型。受上述文献的启发,我们将标准语言模型与分布健壮模型进行了比较,发现标准语言模型优于分布健壮的模型,这有些令人惊讶。我们研究了这是过度参数化还是相对分布稳定性的影响,发现在没有过度参数化的情况下,差异仍然存在,漂移是有限的,这证实了克里奥尔语言的相对稳定性。%R10.18653/v1/2021。控制-1.5%U型https://aclantology.org/2021.conll-1.5%U型https://doi.org/10.18653/v1/2021.conll-1.5%电话58-71
降价(非正式)
[关于克里奥尔语的语言模型](https://aclantology.org/2021.conll-1.5)(Lent等人,CoNLL 2021)
国际计算语言学协会
- 希瑟四旬斋、伊曼纽尔·布利亚雷洛、米利亚姆·德·勒诺、陈秋和安德斯·索加德。2021克里奥尔语的语言模型.英寸第25届计算自然语言学习会议记录,第58-71页,在线。计算语言学协会。