@正在进行{aji-etal-2022-one,title=“一个国家,700多种语言:{NLP}中代表性不足的语言和方言面临的挑战{一} 印尼",author=“Aji、Alham Fikri和Winata、Genta Indra和Koto、Fajri和Cahyawijaya、Samuel和Romadony、Ade和Mahendra、Rahmad和Kurniawan、Kemal和Moeljadi、David和Prasojo、Radityo Eko和鲍德温、蒂莫西和Lau、Jey Han和鲁德尔,塞巴斯蒂安“,editor=“Muresan、Smaranda和纳科夫、普雷斯拉夫和Aline Villavicencio“,booktitle=“计算语言学协会第60届年会论文集(第一卷:长篇论文)”,月=5月,年=“2022”,address=“爱尔兰都柏林”,publisher=“计算语言学协会”,url=“https://aclantology.org/2022.acl-long.500",doi=“10.18653/v1/2022.acl-long.500”,pages=“7226--7249”,抽象=“由于缺乏资源和对代表性不足的语言和方言所带来的挑战的认识,NLP研究受到阻碍。我们将重点放在印尼所说的语言上,印尼是世界上第二大语言多样性国家和第四大人口国家,我们对印尼NLP研究的现状进行了概述。”s 700多种语言。我们强调印尼NLP面临的挑战以及这些挑战如何影响当前NLP系统的性能。最后,我们提供了一般性建议,以帮助开发NLP技术,不仅适用于印度尼西亚语言,也适用于其他代表性不足的语言。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“aji-etal-2022-one”><标题信息><title>一个国家,700多种语言:印尼NLP对代表性不足的语言和方言的挑战</titleInfo><name type=“personal”>Alham公司菲克里<namePart type=“family”>Aji</namePart><角色>作者</角色></name><name type=“personal”><namePart type=“given”>根塔Indra公司Winata公司<角色>作者</角色></name><name type=“personal”>Fajri传真Koto公司<角色>作者</角色></name><name type=“personal”>塞缪尔Cahyawijaya<角色>作者</角色></name><name type=“personal”>Ade罗摩陀<角色>作者</角色></name><name type=“personal”>拉赫马德马亨德拉<角色>作者</角色></name><name type=“personal”>凯末尔</namePart>库尔尼亚湾<角色>作者</角色></name><name type=“personal”><namePart type=“given”>David</namePart>Moeljadi<角色>作者</角色></name><name type=“personal”>半径(Radityo)Eko普拉索霍<角色>作者</角色></name><name type=“personal”>蒂莫西鲍德温<角色>作者</角色></name><name type=“personal”>Jey(Jey)韩语<namePart type=“family”>Lau<角色>作者</角色></name><name type=“personal”>塞巴斯蒂安<namePart type=“family”>方向盘</namePart><角色>作者</角色></name><originInfo>2022-05发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>计算语言学协会第60届年会会议记录(第1卷:长篇论文)</titleInfo><name type=“personal”>斯马兰达穆雷桑<角色>编辑器</角色></name><name type=“personal”>普雷斯拉夫纳科夫<角色>编辑器</角色></name><name type=“personal”>Aline(别名)维拉维森西奥<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>爱尔兰都柏林</地点></originInfo>会议出版物</relatedItem>由于缺乏资源和对代表性不足的语言和方言所带来的挑战的认识,NLP研究受到阻碍。印尼是世界上语言多样性第二大、人口第四大的国家,我们以印尼的语言为重点,概述了印尼700多种语言的NLP研究现状。我们强调印尼NLP面临的挑战以及这些挑战如何影响当前NLP系统的性能。最后,我们提供了一般性建议,以帮助开发NLP技术,不仅适用于印度尼西亚的语言,也适用于其他代表性不足的语言</摘要>aji-etal-2022-one10.18653/v1/2022.acl-long.500<位置><网址>https://aclantology.org/2022.acl-long.500</url></位置><部分>2022-05年<扩展单元=“page”><开始>7226</开始><end>7249</范围></部分></mods></modsCollection>
%0会议记录%T One Country,700+Languages:NLP对印尼代表性不足的语言和方言的挑战%阿亚吉,阿尔汉·菲克里%A Winata,Genta Indra公司%法杰里·阿库托%A Cahyawijaya,塞缪尔%A Romadony,艾德%拉赫马德·马亨德拉%科马尔,一个库尔尼亚湾人%A Moeljadi,大卫%A Prasojo,Radityo Eko%蒂莫西·鲍德温%刘杰%鲁德尔,塞巴斯蒂安%Y Muresan,斯马兰达%普雷斯拉夫·纳科夫%Y Villavicencio,阿琳%计算语言学协会第60届年会论文集(第一卷:长篇论文)%D 2022年%5月8日%计算语言学协会%C都柏林,爱尔兰%F aji-etal-2022-one公司%X NLP研究因缺乏资源和对代表性不足的语言和方言所带来的挑战的认识而受到阻碍。印尼是世界上语言多样性第二大、人口第四大的国家,我们以印尼的语言为重点,概述了印尼700多种语言的NLP研究现状。我们强调印尼NLP面临的挑战以及这些挑战如何影响当前NLP系统的性能。最后,我们提供了一般性建议,以帮助开发NLP技术,不仅适用于印度尼西亚语言,也适用于其他代表性不足的语言。%R 10.18653/v1/2022.acl长500%U型https://aclantology.org/2022.acl-long.500%U型https://doi.org/10.18653/v1/2022.acl-long.500%电话7226-7249
降价(非正式)
【一个国家,700多种语言:印尼NLP对代表性不足的语言和方言的挑战】(https://aclantology.org/2022.acl-long.500)(Aji等人,ACL 2022)
国际计算语言学协会
- Alham Fikri Aji、Genta Indra Winata、Fajri Koto、Samuel Cahyawijaya、Ade Romadony、Rahmad Mahendra、Kemal Kurniawan、David Moeljadi、Radityo Eko Prasojo、Timothy Baldwin、Jey Han Lau和Sebastian Ruder。2022一个国家,700多种语言:印尼NLP对代表性不足的语言和方言的挑战.英寸计算语言学协会第60届年会论文集(第一卷:长篇论文),第7226–7249页,爱尔兰都柏林。计算语言学协会。