塞缪尔·卡海亚维贾亚,神圣的洛维尼亚,阿尔哈姆·菲克里·阿吉,Genta Winata公司,布莱恩·威利,法里·库托,拉赫玛德·马亨德拉,克里斯蒂安·维比索诺,阿德·罗曼多尼,卡里萨·文森蒂奥,詹妮弗·桑托索,大卫·穆尔贾迪,卡希亚·维拉旺,弗雷德里库斯·胡迪,穆罕默德·萨蒂里奥·威卡克索诺,伊万·帕莫南根,伊卡·阿尔芬娜,伊尔哈姆·费道西·布特拉(Ilham Firdausi Putra),萨姆苏尔·拉赫马达尼,尤利安蒂·奥南,阿里·塞普蒂安德里,詹姆斯·贾亚,考斯图布·德霍尔,阿里·苏里亚尼,里夫基·阿芬娜·普特里,丹·苏,基思·史蒂文斯,制造Nindyatama Nityasya,穆罕默德·阿迪拉扎尔达,瑞安·哈迪维亚亚,Ryandito Diandaru公司,铁正宇(Tiezheng Yu),维托·吉法里,戴文良,严旭,迪亚·达马普斯皮塔,哈利奥·维博沃,Cuk Tho公司,伊奇瓦努尔·卡洛·卡洛,地拉那Fatyanosa,紫薇记,格雷厄姆·纽比格,蒂莫西·鲍德温,塞巴斯蒂安·鲁德,Pascale Fung公司,Herry Sujaini先生,Sakriani Sakti公司,阿尤·普瓦连蒂
@正在进行{cahyawijaya-etal-2023-nusacrowd,title=“{N}usa{C}rowd:{I}印尼{NLP}资源开放源代码倡议”,author=“Cahyawijaya、Samuel和Lovenia,Holy和Aji、Alham Fikri和Winata、Genta和威利、布莱恩和Koto、Fajri和Mahendra、Rahmad和维比索诺、克里斯蒂安和Romadony、Ade和文森蒂奥、卡莉莎和Santoso、Jennifer和Moeljadi、David和维拉旺、卡希亚和Hudi、Frederikus和威卡索诺、穆罕默德·萨特里奥和帕莫南根、伊凡和Alfina、Ika和Putra、Ilham Firdausi和Rahmadani、Samsul和Oenang、Yulianti和塞普蒂安德里、阿里和Jaya、James和Dhole、Kaustubh和苏里亚尼、阿里亚和Putri、Rifki Afina和苏、丹和史蒂文斯、基思和Nityasia、Made Nindyatama和阿迪拉祖达、穆罕默德和Hadiwijaya、Ryan和Diandaru、Ryandito和于铁正和吉法里、维托和戴文良Xu、Yan和达马普斯皮塔、迪亚和Wibowo、Haryo和Tho、Cuk和卡洛·卡洛、伊奇瓦努尔和Fatyanosa、地拉那和季、紫薇和Neubig、Graham和鲍德温、蒂莫西和鲁德、塞巴斯蒂安和Fung、Pascale和苏贾尼、亨利和Sakti、Sakriani和阿尤·普瓦连蒂“,editor=“罗杰斯、安娜和Boyd-Graber、Jordan和冈崎、直崎“,booktitle=“计算语言学协会的发现:ACL 2023”,月=七月,年=“2023”,address=“加拿大多伦多”,publisher=“计算语言学协会”,url=“https://aclcollectory.org/2023.findings acl.868”,doi=“10.18653/v1/2023.findings-acl.868”,pages=“13745--13818”,摘要=“我们推出了NusaCrowd,这是一个协作倡议,旨在收集和统一印尼语言的现有资源,包括开放对以前非公开资源的访问。通过这一倡议,我们汇集了137个数据集和118个标准化数据加载器。数据集的质量已经过手动和自动评估,并通过多次实验验证了其价值。NusaCrowd{'}的数据收集为印尼语和印尼当地语言的自然语言理解和生成创建了第一个零快照基准。此外,NusaCrowd还创建了第一个印尼语和印尼当地语言的多语言自动语音识别基准。我们的工作致力于推进自然语言处理(NLP)研究,以解决尽管被广泛使用但仍被低估的语言。”,}
<?xml版本=“1.0”编码=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“cahyawijaya-etal-2023-nusarcowd”><标题信息>NusaCrowd:印尼NLP资源开源倡议</titleInfo><name type=“个人”>塞缪尔<namePart type=“family”>Cahyawijaya</namePart><角色>作者</角色></name><name type=“个人”>神圣的洛维尼亚<角色>作者</角色></name><name type=“个人”>Alham公司菲克里<namePart type=“family”>Aji</namePart><角色>作者</角色></name><name type=“个人”><namePart type=“given”>根塔Winata公司<角色>作者</角色></name><name type=“个人”>布莱恩威利(Wilie)<角色>作者</角色></name><name type=“个人”>Fajri传真Koto公司<角色>作者</角色></name><name type=“个人”>拉赫马德马亨德拉<角色>作者</角色></name><name type=“个人”>克里斯蒂安维比索诺<角色>作者</角色></name><name type=“个人”>Ade罗摩陀<角色>作者</角色></name><name type=“个人”>卡莉莎文森蒂奥<角色>作者</角色></name><name type=“个人”>珍妮弗桑托索<角色>作者</角色></name><name type=“个人”>大卫Moeljadi<角色>作者</角色></name><name type=“个人”>卡哈亚Wirawan(维拉湾)<角色>作者</角色></name><name type=“个人”><namePart type=“given”>弗雷德里克斯</namePart><namePart type=“family”>胡迪</namePart><角色>作者</角色></name><name type=“个人”>穆罕默德Satrio Satrio维卡克索诺<角色>作者</角色></name><name type=“个人”>伊凡帕莫南根<角色>作者</角色></name><name type=“个人”>Ika(Ika)阿尔芬娜<角色>作者</角色></name><name type=“个人”>伊勒姆Firdausi公司<namePart type=“family”>Putra</namePart><角色>作者</角色></name><name type=“个人”><namePart type=“given”>桑苏尔</namePart>拉赫马达尼<角色>作者</角色></name><name type=“个人”>尤利安蒂Oenang公司<角色>作者</角色></name><name type=“个人”>阿里塞普蒂安德里<角色>作者</角色></name><name type=“个人”>詹姆斯贾亚<角色>作者</角色></name><name type=“个人”>考斯图布Dhole(Dhole)<角色>作者</角色></name><name type=“个人”>Arie(Arie)苏里亚尼语<角色>作者</角色></name><name type=“个人”>Rifki<namePart type=“given”>AfinaPutri系列<角色>作者</角色></name><name type=“个人”>丹<namePart type=“family”>苏</namePart><角色>作者</角色></name><name type=“个人”>基思史蒂文斯<角色>作者</角色></name><name type=“个人”><namePart type=“given”>制造</namePart>NindyatamaNityasya<角色>作者</角色></name><name type=“个人”>穆罕默德阿迪拉扎尔达<角色>作者</角色></name><name type=“个人”>Ryan哈迪威亚<角色>作者</角色></name><name type=“个人”><namePart type=“given”>Ryandito</namePart><namePart type=“family”>点达鲁</namePart><角色>作者</角色></name><name type=“个人”>铁正<namePart type=“given”><namePart type=“family”>余</namePart><角色>作者</角色></name><name type=“个人”>维托盖法里<角色>作者</角色></name><name type=“个人”>文良<namePart type=“given”>傣族<角色>作者</角色></name><name type=“个人”>严(Yan)<namePart type=“family”>徐</namePart><角色>作者</角色></name><name type=“个人”>Dyah(Dyah)<namePart type=“family”>大马士革<角色>作者</角色></name><name type=“个人”><namePart type=“given”>Haryo</namePart>Wibowo(维宝)<角色>作者</角色></name><name type=“个人”>Cuk(Cuk)Tho(Tho)<角色>作者</角色></name><name type=“个人”>Ichwanul卡洛·卡洛<角色>作者</角色></name><name type=“个人”>地拉那Fatyanosa公司<角色>作者</角色></name><name type=“个人”>紫薇吉(Ji)<角色>作者</角色></name><name type=“个人”>格雷厄姆Neubig公司<角色>作者</角色></name><name type=“个人”>蒂莫西鲍德温<角色>作者</角色></name><name type=“个人”>塞巴斯蒂安鲁德尔<角色>作者</角色></name><name type=“个人”>帕斯卡尔冯<角色>作者</角色></name><name type=“个人”>亨利苏贾尼尼<角色>作者</角色></name><name type=“个人”>萨基里亚尼语萨克蒂<角色>作者</角色></name><name type=“个人”>阿尤Purwarianti公司<角色>作者</角色></name><originInfo>发布日期:2023-07发布日期:</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>计算语言学协会的发现:ACL 2023</titleInfo><name type=“个人”>安娜</namePart><namePart type=“family”>Rogers</namePart>罗杰斯<角色>编辑器</角色></name><name type=“个人”>约旦博伊德·格雷伯<角色>编辑器</角色></name><name type=“个人”>Naoaki(Naoaki)冈崎<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>加拿大多伦多</place></originInfo>会议出版物</relatedItem><abstract>我们推出了NusaCrowd,这是一个协作倡议,旨在收集和统一印尼语言的现有资源,包括开放对以前非公开资源的访问。通过这一举措,我们汇集了137个数据集和118个标准化数据加载器。对数据集的质量进行了手动和自动评估,并通过多次实验证明了其价值。NusaCrowd的数据收集能够为印尼语和印尼当地语言的自然语言理解和生成创建第一个零快照基准。此外,NusaCrowd还创建了第一个印尼语和印尼当地语言的多语言自动语音识别基准。我们的工作致力于推动自然语言处理(NLP)研究,针对尽管被广泛使用但代表性不足的语言</摘要>cahyawijaya-etal-2023-nusarcowd10.18653/v1/2023.findings-acl.868<位置><网址>https://aclantology.org/2023.findings-acl.868</url></位置><部分>2023-07年<扩展单元=“page”><开始>13745</开始>13818年结束</范围></部分></mods></modsCollection>
%0会议记录%T NusaCrowd:印尼NLP资源开源倡议%A Cahyawijaya,塞缪尔%A Lovenia,天哪%阿亚吉,阿尔汉·菲克里%A Winata,Genta公司%布莱恩·威利%法杰里·阿库托%拉赫马德·马亨德拉%克里斯蒂安·维比索诺%A Romadony,艾德%A Vincentio,卡莉莎%詹妮弗·桑托索%A Moeljadi,大卫%Cahya的A Wirawan%弗雷德里库斯·阿胡迪%维卡索诺,穆罕默德·萨特里奥%伊凡·帕尔莫南根%艾卡·阿尔芬娜%伊勒姆·费道西(Ilham Firdausi),阿普特拉(A Putra)%A Rahmadani,桑苏尔%尤利安蒂,阿奥能%阿里·塞普蒂安德里%詹姆斯·贾亚%A Dhole,考斯图布%阿苏里亚尼人,白羊座%A Putri,里夫基·阿芬娜%阿苏,丹%基思·史蒂文斯%Nityasya,制造Nindyatama%阿迪拉扎尔达,穆罕默德%A Hadiwijaya,瑞安%一个Diandaru,Ryandito%阿玉、铁正%维托,A Ghifari%阿岱、文亮%阿旭、燕%大马士革,Dyah%A Wibowo,哈里奥%阿图,库克%阿卡洛·卡洛,伊奇瓦努尔%地拉那Fatyanosa%紫薇阿吉%格拉汉姆·A Neubig%蒂莫西·鲍德温%鲁德尔,塞巴斯蒂安%阿丰,帕斯卡%A Sujaini,亨利%萨克提,萨克里亚尼%A Purwarianti,阿尤%安娜·罗杰斯%Y Boyd-Graber,约旦%Y冈崎,直崎%计算语言学协会的研究结果:ACL 2023%D 2023年%7月8日%计算语言学协会%C加拿大多伦多%F cahyawijaya-etal-2023-nusacrowd公司%X我们展示了NusaCrowd,这是一项合作倡议,旨在收集和统一印尼语的现有资源,包括开放对以前非公开资源的访问。通过这一举措,我们汇集了137个数据集和118个标准化数据加载器。对数据集的质量进行了手动和自动评估,并通过多次实验证明了其价值。NusaCrowd的数据收集能够为印尼语和印尼当地语言的自然语言理解和生成创建第一个零快照基准。此外,NusaCrowd还创建了第一个印尼语和印尼当地语言的多语言自动语音识别基准。我们的工作致力于推进自然语言处理(NLP)研究,以解决尽管被广泛使用但仍被低估的语言。%R 10.18653/v1/2023.查找-acl.868%U型https://aclantology.org/2023.findings-acl.868%U型https://doi.org/10.18653/v1/2023.findings-acl.868%电话13745-13818
降价(非正式)
[NusaCrowd:印尼NLP资源开源倡议](https://aclantology.org/2023.findings-acl.868)(Cahyawijaya等人,研究结果2023)
国际计算语言学协会
- 塞缪尔·卡哈亚维贾亚(Samuel Cahyawijaya)、圣洛维尼亚(Holy Lovenia)、阿勒姆·菲克里·阿吉(Alham Fikri Aji)、根塔·维纳塔(Genta Winata)、布莱恩·威利(Bryan Wilie)、法杰里·库托(Fajri Koto)、拉赫玛德·马亨德拉(Rahmad Mahendra)、克里斯蒂安·维比索诺(Christian Wibisono)、艾德·罗马多尼(Ade Romadony)、卡丽莎·文森提奥(Karissa Vincentio)、詹妮弗·桑托索(Jennifer Santoso)、大卫·。NusaCrowd:印尼NLP资源开源倡议.英寸计算语言学协会的研究结果:ACL 2023,第13745–13818页,加拿大多伦多。计算语言学协会。