@正在进行{winata-etal-2023-nusax,title=“{N}usa{X}:10{I}印尼本地语言的多语言并行情感数据集”,author=“Winata、Genta Indra和Aji、Alham Fikri和Cahyawijaya、Samuel和Mahendra、Rahmad和Koto、Fajri和Romadony、Ade和Kurniawan、Kemal和Moeljadi、David和Prasojo、Radityo Eko和Fung、Pascale和鲍德温、蒂莫西和Lau、Jey Han和Sennrich、Rico和鲁德尔,塞巴斯蒂安“,editor=“弗拉科斯、安德烈亚斯和伊莎贝尔·奥根斯坦“,booktitle=“计算语言学协会欧洲分会第17届会议记录”,月=5月,年=“2023”,address=“克罗地亚杜布罗夫尼克”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.eacl-main.57”,doi=“10.18653/v1/2023.eacl-main.57”,页码=“815-834”,abstract=“自然语言处理(NLP)通过机器翻译和搜索引擎等技术对社会产生了重大影响。尽管NLP技术取得了成功,但它只适用于英语和汉语等高资源语言,而由于缺乏数据资源和基准,许多语言仍然无法使用NLP技术。在这项工作中,我们重点开发印尼语言资源。尽管印尼是第二大语言多样性国家,但大多数语言都被列为濒危语言,有些甚至已经灭绝。我们为印尼的10种低资源语言开发了第一个并行资源。我们的资源包括情感和机器翻译数据集,以及双语词典。我们提供了广泛的分析,并描述了创建此类资源的挑战。我们希望这项工作能够激发NLP对印尼语和其他代表性不足的语言的研究。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“winata-etal-2023-nusax”><标题信息>NusaX:10种印尼当地语言的多语言并行情感数据集</titleInfo><name type=“personal”><namePart type=“given”>根塔Indra公司Winata公司<角色>作者</角色></name><name type=“personal”>Alham公司菲克里<namePart type=“family”>Aji</namePart><角色>作者</角色></name><name type=“personal”>塞缪尔Cahyawijaya<角色>作者</角色></name><name type=“personal”>拉赫马德马亨德拉<角色>作者</角色></name><name type=“personal”>Fajri传真Koto公司<角色>作者</角色></name><name type=“personal”>Ade罗摩陀<角色>作者</角色></name><name type=“personal”>凯末尔</namePart>库尔尼亚湾<角色>作者</角色></name><name type=“personal”><namePart type=“given”>David</namePart>Moeljadi<角色>作者</角色></name><name type=“personal”>半径(Radityo)Eko普拉索霍<角色>作者</角色></name><name type=“personal”>帕斯卡尔冯<角色>作者</角色></name><name type=“personal”>蒂莫西鲍德温<角色>作者</角色></name><name type=“personal”>Jey(Jey)韩语<namePart type=“family”>Lau<角色>作者</角色></name><name type=“personal”>Rico(Rico)Sennrich<角色>作者</角色></name><name type=“personal”>塞巴斯蒂安<namePart type=“family”>方向盘</namePart><角色>作者</角色></name><originInfo>发布日期:2023-05发布日期:</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>计算语言学协会欧洲分会第17届会议记录</titleInfo><name type=“personal”>安德烈亚斯Vlachos公司<角色>编辑器</角色></name><name type=“personal”>伊莎贝尔奥根斯坦<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>克罗地亚杜布罗夫尼克</地点></originInfo>会议出版物</relatedItem>自然语言处理(NLP)通过机器翻译和搜索引擎等技术对社会产生了重大影响。尽管NLP技术取得了成功,但它只能广泛用于英语和汉语等高资源语言,而由于缺乏数据资源和基准,许多语言仍然无法使用它。在这项工作中,我们重点开发印尼语言资源。尽管印尼是第二大语言多样性国家,但大多数语言都被列为濒危语言,有些甚至已经灭绝。我们为印尼的10种低资源语言开发了第一个并行资源。我们的资源包括情感和机器翻译数据集,以及双语词典。我们提供了广泛的分析,并描述了创建此类资源的挑战。我们希望这项工作能够激发NLP对印尼语和其他代表性不足的语言的研究</摘要>winata-etal-2023-nusax10.18653/v1/2023.eacl-main.57<位置><网址>https://aclantology.org/2023.eacl-main.57</url></位置><部分>2023-05年<扩展单元=“page”><开始>815</开始><end>834</范围></部分></mods></modsCollection>
%0会议记录%T NusaX:10种印尼当地语言的多语言平行情感数据集%A Winata,Genta Indra公司%阿亚吉,阿尔汉·菲克里%A Cahyawijaya,塞缪尔%拉赫马德·马亨德拉%法杰里·阿库托%A Romadony,艾德%科马尔,一个库尔尼亚湾人%A Moeljadi,大卫%A Prasojo,Radityo Eko%阿丰,帕斯卡%蒂莫西·鲍德温%刘杰%A Sennrich,里科%鲁德尔,塞巴斯蒂安%安德烈亚斯·瓦拉科斯%伊莎贝尔·奥格斯坦%计算语言学协会欧洲分会第17届会议记录%D 2023年%5月8日%计算语言学协会%C杜布罗夫尼克,克罗地亚%F winata-etal-2023-nusax公司%X自然语言处理(NLP)通过机器翻译和搜索引擎等技术对社会产生了重大影响。尽管NLP技术取得了成功,但它只适用于英语和汉语等高资源语言,而由于缺乏数据资源和基准,许多语言仍然无法使用NLP技术。在这项工作中,我们重点开发印尼语言资源。尽管印尼是第二大语言多样性国家,但大多数语言都被列为濒危语言,有些甚至已经灭绝。我们为印尼的10种低资源语言开发了第一个并行资源。我们的资源包括情感和机器翻译数据集,以及双语词典。我们提供了广泛的分析,并描述了创建此类资源的挑战。我们希望这项工作能够激发NLP对印尼语和其他代表性不足的语言的研究。%R10.18653/v1/2023.eacl-main.57%U型https://aclantology.org/2023.eacl-main.57%U型https://doi.org/10.18653/v1/2023.eacl-main.57%电话815-834
降价(非正式)
[NusaX:10种印尼当地语言的多语言并行情感数据集](https://aclantology.org/2023.eacl-main.57)(Winata等人,EACL 2023)
国际计算语言学协会
- Genta Indra Winata、Alham Fikri Aji、Samuel Cahyawijaya、Rahmad Mahendra、Fajri Koto、Ade Romadony、Kemal Kurniawan、David Moeljadi、Radityo Eko Prasojo、Pascale Fung、Timothy Baldwin、Jey Han Lau、Rico Sennrich和Sebastian Ruder。2023NusaX:10种印尼当地语言的多语言平行情感数据集.英寸计算语言学协会欧洲分会第17届会议记录,第815-834页,克罗地亚杜布罗夫尼克。计算语言学协会。