法里·库托 蒂尔曼·贝克 Zeerak Talat公司 艾丽娜·古列维奇 蒂莫西·鲍德温 使用多语言情感词典对低资源语言进行零镜头情感分析。 2024 abs/2402.02113 CoRR公司 https://doi.org/10.48550/arXiv.2402.02113 db/journals/corr/corr2402.html#abs-2402-02113
法里·库托 李浩南0002 萨拉·沙特纳维 贾德·道格曼 阿卜杜勒拉赫曼·博达·萨达拉 艾莎·阿勒雷西 哈立德·阿穆巴拉克 扎伊德·阿利亚费艾 内哈·森古普塔 谢迪·沙哈塔 尼扎尔·哈巴什 普雷斯拉夫·纳科夫 蒂莫西·鲍德温 阿拉伯语MMLU:评估阿拉伯语的大规模多任务语言理解。 2024 abs/2402.12840 CoRR公司 https://doi.org/10.48550/arXiv.2402.12840 db/journals/corr/corr2402.html#abs-2402-12840
法里·库托 拉赫玛德·马亨德拉 努鲁尔·艾赛亚 蒂莫西·鲍德温 印度文化:探索印尼11个省受地理影响的文化常识推理。 2024 abs/2404.01854 CoRR公司 https://doi.org/10.48550/arXiv.2404.01854 数据库/期刊/corr/corr2404.html#abs-2404-01854
塞缪尔·卡海亚维贾亚 神圣的洛维尼亚 法里·库托 里夫基·阿芬娜·普特里 伊曼纽尔·戴夫 乔森·李 努尔·沙迪克 Tjeng Wawan Cenggoro村 Salsabil Maulana阿克巴 穆罕默德·伊扎·马亨德拉 Dea Annisayanti Putri女士 布莱恩·威利 Genta Indra Winata公司 阿尔哈姆·菲克里·阿吉 阿尤·普瓦连蒂 帕斯卡尔·冯 Cendol:印尼语开放式教学协调生成大型语言模型。 2024 abs/2404.06138 CoRR公司 https://doi.org/10.48550/arXiv.2404.06138 数据库/期刊/corr/corr2404.html#abs-2404-06138
李浩南0002 法里·库托 吴明浩 阿尔哈姆·菲克里·阿吉 蒂莫西·鲍德温 Bactrian-X:一种多语言可复制教学——遵循低水平适应模式。 2023 abs/2305.15011 CoRR公司 https://doi.org/10.44850/arXiv.2305.15011 数据库/期刊/corr/corr2305.html#abs-2305-15011
李浩南0002 张一轩 法里·库托 杨一飞 海照0001 龚叶云 南段 蒂莫西·鲍德温 CMMLU:测量汉语的大规模多任务语言理解能力。 2023 abs/2306.09212 CoRR公司 https://doi.org/10.44850/arXiv.2306.09212 db/journals/corr/corr2306.html#abs-2306-09212
内哈·森古普塔 苏尼尔·库马尔·萨胡 博康佳 Satheesh Katipomu公司 李浩南0002 法里·库托 奥萨马·穆罕默德·阿夫扎尔 桑塔·坎博杰 昂卡·潘迪特 拉胡尔·帕尔 拉利特·普拉丹 扎因·穆罕默德·穆贾希德 马萨·巴利 阿尔哈姆·菲克里·阿吉 刘正中0001 安迪·霍克 安德鲁·菲尔德曼 乔纳森·李 安德鲁·杰克逊 普雷斯拉夫·纳科夫 蒂莫西·鲍德温 Eric Xing(埃里克·星) Jais和Jais-chat:以阿拉伯语为中心的基础和教学协调的开放生成大型语言模型。 2023 abs/2308.16149 CoRR公司 https://doi.org/10.48550/arXiv.2308.16149 db/journals/corr/corr2308.html#abs-2308-16149
陈Cecilia Liu 法里·库托 蒂莫西·鲍德温 艾丽娜·古列维奇 多语言LLM是文化多样性理论家吗?多元文化谚语调查。 2023 abs/2309.08591 CoRR公司 https://doi.org/10.48550/arXiv.2309.08591 数据库/期刊/corr/corr2309.html#abs-2309-08591
塞缪尔·卡海亚维贾亚 神圣的洛维尼亚 法里·库托 迪亚·阿德希斯塔 伊曼纽尔·戴夫 莎拉·奥克塔维亚蒂 Salsabil Maulana阿克巴 乔森·李 努尔·沙迪克 Tjeng Wawan Cenggoro村 Hanung Wahyung Linuwih公司 布莱恩·威利 加利赫·普拉迪普塔·穆里丹 Genta Indra Winata公司 大卫·穆尔贾迪 阿尔哈姆·菲克里·阿吉 阿尤·普瓦连蒂 帕斯卡尔·冯 NusaWrites:为代表性不足和资源极低的语言构建高质量的语料库。 2023 abs/2309.10661 CoRR公司 https://doi.org/10.48550/arXiv.2309.10661 数据库/期刊/corr/corr2309.html#abs-2309-10661
法里·库托 努鲁尔·艾赛亚 李浩南0002 蒂莫西·鲍德温 大型语言模型只通过印尼小学考试:IndoMMLU综合测试。 2023 abs/2310.04928 CoRR公司 https://doi.org/10.48550/arXiv.2310.04928 db/journals/corr/corr2310.html#abs-230-04928
刘正中 奥里克·乔 威利·内斯旺格 王宏毅0001 鲍文·谭 田华涛 李俊波 王玉琦(Yuqi Wang) 孙素琪 Omkar Pangarkar公司 理查德·范 易古 维克多·米勒 永浩庄0001 何国伟 李浩南0002 法里·库托 李平堂 尼基尔·兰扬 沈志强 徐光仁 罗伯托·伊里昂多 村木 胡志婷 马克·舒尔茨 普雷斯拉夫·纳科夫 提姆·鲍德温 埃里克·P·星 LLM360:走向完全透明的开放源代码LLM。 2023 abs/2312.06550 CoRR公司 https://doi.org/10.48550/arXiv.2312.06550 db/journals/corr/corr2312.html#abs-2312-06550
法里·库托 蒂莫西·鲍德温 Jey Han Lau(杰·汉·刘) FFCI:一个可解释的自动总结评估框架。 2022 73 J.阿蒂夫。智力。物件。 https://doi.org/10.1613/jair.1.13167 数据库/期刊/jair/jair73.html#KotoBL22
阿尔哈姆·菲克里·阿吉 Genta Indra Winata公司 法里·库托 塞缪尔·卡海亚维贾亚 阿德·罗曼多尼 拉赫玛德·马亨德拉 凯末尔·库尼亚万 大卫·穆尔贾迪 Radityo Eko Prasojo公司 蒂莫西·鲍德温 Jey Han Lau(杰·汉·刘) 塞巴斯蒂安·鲁德 一个国家,700+种语言:印尼NLP对代表性不足的语言和方言的挑战。 2022 abs/2203.13357 CoRR公司 https://doi.org/10.48550/arXiv.2203.13357 db/journals/corr/corr2203.html#abs-2203-13357
Genta Indra Winata公司 阿尔哈姆·菲克里·阿吉 塞缪尔·卡海亚维贾亚 拉赫玛德·马亨德拉 法里·库托 阿德·罗曼多尼 凯末尔·库尼亚万 大卫·穆尔贾迪 Radityo Eko Prasojo公司 帕斯卡尔·冯 蒂莫西·鲍德温 Jey Han Lau(杰·汉·刘) 里科·森里奇 塞巴斯蒂安·鲁德 NusaX:10种印尼当地语言的多语言平行情感数据集。 2022 abs/2205.15960 CoRR公司 https://doi.org/10.48550/arXiv.2205.15960 db/journals/corr/corr2205.html#abs-2205-15960
塞缪尔·卡海亚维贾亚 阿尔哈姆·菲克里·阿吉 神圣的洛维尼亚 Genta Indra Winata公司 布莱恩·威利 拉赫玛德·马亨德拉 法里·库托 大卫·穆尔贾迪 卡里萨·文森蒂奥 阿德·罗曼多尼 阿尤·普瓦连蒂 NusaCrowd:呼吁用印尼语言进行开放和可复制的NLP研究。 2022 abs/2207.10524 CoRR公司 https://doi.org/10.48550/arXiv.2207.10524 db/journals/corr/corr2207.html#abs-2207-10524
塞缪尔·卡海亚维贾亚 神圣的洛维尼亚 阿尔哈姆·菲克里·阿吉 Genta Indra Winata公司 布莱恩·威利 拉赫玛德·马亨德拉 克里斯蒂安·维比索诺 阿德·罗曼多尼 卡里萨·文森蒂奥 法里·库托 詹妮弗·桑托索 大卫·穆尔贾迪 卡希亚·维拉旺 弗雷德里克·胡迪 伊万·哈利姆·帕莫南根 伊卡·阿尔芬娜 穆罕默德·萨蒂里奥·威卡克索诺 伊尔哈姆·费道西·布特拉(Ilham Firdausi Putra) 萨姆苏尔·拉赫马达尼 尤利安蒂·奥南 阿里·阿克巴尔·塞普蒂安德里 詹姆斯·贾亚 考斯特·D·霍尔 阿里·阿尔迪扬蒂·苏里亚尼 里夫基·阿芬娜·普特里 丹素0003 基思·史蒂文斯 制造Nindyatama Nityasya 穆罕默德·法里德·阿迪拉扎尔达 瑞安·伊格纳修斯 Ryandito Diandaru公司 铁正宇(Tiezheng Yu) 维托·吉法里 戴文良 严旭0012 迪亚·达马普斯皮塔 Cuk Tho公司 伊克瓦努尔穆斯林卡洛卡洛 地拉那努尔Fatyanosa 紫薇记 帕斯卡尔·冯 格雷厄姆·纽比格 蒂莫西·鲍德温 塞巴斯蒂安·鲁德 Herry Sujaini先生 Sakriani Sakti公司 阿尤·普瓦连蒂 NusaCrowd:印尼NLP资源开放源代码倡议。 2022 abs/2212.09648 CoRR公司 https://doi.org/10.48550/arXiv.2212.09648 db/journals/corr/corr2212.html#abs-2212-09648
法里·库托 Jey Han Lau(杰·汉·刘) 蒂莫西·鲍德温 通过序列标记的自顶向下语篇分析。 2021 abs/2102.02080 CoRR公司 https://arxiv.org/abs/1202.02080 db/journals/corr/corr2102.html#abs-2102-02080
法里·库托 Jey Han Lau(杰·汉·刘) 蒂莫西·鲍德温 预设语言模型的语篇探索。 2021 abs/2104.05882 CoRR公司 https://arxiv.org/abs/2014.05882 数据库/期刊/corr/corr2104.html#abs-2104-05882
法里·库托 Jey Han Lau(杰·汉·刘) 蒂莫西·鲍德温 评估跨语言总结评估的有效性。 2021 abs/2106.01478 CoRR公司 https://arxiv.org/abs/2106.01478 数据库/期刊/corr/corr2106.html#abs-2106-01478
法里·库托 Jey Han Lau(杰·汉·刘) 蒂莫西·鲍德温 IndoBERTweet:一种印尼推特预先训练的语言模型,具有有效的领域特定词汇初始化。 2021 abs/2109.04607 CoRR公司 https://arxiv.org/abs/2109.04607 数据库/期刊/corr/corr2109.html#abs-2109-04607
法里·库托 Ikhwan Koto公司 迈向米南卡保语言的计算语言学:情感分析和机器翻译研究。 2020 abs/2009.09309 CoRR公司 https://arxiv.org/abs/2009.09309 db/journals/corr/corr2009.html#abs-2009-09309
法里·库托 阿夫申·拉希米0001 Jey Han Lau(杰·汉·刘) 蒂莫西·鲍德温 IndoLEM和IndoBERT:印尼NLP的基准数据集和预训练语言模型。 2020 abs/2011.00677 CoRR公司 https://arxiv.org/abs/2011.00677 db/journals/corr/corr2011.html#abs-2011-00677
法里·库托 Jey Han Lau(杰·汉·刘) 蒂莫西·鲍德温 Liputan6:用于文本摘要的大型印尼数据集。 2020 abs/2011.00679 CoRR公司 https://arxiv.org/abs/2011.00679 db/journals/corr/corr2011.html#abs-2011-00679
法里·库托 Jey Han Lau(杰·汉·刘) 蒂莫西·鲍德温 FFCI:一个可解释的自动总结评估框架。 2020 abs/2011.13662 CoRR公司 https://arxiv.org/abs/2011.3662 db/journes/cor/corr2011.html#abs-2011-13662
法里·库托 Jey Han Lau(杰·汉·刘) 蒂莫西·鲍德温 使用神经语篇分析器改进文档建模。 2019 abs/1911.06919 CoRR公司 http://arxiv.org/abs/1911.06919 db/journals/corr/corr1911.html#abs-1911-06919