艾萨克·卡斯维尔
人员信息
优化列表
2020年–今天
2024 [第13条] Daan van Esch公司 , 桑迪·里奇 , 塞巴斯蒂安·鲁德 , 朱莉娅·克鲁泽 , 克拉拉·里维拉 , Ishank Saxena公司 , 艾萨克·卡斯维尔 :
将语言技术与涵盖数千种语言的丰富多样的数据源连接起来。 LREC/冷却 2024 : 3729-3746 2023 [第12条] 亚历山大·琼斯 , 艾萨克·卡斯维尔 , 奥汉·菲拉特 , Ishank Saxena公司 :
GATITOS:使用新的多语言词典进行低资源机器翻译。 EMNLP公司 2023 : 371-405 [第11条] 塞巴斯蒂安·鲁德 , 乔纳森·克拉克 , 亚历山大·古特金 , 米希尔·卡莱 , 马敏儿(Min Ma) , 尼科西亚马西莫 , 什鲁蒂·里奇瓦尼 , 帕克·莱利 , 让·米歇尔·萨尔 , 王欣怡 , 约翰·维廷 , 尼提什·古普塔 , 安娜·卡塔诺娃 , 克里斯托·基洛夫 , 达纳·L·狄金森 , 布莱恩·罗克 , 比迪莎·萨曼塔 , 康妮·陶 , 大卫·伊菲奥卢瓦·阿德拉尼 , 维拉·阿克塞尔罗德 , 艾萨克·卡斯维尔 , 科林·切里 , 丹·加勒特 , R.里夫·英格尔 , 梅尔文·约翰逊 , 德米特里·潘特列夫 , Partha Talukdar公司 :
XTREME-UP:以用户为中心的稀缺数据基准测试,适用于缺乏代表性的语言。 EMNLP(调查结果) 2023 : 1856-1884 [第10条] 斯内哈·库杜贡塔 , 艾萨克·卡斯维尔 , 张彪 , 泽维尔·加西亚 , Derrick Xin公司 , 阿迪蒂亚·库苏帕蒂 , 罗米·斯特拉 , 安库尔·巴纳 , 奥汉·菲拉特 :
MADLAD-400:一个多语言和文档级的大型审计数据集。 NeurIPS公司 2023 [i16] 亚历山大·琼斯 , 艾萨克·卡斯维尔 , Ishank Saxena公司 , 奥汉·菲拉特 :
Bilex Rx:用于大规模多语言机器翻译的词汇数据增强。 CoRR公司 abs/2303.15265 ( 2023 ) 【i15】 塞巴斯蒂安·鲁德 , 乔纳森·克拉克 , 亚历山大·古特金 , 米希尔·卡莱 , 马敏儿(Min Ma) , 马西莫·尼科西亚 , 什鲁蒂·里奇瓦尼 , 帕克·莱利 , 让·米歇尔·萨尔 , 王欣怡 , 约翰·维廷 , 尼提什·古普塔 , 安娜·卡塔诺娃 , 克里斯托·基洛夫 , 达纳·迪金森 , 布莱恩·罗克 , 比迪莎·萨曼塔 , 陶康妮(Connie Tao) , 大卫·伊菲奥卢瓦·阿德拉尼 , 维拉·阿克塞尔罗德 , 艾萨克·卡斯维尔 , 科林·切里 , 丹·加勒特 , R.里夫·英格尔 , 梅尔文·约翰逊 , 德米特里·潘特列夫 , Partha Talukdar公司 :
XTREME-UP:以用户为中心的稀缺数据基准测试,适用于缺乏代表性的语言。 CoRR公司 abs/2305.11938 ( 2023 ) [第14条] 斯内哈·库杜贡塔 , 艾萨克·卡斯维尔 , 张彪 , 泽维尔·加西亚 , 克里斯托弗·乔奎特(Christopher A.Choquette-Choo) , 凯瑟琳·李 , Derrick Xin公司 , 阿迪蒂亚·库苏帕蒂 , 罗米·斯特拉 , 安库尔·巴纳 , 奥汉·菲拉特 :
MADLAD-400:一个多语言和文档级的大型审计数据集。 CoRR公司 abs/2309.04662 ( 2023 ) [i13] 艾萨克·卡斯维尔 , 汪明荃 , 伊莎贝尔·帕帕迪米特里奥 :
用面包将小麦与谷壳分离:一个开源基准和指标,用于检测文本中的冗余。 CoRR公司 abs/2311.06440 ( 2023 ) 2022 [j1] 朱莉娅·克鲁泽 , 艾萨克·卡斯维尔 , 汪明荃 , 阿赫桑·瓦哈布 , Daan van Esch公司 , Nasanbayar Ulzii-Orshikh公司 , 阿拉赫塞拉·塔波 , Nishant Subramani公司 , 阿特姆·索科洛夫 , 克莱顿·西卡索特 , Monang Setyawan公司 , Supheakmungkol沙林 , Sokhar Samb公司 , 贝诺西翁 , 克拉拉·里维拉 , 安妮特·里奥斯 , 伊莎贝尔·帕帕迪米特里奥 , 萨洛米·奥塞 , 佩德罗·哈维尔·奥尔蒂斯·苏亚雷斯 , 伊罗罗·奥里夫 , 科莱奇·奥格吉 , 安德烈·尼扬加博·鲁宾戈 , Toan Q.Nguyen先生 , 马蒂亚斯·米勒 , 安德烈·米勒 , 沙姆苏丁·哈桑·穆罕默德 , 南达·穆罕默德 , 阿扬达·姆尼亚凯尼 , 贾姆希德贝克·米扎哈洛夫 , 塔皮瓦纳西·马坦吉拉 , 柯林·梁朝伟(Colin Leong) , 恩泽·劳森 , 斯内哈·库杜贡塔 , 亚辛·杰尼特 , 马西亚斯·詹妮 , 奥汉·菲拉特 , Bonaventure F.P.Dossou公司 , 萨基尔·德拉米尼 , 尼桑萨·德·席尔瓦 , 萨金·贾布克·巴利 , 斯特拉·拜德曼 , 阿莱西亚·巴蒂斯蒂 , 艾哈迈德·巴鲁瓦 , 安库尔·巴纳 , 帕拉维·巴尔杰卡尔 , 以色列Abebe Azime , Ayodele Awokoya公司 , 杜伊古·阿塔曼 , 奥利奥古涅·阿希亚(Orevaoghene Ahia) , 奥格内菲戈·阿希亚 , 斯威塔·阿格拉瓦尔 , Mofetoluwa Adeyemi公司 :
质量概览:对网络浏览的多语言数据集的审计。 事务处理。 关联计算。 语言学 10 : 50-72 ( 2022 ) [c9] Daan van Esch公司 , 塔马尔·卢卡森 , 塞巴斯蒂安·鲁德 , 艾萨克·卡斯维尔 , 克拉拉·里维拉 :
2800多种语言的书写系统和说话人元数据。 LREC公司 2022 : 5035-5046 [i12] 阿迪蒂亚·西德汉特 , 安库尔·巴纳 , 奥汉·菲拉特 , 袁操 , Mia Xu Chen女士 , 艾萨克·卡斯维尔 , 泽维尔·加西亚 :
多语言机器翻译中的下一个1000种语言:探索监督学习和自我监督学习之间的协同作用。 CoRR公司 abs/2201.03110 ( 2022 ) [i11] 安库尔·巴纳 , 艾萨克·卡斯维尔 , 朱莉娅·克鲁泽 , 奥汉·菲拉特 , Daan van Esch公司 , 阿迪蒂亚·西德汉特 , 蒙蒙牛 , 帕拉维·巴尔杰卡尔 , 泽维尔·加西亚 , 沃尔夫冈·马切里 , 特蕾莎·布莱纳 , 维拉·阿克塞尔罗德 , 杰森·里萨 , 袁操 , Mia Xu Chen女士 , 克劳斯·马切里 , 马克西姆·克里坤 , 王皮东(Pidong Wang) , 亚历山大·古特金 , 阿普瓦·沙阿 , 黄燕平 , 陈志峰 , 吴永辉 , 麦克达夫·休斯 :
为下千种语言构建机器翻译系统。 CoRR公司 abs/2205.03983 ( 2022 ) 2021 [i10] 艾萨克·卡斯维尔 , 朱莉娅·克鲁泽 , 汪明荃 , 阿赫桑·瓦哈布 , Daan van Esch公司 , Nasanbayar Ulzii-Orshikh公司 , 阿拉赫塞拉·塔波 , Nishant Subramani公司 , 阿特姆·索科洛夫 , 克莱顿·西卡索特 , Monang Setyawan公司 , Supheakmungkol沙林 , Sokhar Samb公司 , 贝诺西翁 , 克拉拉·里维拉 , 安妮特·里奥斯 , 伊莎贝尔·帕帕迪米特里奥 , 萨洛米·奥塞 , 佩德罗·哈维尔·奥尔蒂斯·苏亚雷斯 , 伊罗罗·奥里夫 , 科莱奇·奥格吉 , 鲁宾戈·安德烈·尼扬加博 , Toan Q.Nguyen先生 , 马蒂亚斯·米勒 , 安德烈·米勒 , 沙姆苏丁·哈桑·穆罕默德 , 南达·穆罕默德 , 阿扬达·姆尼亚凯尼 , 贾姆希德贝克·米扎哈洛夫 , 塔皮瓦纳西·马坦吉拉 , 柯林·梁朝伟(Colin Leong) , 恩泽·劳森 , 斯内哈·库杜贡塔 , 亚辛·杰尼特 , 马西亚斯·詹妮 , 奥汉·菲拉特 , Bonaventure F.P.Dossou公司 , 萨基尔·德拉米尼 , 尼桑萨·德·席尔瓦 , 萨金·贾布克·巴利 , 斯特拉·拜德曼 , 阿莱西亚·巴蒂斯蒂 , 艾哈迈德·巴鲁瓦 , 安库尔·巴纳 , 帕拉维·巴尔杰卡尔 , 以色列Abebe Azime , Ayodele Awokoya公司 , 杜伊古·阿塔曼 , 奥利奥古涅·阿希亚(Orevaoghene Ahia) , 奥格内菲戈·阿希亚 , 斯威塔·阿格拉瓦尔 , Mofetoluwa Adeyemi公司 :
质量概览:对网络浏览的多语言数据集的审计。 非洲NLP 2021 2020 【c8】 王伟(音译) , 叶田 , Jiquan Ngiam公司 , 杨银飞 , 艾萨克·卡斯维尔 , 扎拉纳·帕雷赫 :
学习神经机器翻译的多领域课程。 国际计算语言学协会 2020 : 7711-7723年 【c7】 帕克·莱利 , 艾萨克·卡斯维尔 , 马库斯·弗雷塔格 , 大卫·格兰杰 :
在“多语言”NMT中翻译为一种语言。 国际计算语言学协会 2020 : 7737-7746 【c6】 艾萨克·卡斯维尔 , 特蕾莎·布莱纳 , Daan van Esch公司 , 安库尔·巴纳 :
野外的语言ID:通往千年语言Web文本语料库的道路上的意外挑战。 冷却 2020 : 6588-6608年 【c5】 马库斯·弗雷塔格 , 大卫·格兰杰 , 艾萨克·卡斯维尔 :
BLEU可能是有罪的,但参考文献并不是无辜的。 EMNLP(1) 2020 : 61-71 [i9] 马库斯·弗雷塔格 , 大卫·格兰杰 , 艾萨克·卡斯维尔 :
BLEU可能是有罪的,但参考文献并不是无辜的。 CoRR公司 abs/2004.06063 ( 2020 ) [i8] 艾萨克·卡斯维尔 , 特蕾莎·布莱纳 , Daan van Esch公司 , 安库尔·巴纳 :
野外的语言ID:通往千年语言Web文本语料库的道路上的意外挑战。 CoRR公司 腹肌/2010.14571 ( 2020 )
2010 – 2019
2019 【c4】 王伟(音译) , 艾萨克·卡斯维尔 , 西普里安·切尔巴 :
通过“协同学习”动态合成领域数据选择和干净数据选择,用于神经机器翻译。 ACL(1) 2019 : 1282-1292 【c3】 斯内哈·雷迪·库杜贡塔 , 安库尔·巴纳 , 艾萨克·卡斯维尔 , 奥汉·菲拉特 :
大规模研究多语言NMT表征。 EMNLP/IJCNLP(1) 2019 : 1565-1575 【c2】 马库斯·弗雷塔格 , 艾萨克·卡斯维尔 , 斯科特·罗伊 :
大规模APE及其对机器翻译评估偏差的影响。 WMT(1) 2019 : 34-44 【c1】 艾萨克·卡斯维尔 , 西普里安·切尔巴 , 大卫·格兰杰 :
标记回译。 WMT(1) 2019 : 53-63 [i7] 乔纳森·沈 , 帕特里克·阮 , 吴永辉 , 陈志峰 , Mia Xu Chen女士 , 叶佳 , 安朱利·坎南 , 塔拉·N·赛纳(Tara N.Sainath) , 袁操 , Chung-Cheng Chiu公司 , 何燕章 , 扬·乔洛夫斯基 , 史密特·欣苏 , 斯特拉·劳伦佐 , 詹姆斯·秦 , 奥汉·菲拉特 , 沃尔夫冈·马切里 , 苏约格·古普塔 , 安库尔·巴纳 , 张淑媛 , 彭若明 , 罗恩·韦斯 , 罗希特·帕巴瓦尔卡 , 乔亮 , 贝努瓦雅各布 , 梁伯文(Bowen Liang) , 李贤重 , 西普里安·切尔巴 , 塞巴斯蒂安·让 , 李波(Bo Li) , 梅尔文·约翰逊 , 罗汉·阿尼尔 , 拉贾特·蒂布雷瓦尔 , 刘晓兵 , 沟口昭子 , 纳维德普·贾特利 , 纳文·阿里 , 科林·切里 , 帕里萨·哈哈尼 , Otavio好 , 程友龙 , 拉齐尔·阿尔瓦雷斯 , 艾萨克·卡斯维尔 , 徐伟宁 , 杨宗衡 , 王宽谦 , 叶卡捷琳娜·戈尼娜 , 凯特琳·托马内克 , 本·瓦尼克 , 吴泽林 , 利昂·琼斯 , 迈克·舒斯特 , 黄燕平 , 陈德豪 , Kazuki Irie公司 , 乔治·F·福斯特 , 约翰·理查德森 , 克劳斯·马切里 , 安托万·布鲁吉尔 , Heiga Zen先生 , 科林·拉斐尔 , Shankar Kumar公司 , 卡尼什卡·饶 , 大卫·瑞巴赫 , 马修·默里 , 维贾亚迪提亚·佩丁蒂 , 马克西姆·克里坤 , 米歇尔·巴奇亚尼 , 托马斯·贾布林 , 罗伯特·苏德曼 , 伊恩·威廉姆斯 , 李湛忞 , 迪普蒂·巴蒂亚 , 贾斯汀·卡尔森 , 塞米赫·亚武兹 , 于章 , 伊恩·麦格劳 , 马克斯·高尔金 , 齐戈 , 戈兰-蓬达 , 查德·威普基 , 托德·王 , 乌里·阿隆 , 德米特里·勒皮钦 , 叶田 , 萨拉·萨布尔 , 威廉·陈 , 舒巴姆·托什尼瓦尔 , 廖宝华 , 迈克尔·尼施尔 , Pat Rondon公司 :
Lingvo:用于序列到序列建模的模块化和可扩展框架。 CoRR公司 abs/1902.08295 ( 2019 ) [i6] 马库斯·弗雷塔格 , 艾萨克·卡斯维尔 , 斯科特·罗伊 :
神经机器翻译中的文本修复模型。 CoRR公司 腹肌/1904.04790 ( 2019 ) [i5] 王伟(音译) , 艾萨克·卡斯维尔 , 西普里安·切尔巴 :
通过“协同学习”动态合成领域数据选择和干净数据选择,用于神经机器翻译。 CoRR公司 abs/1906.01130 ( 2019 ) [i4] 艾萨克·卡斯维尔 , 西普里安·切尔巴 , 大卫·格兰杰 :
标记回译。 CoRR公司 abs/1906.06442 ( 2019 ) [i3] 王伟(音译) , 叶田 , Jiquan Ngiam公司 , 杨银飞 , 艾萨克·卡斯维尔 , 扎拉纳·帕雷赫 :
学习神经机器翻译的多任务课程。 CoRR公司 abs/1908.10940 ( 2019 ) [i2] 斯内哈·雷迪·库杜贡塔 , 安库尔·巴纳 , 艾萨克·卡斯维尔 , 纳文·阿里瓦扎甘 , 奥汉·菲拉特 :
大规模研究多语言NMT表征。 CoRR公司 abs/1909.02197 ( 2019 ) [i1] 帕克-莱利 , 艾萨克·卡斯维尔 , 马库斯·弗雷塔格 , 大卫·格兰杰 :
在“多语言”NMT中翻译为一种语言。 CoRR公司 abs/1911.03823 ( 2019 )