维克托·桑
人员信息
SPARQL查询
优化列表
2020年–今天
2024 [i20] 雨果·劳伦松 , Léo Tronchon公司 , 维克托·桑 :
使用WebSight数据集解除将Web屏幕截图转换为HTML代码的锁定。 CoRR公司 腹肌/2403.09029 ( 2024 ) [i19] 雨果·劳伦松 , 莱奥·特隆钦 , 马蒂厄绳索 , 维克托·桑 :
构建视觉语言模型时什么很重要? CoRR公司 abs/2405.02246 ( 2024 ) [i18] 谢恩·隆普雷 , 斯特拉·拜德曼 , 阿隆·阿尔巴拉克 , Hailey Schoelkopf公司 , 丹尼尔·麦克达夫 , 萨亚什·卡普尔 , 凯文·克莱曼 , 凯尔·洛 , 加布里埃尔·伊尔哈科 , Nay San公司 , 玛丽贝斯·劳赫 , 阿维亚·斯科伦 , 伯蒂·维德根 , 劳拉·魏丁格 , 阿文德·纳拉亚南 , 维克托·桑 , 大卫·伊菲奥卢瓦·阿德拉尼 , 珀西·梁 , 里希·博马萨尼 , 彼得·亨德森 , 萨沙·卢奇奥尼 , 亚辛·杰尼特 , 卢卡·索尔达尼 :
负责任的基金会模型开发备忘:工具和资源回顾。 CoRR公司 abs/2406.16746 ( 2024 ) 2023 [j1] 亨德里克·斯特罗贝尔 , 阿尔伯特·韦伯森 , 维克托·桑 , 本杰明·胡佛 , 约翰娜·拜尔 , 汉斯彼得·普菲斯特 , 亚历山大·拉什 :
交互式可视化提示工程,用于大型语言模型的即席任务适应。 IEEE传输。 视觉。 计算。 图表。 29 ( 1 ) : 1146-1156 ( 2023 ) [第13条] 雨果·劳伦松 , 露西尔·索尔尼尔 , 莱奥·特隆钦 , 斯塔斯·贝克曼 , 阿曼普雷特·辛格 , 安东·洛日科夫 , 托马斯·王 , Siddharth Karamcheti公司 , 亚历山大·拉什 , 杜威-基拉 , 马蒂厄绳索 , 维克托·桑 :
OBELICS:交错图像文本文档的开放网络级过滤数据集。 NeurIPS公司 2023 [i17] 雨果·劳伦松 , 露西尔·索尔尼尔 , 莱奥·特隆钦 , 斯塔斯·贝克曼 , 阿曼普雷特·辛格 , 安东·洛日科夫 , 托马斯·王 , Siddharth Karamcheti公司 , 亚历山大·拉什 , 杜威-基拉 , 马蒂厄绳索 , 维克托·桑 :
OBELISC:一个开放式Web规模的交错图像文本文档过滤数据集。 CoRR公司 abs/2306.16527 ( 2023 ) 2022 [第12条] 斯蒂芬·H·巴赫 , 维克托·桑 , 郑新勇 , 阿尔伯特·韦伯森 , 科林·拉斐尔 , 尼哈尔V.纳亚克 , 阿比希特·夏尔马 , 泰文·金 , 塞福尔·巴里先生 , 蒂鲍特·弗雷夫里 , 扎伊德·阿利亚费艾 , 马南·戴伊 , 安德里亚·桑蒂利 , 孙志清(音) , 斯鲁利克·本·达维德 , 徐灿文 , Gunjan Chhablani公司 , 韩旺 , 杰森·艾伦·弗里斯 , 玛格德·赛义德·阿尔沙巴尼 , 沙尼亚·夏尔马 , 乌尔米什·塔克尔 , 哈立德·阿穆巴拉克 , 香乳汤 , 德拉戈米尔·拉德夫 , 迈克·田建江 , 亚历山大·拉什 :
PromptSource:用于自然语言提示的集成开发环境和存储库。 ACL(演示) 2022 : 93-104 [第11条] 特文·勒斯卡奥 , 托马斯·王 , 丹尼尔·赫斯洛 , 斯塔斯·贝克曼 , 塞福尔·巴里先生 , 斯特拉·拜德曼 , 哈迪·埃尔萨哈尔 , 尼古拉斯·穆尼霍夫 , 贾森·彭 , Ofir出版社 , 科林·拉斐尔 , 维克托·桑 , 盛申(Sheng Shen) , 临塘苏塔威卡 , Jaesung Tae , 郑新勇 , 朱利安·拉奈 , 伊兹·贝尔塔基 :
如果你有一百万个GPU小时,要训练什么语言模型? EMNLP(调查结果) 2022 : 765-782 [c10] 维克托·桑 , 阿尔伯特·韦伯森 , 科林·拉斐尔 , 斯蒂芬·H·巴赫 , 临塘苏塔威卡 , 扎伊德·阿利亚费艾 , 安托万·查芬 , 阿诺德·斯蒂格勒 , 阿伦·拉贾 , 马南·戴伊 , M Saiful Bari先生 , 徐灿文 , 乌尔米什·塔克尔 , 沙尼亚·夏尔马·夏尔马 , 伊丽莎·什切希拉(Eliza Szczechla) , 泰文·金 , Gunjan Chhablani公司 , 尼哈尔V.纳亚克 , 德巴吉奥蒂·达塔 , 张洋洋 , 迈克·田建江 , 韩旺 , 马蒂奥·马尼卡 , 盛申(Sheng Shen) , 郑新勇 , 哈什·潘迪 , 雷切尔·巴登 , 托马斯·王 , 特里沙拉·内拉吉 , 乔斯·罗森 , 阿比希特·夏尔马 , 安德里亚·桑蒂利 , 蒂鲍特·弗雷夫里 , 杰森·艾伦·弗里斯 , 瑞恩·蒂恩 , 特文·勒斯卡奥 , 斯特拉·拜德曼 , 高里奥 , 托马斯·沃尔夫 , 亚历山大·拉什 :
多任务提示训练支持零炮任务泛化。 ICLR公司 2022 [i16] 斯蒂芬·H·巴赫 , 维克托·桑 , 郑新勇 , 阿尔伯特·韦伯森 , 科林·拉斐尔 , 尼哈尔·V·纳亚克 , 阿比希特·夏尔马 , 泰文·金 , 塞福尔·巴里先生 , 蒂鲍特·弗雷夫里 , 扎伊德·阿利亚费艾 , 马南·戴伊 , 安德里亚·桑蒂利 , 孙志清(音) , 斯鲁利克·本·达维德 , 徐灿文 , Gunjan Chhablani公司 , 韩旺 , 杰森·艾伦·弗里斯 , 玛格德·赛义德·阿尔沙巴尼 , 沙尼亚·夏尔马 , 乌尔米什·塔克尔 , 哈立德·阿穆巴拉克 , 香乳汤 , 迈克·田建江 , 亚历山大·拉什 :
PromptSource:用于自然语言提示的集成开发环境和存储库。 CoRR公司 abs/2202.01279 ( 2022 ) 【i15】 亨德里克·斯特罗贝尔 , 阿尔伯特·韦伯森 , 维克托·桑 , 本杰明·胡佛 , 约翰娜·拜尔 , 汉斯彼得·普菲斯特 , 亚历山大·拉什 :
交互式可视化提示工程,用于大型语言模型的即席任务适应。 CoRR公司 abs/2208.07852 ( 2022 ) [第14条] 特文·勒斯卡奥 , 托马斯·王 , 丹尼尔·赫斯洛 , 露西尔·索尔尼尔 , 斯塔斯·贝克曼 , 塞福尔·巴里先生 , 斯特拉·拜德曼 , 哈迪·埃尔萨哈尔 , 尼古拉斯·穆尼霍夫 , 贾森·彭 , Ofir出版社 , 科林·拉斐尔 , 维克托·桑 , 盛申(Sheng Shen) , 临塘苏塔威卡 , Jaesung Tae公司 , 郑新勇 , 朱利安·拉奈 , 伊兹·贝尔塔基 :
如果你有一百万个GPU小时,要训练什么语言模型? CoRR公司 abs/2210.15424 ( 2022 ) [i13] 特文·勒斯卡奥 , 安吉拉·范 , 克里斯托弗·阿基基 , 埃利·帕夫利克 , 苏珊娜·伊利奇 , 丹尼尔·赫斯洛 , 罗曼·卡斯塔尼 , 亚历山德拉·萨沙·卢奇奥尼 , 弗朗索瓦·伊冯 , 马蒂亚斯·加莱 , 乔纳森·托夫 , 亚历山大·拉什 , 斯特拉·拜德曼 , 阿尔伯特·韦伯森 , 帕万·萨桑卡·阿曼纳曼奇 , 托马斯·王 , 贝诺西翁 , 尼古拉斯·穆尼霍夫 , 阿尔伯特·维拉诺娃道德 , Olatunji Ruwase公司 , 雷切尔·巴登 , 斯塔斯·贝克曼 , 安吉丽娜·麦克米兰(Angelina McMillan-Major) , 伊兹·贝尔塔基 , 胡阮 , 露西尔·索尔尼尔 , 萨姆森·谭 , 佩德罗·奥尔蒂斯·苏亚雷斯 , 维克托·桑 , 雨果·劳伦松 , 亚辛·杰尼特 , 朱利安·拉奈 , 玛格丽特·米切尔 , 科林·拉斐尔 , 亚伦·戈卡斯兰 , 阿迪·西米 , 艾托·索罗亚 , 阿尔哈姆·菲克里·阿吉 , 阿米特·阿尔法西 , 安娜·罗杰斯 , 阿里尔·克雷斯贝格·尼扎夫 , 徐灿文 , 牟成浩 , 克里斯·埃梅祖 , 克里斯托弗·克拉姆 , 柯林·梁朝伟(Colin Leong) , 丹尼尔·范·斯特林 , 大卫·伊菲奥卢瓦·阿德拉尼 , 等。 :
BLOOM:176B参数开放访问多语言模型。 CoRR公司 abs/2211.05100 ( 2022 ) 2021 【c9】 昆廷·霍斯特 , 阿尔伯特·维拉诺娃道德 , 亚辛·杰尼特 , Abhishek Thakur公司 , 帕特里克·冯·普拉滕 , 苏拉杰·帕蒂尔 , 朱利安·乔蒙德 , 玛丽亚玛·德雷姆 , 朱利安·布鲁 , 刘易斯·汤斯顿 , 乔·戴维森 , 马里奥·萨斯科 , Gunjan Chhablani公司 , 巴维维亚·马利克 , 西蒙·布兰迪斯 , 特文·勒斯卡奥 , 维克托·桑 , 徐灿文 , 尼古拉斯·帕特里 , 安吉丽娜·麦克米兰(Angelina McMillan-Major) , 菲利普·施密德 , 西尔万·古格 , Clément Delangue公司 , 塞奥·马图西埃 , Lysandre首次亮相 , 斯塔斯·贝克曼 , 皮尔里克·西斯塔斯 , 蒂鲍特·戈林格 , 维克托·穆斯塔 , 弗朗索瓦·拉古纳斯 , 亚历山大·拉什 , 托马斯·沃尔夫 :
数据集:自然语言处理社区库。 EMNLP(演示) 2021 : 175-184 【c8】 Prasetya Ajie Utama公司 , Nafise萨达特·穆萨维 , 维克托·桑 , 艾丽娜·古列维奇 :
在基于少快照提示的微调中避免推理启发。 EMNLP(1) 2021 : 9063-9074 【c7】 弗朗索瓦·拉古纳斯 , 埃拉·查莱克斯 , 维克托·桑 , 亚历山大·拉什 :
为更快的变形金刚进行区块修剪。 EMNLP(1) 2021 : 10619-10629 【c6】 维克托·桑 , 托马斯·沃尔夫 , 约纳坦·贝林科夫 , 亚历山大·拉什 :
从他人的错误中学习:避免数据集偏差,而不进行建模。 ICLR公司 2021 【c5】 蒂埃里·坦贝 , 科尔曼·霍珀 , 莉莲五旬节 , 天宇佳 , 恩于阳 , 马可·多纳托 , 维克托·桑 , 保罗·N·沃特莫 , 亚历山大·拉什 , 大卫·布鲁克斯 , 顾延伟 :
EdgeBERT:针对潜伏期感知多任务NLP推理的句子级能量优化。 微型的 2021 : 830-844 【c4】 维克托·桑 , 亚历山大·拉什 :
通过查找子网络进行低复杂度探测。 NAACL-HLT公司 2021 : 960-966 [i12] 史蒂文·曹 , 维克托·桑 , 亚历山大·拉什 :
通过查找子网络进行低复杂度探测。 CoRR公司 abs/2104.03514 ( 2021 ) [i11] 昆廷·霍斯特 , 阿尔伯特·维拉诺娃道德 , 亚辛·杰尼特 , Abhishek Thakur公司 , 帕特里克·冯·普拉滕 , 苏拉杰·帕蒂尔 , 朱利安·乔蒙德 , 玛丽亚玛·德雷姆 , 朱利安·布鲁 , 刘易斯·汤斯顿 , 乔·戴维森 , 马里奥·萨斯科 , Gunjan Chhablani公司 , 巴维维亚·马利克 , 西蒙·布兰迪斯 , 特文·勒斯卡奥 , 维克托·桑 , 徐灿文 , 尼古拉斯·帕特里 , 安吉丽娜·麦克米兰(Angelina McMillan-Major) , 菲利普·施密德 , 西尔万·古格 , 克莱门·德拉古埃 , 塞奥·马图西埃 , Lysandre首次亮相 , 斯塔斯·贝克曼 , 皮尔里克·西斯塔斯 , 蒂鲍特·戈林格 , 维克托·穆斯塔 , 弗朗索瓦·拉古纳斯 , 亚历山大·拉什 , 托马斯·沃尔夫 :
数据集:自然语言处理社区库。 CoRR公司 abs/2109.02846 ( 2021 ) [i10] Prasetya Ajie Utama公司 , 纳菲斯·萨达特·穆萨维 , 维克托·桑 , 艾丽娜·古列维奇 :
在基于少快照提示的微调中避免推理启发。 CoRR公司 abs/2109.04144 ( 2021 ) [第九章] 弗朗索瓦·拉古纳斯 , 埃拉·查莱克斯 , 维克托·桑 , 亚历山大·拉什 :
为更快的变形金刚进行区块修剪。 CoRR公司 abs/2109.04838 ( 2021 ) [i8] 维克托·桑 , 阿尔伯特·韦伯森 , 科林·拉斐尔 , 斯蒂芬·H·巴赫 , 临塘苏塔威卡 , 扎伊德·阿利亚费艾 , 安托万·查芬 , 阿诺德·施蒂格勒 , 特文·勒斯卡奥 , 阿伦·拉贾 , 马南·戴伊 , 塞福尔·巴里先生 , 徐灿文 , 乌尔米什·塔克尔 , 沙尼亚·夏尔马 , 伊丽莎·什切希拉(Eliza Szczechla) , 泰文·金 , Gunjan Chhablani公司 , 尼哈尔V.纳亚克 , 德巴吉奥蒂·达塔 , 张洋洋 , 迈克·田建江 , 韩旺 , 马蒂奥·马尼卡 , 盛申(Sheng Shen) , 郑新勇 , 哈拉什·潘迪 , 雷切尔·巴登 , 托马斯·王 , 特里沙拉·内拉吉 , 乔斯·罗森 , 阿比希特·夏尔马 , 安德里亚·桑蒂利 , 蒂鲍特·弗雷夫里 , 杰森·艾伦·弗里斯 , 瑞恩·蒂恩 , 斯特拉·拜德曼 , 高里奥 , 泰利·贝尔斯 , 托马斯·沃尔夫 , 亚历山大·拉什 :
多任务提示训练支持零炮任务泛化。 CoRR公司 abs/2110.08207 ( 2021 ) 2020 【c3】 托马斯·沃尔夫 , Lysandre首次亮相 , 维克托·桑 , 朱利安·乔蒙德 , 克莱门·德拉古埃 , 安东尼·莫伊 , 皮尔里克·西斯塔斯 , 蒂姆·劳尔 , 雷米·卢夫 , Morgan Funtowicz公司 , 乔·戴维森 , 萨姆·什利弗 , 帕特里克·冯·普拉滕 , 克拉拉·马 , 亚辛·杰尼特 , 朱利安·布鲁 , 徐灿文 , 特文·勒斯卡奥 , 西尔万·古格 , 玛丽亚玛·德拉姆 , 昆廷·霍斯特 , 亚历山大·拉什 :
变形金刚:最先进的自然语言处理。 EMNLP(演示) 2020 : 38-45 【c2】 维克托·桑 , 托马斯·沃尔夫 , 亚历山大·拉什 :
运动修剪:精细调整的自适应稀疏性。 NeurIPS公司 2020 [i7] 维克托·桑 , 托马斯·沃尔夫 , 亚历山大·拉什 :
运动修剪:精细调整的自适应稀疏性。 CoRR公司 abs/2005.07683 ( 2020 ) [i6] 蒂埃里·坦贝 , 科尔曼·霍珀 , 莉莲五旬节 , 恩于阳 , 马可·多纳托 , 维克托·桑 , 亚历山大·拉什 , 大卫·布鲁克斯 , 顾延伟 :
EdgeBERT:优化多任务NLP的片上推理。 CoRR公司 abs/2011.14203 ( 2020 ) [i5] 维克托·桑 , 托马斯·沃尔夫 , 约纳坦·贝林科夫 , 亚历山大·拉什 :
从他人的错误中学习:避免数据集偏差,而不进行建模。 CoRR公司 abs/2012.01300 ( 2020 )
2010 – 2019
2019 【c1】 维克托·桑 , 托马斯·沃尔夫 , 塞巴斯蒂安·鲁德 :
从语义任务中学习嵌入的分层多任务方法。 AAAI公司 2019 : 6949-6956 [i4] 托马斯·沃尔夫 , 维克托·桑 , 朱利安·乔蒙德 , 克莱门·德拉古埃 :
TransferTransfo:一种基于神经网络的会话主体的迁移学习方法。 CoRR公司 abs/1901.08149 ( 2019 ) [i3] 维克托·桑 , Lysandre首次亮相 , 朱利安·乔蒙德 , 托马斯·沃尔夫 :
DistilBERT,BERT的蒸馏版本:更小、更快、更便宜、更轻。 CoRR公司 abs/1910.01108 ( 2019 ) [i2] 托马斯·沃尔夫 , Lysandre首次亮相 , 维克托·桑 , 朱利安·乔蒙德 , 克莱门·德拉古埃 , 安东尼·莫伊 , 皮尔里克·西斯塔斯 , 蒂姆·劳尔 , 雷米·卢夫 , 摩根·芬托维奇 , 杰米·布鲁 :
HuggingFace的变形金刚:最先进的自然语言处理。 CoRR公司 abs/1910.03771 ( 2019 ) 2018 [i1] 维克托·桑 , 托马斯·沃尔夫 , 塞巴斯蒂安·鲁德 :
从语义任务中学习嵌入的分层多任务方法。 CoRR公司 abs/1811.06031 ( 2018 )