Jean-Baptiste Lespiau女士
人员信息
优化列表
2020年–今天
2024 [第14条] 托马斯·梅斯纳德 , 卡西迪·哈丁 , 罗伯特·达达西 , 苏里亚·布帕蒂拉朱 , Shreya Pathak先生 , 劳伦特·西弗雷 , Morgane Rivière公司 , Mihir Sanjay Kale先生 , 朱丽叶的爱 , 波亚·塔夫蒂 , 莱昂纳德·侯赛诺 , Aakanksha Chowdhery公司 , 亚当·罗伯茨 , 阿迪蒂亚·巴鲁阿 , 亚历克斯·博特夫 , 亚历克斯·卡斯特罗·罗斯 , 安布罗斯·斯隆 , Amélie Héliou , 安德烈亚·塔切蒂 , 安娜·布拉诺娃 , 安东尼娅·帕特森 , 贝思·蔡 , 博巴克·沙里亚里 , 查林·勒兰 , 克里斯托弗·乔奎特(Christopher A.Choquette-Choo) , Clément奶油蛋糕 , 丹尼尔·塞尔 , 达芙妮·伊波利托 , 魏明智 , 埃琳娜·布恰茨卡娅 , 埃里克·尼 , 埃里克·诺兰 , 耿燕 , 乔治·塔克 , 乔治·克里斯蒂安·穆拉鲁 , 格里戈里·罗日德斯特文斯基 , Henryk Michalewski , 伊恩·坦尼 , 伊万·格里什琴科 , 杰克·奥斯汀 , 詹姆斯·基林 , 简·拉巴诺夫斯基 , Jean-Baptiste Lespiau女士 , 杰夫·斯坦威 , 珍妮·布伦南 , 杰里米·陈 , 约翰·费雷特 , 贾斯汀·邱 , 等。 以下为:
Gemma:基于Gemini研究和技术的开放模型。 CoRR公司 abs/2403.08295 ( 2024 ) 2023 [j1] 丹尼尔·曼科维茨 , 安德烈亚·米奇 , 安东·哲尔诺夫 , 马可·盖尔米 , 马可·塞尔维 , 科斯敏·帕杜拉鲁 , 爱德华·勒伦特 , 谢里克·伊克巴尔 , Jean-Baptiste Lespiau女士 , 亚历克斯·埃亨 , 托马斯·科普 , 凯文·米利金 , 斯蒂芬·加夫尼 , 索菲·埃尔斯特 , 杰克逊·布洛舍 , 克里斯·甘布尔 , 基兰米兰 , 罗伯特·董 , 黄敏杰 , A.塔兰·杰吉尔 , 穆罕默德·巴雷卡坦 , 李宇佳 , 阿莫尔·曼德哈内 , 托马斯·休伯特 , 朱利安·施里特维瑟 , 哈萨比斯 , Pushmet Kohli公司 , 马丁·里德米勒 , Oriol葡萄酒 , 大卫·西尔弗 以下为:
使用深度强化学习发现的更快的排序算法。 国家。 618 ( 7964 ) 以下为: 257-263 ( 2023 ) [i13] 赵开方 , 塞巴斯蒂安·博尔盖乌德 , 杰弗里·欧文 , Jean-Baptiste Lespiau女士 , 劳伦特·西弗雷 , 空军参谋长约翰·江珀 以下为:
使用推测采样加速大型语言模型解码。 CoRR公司 abs/2302.01318 ( 2023 ) [i12] 南·罗斯玛丽·科 , 萨拉·简·邓恩 , Jörg Bornschein先生 , 西尔维娅·奇亚帕 , 梅兰妮·雷伊 , Jean-Baptiste Lespiau女士 , 阿尔宾·卡西尔 , 简·X·王 , 西奥芬妮·韦伯 , 大卫·G·T·巴雷特 , 马修·博特维尼克 , 阿尼鲁德·戈亚尔 , 迈克尔·莫泽 , 丹尼尔·雷泽德 以下为:
DiscoGen:学习发现基因调控网络。 CoRR公司 abs/2304.05823 ( 2023 ) 2022 【c7】 塞巴斯蒂安·博尔盖乌德 , 阿瑟·门施 , 乔丹·霍夫曼 , 特雷弗·蔡 , 伊丽莎·卢瑟福 , 凯蒂·米利肯 , 乔治·范·登·德里斯(George van den Driessche) , Jean-Baptiste Lespiau女士 , 博格丹·达莫克 , 艾丹·克拉克 , 迭戈·德·拉斯·卡斯 , 奥雷莉亚·盖伊 , 雅各布·梅尼克 , 罗马戒指 , 汤姆·亨尼根 , 藏红花黄 , 洛伦·马焦尔 , 克里斯·琼斯 , 阿尔宾·卡西尔 , 柏安地 , 米歇拉·帕格尼尼 , 杰弗里·欧文 , Oriol葡萄酒 , 西蒙·奥斯宾多 , 凯伦·西蒙扬 , 杰克·W·雷 , 埃里希·埃尔森 , 劳伦特·西弗雷 以下为:
通过检索万亿标记改进语言模型。 ICML公司 2022 以下为: 2206-2240 [i11] 朱利安·佩罗拉 , 巴特·德·维尔德 , 丹尼尔·海恩斯 , 尤金·塔拉索夫 , 弗洛里安·斯特鲁布 , 文森特·德·波尔 , 保罗·穆勒 , 杰罗姆·康纳 , 尼尔·伯奇 , 托马斯·安东尼 , 斯蒂芬·麦卡勒 , 罗穆尔·伊利 , 莎拉·岑 , 王哲(Zhe Wang) , Audrunas Gruslys公司 , 亚历克桑德拉·马利舍娃 , 米纳·汗 , 谢尔吉尔·奥扎尔 , 芬巴尔木材 , 托比·波伦 , 汤姆·埃克尔斯 , 马克·罗兰 , 马克·兰科特 , Jean-Baptiste Lespiau女士 , 比拉尔·皮奥 , Shayegan奥米德沙菲 , 爱德华·洛克哈特 , 劳伦特·西弗雷 , Nathalie Beauguerlange公司 , 雷米·穆诺斯 , 大卫·西尔弗 , 萨汀德·辛格 , 哈萨比斯 , 卡尔·图尔斯 以下为:
通过无模型多智能体强化学习掌握Stratego游戏。 CoRR公司 abs/2206.15378 ( 2022 ) 2021 【c6】 雷米·勒布朗德 , Jean-Baptiste Alayrac公司 , 劳伦特·西弗雷 , Miruna双鱼座 , Jean-Baptiste Lespiau女士 , Ioannis Antonoglou公司 , 凯伦·西蒙扬 , Oriol葡萄酒 以下为:
超越波束搜索的机器翻译解码。 EMNLP(1) 2021 以下为: 8410-8434 【c5】 朱利安·佩罗拉 , 雷米·穆诺斯 , Jean-Baptiste Lespiau女士 , 沙耶根·奥米德沙维埃 , 马克·罗兰 , 佩德罗·奥尔特加 , 尼尔·伯奇 , 托马斯·安东尼 , 大卫·巴尔杜齐 , 巴特·德·维尔德 , 乔治·皮里奥拉斯 , 马克·兰科特 , 卡尔·图伊斯 以下为:
从Poincaré递归到不完全信息博弈中的收敛:通过正则化找到均衡。 ICML公司 2021 以下为: 8525-8535 [i10] 雷米·勒布朗德 , Jean-Baptiste Alayrac公司 , 劳伦特·西弗雷 , Miruna双鱼座 , Jean-Baptiste Lespiau女士 , Ioannis Antonoglou公司 , 凯伦·西蒙扬 , Oriol葡萄酒 以下为:
超越波束搜索的机器翻译解码。 CoRR公司 abs/2104.05336 ( 2021 ) [第九章] 塞巴斯蒂安·博尔盖乌德 , 阿瑟·门施 , 乔丹·霍夫曼 , 特雷弗·蔡 , 伊丽莎·卢瑟福 , 凯蒂·米利肯 , 乔治·范·登·德里斯(George van den Driessche) , Jean-Baptiste Lespiau女士 , 博格丹·达莫克 , 艾丹·克拉克 , 迭戈·德·拉斯·卡斯 , 奥雷莉亚·盖伊 , 雅各布·梅尼克 , 罗马戒指 , 汤姆·亨尼根 , 藏红花黄 , 洛伦·马焦尔 , 克里斯·琼斯 , 阿尔宾·卡西尔 , 柏安地 , 米歇拉·帕格尼尼 , 杰弗里·欧文 , Oriol葡萄酒 , 西蒙·奥斯宾多 , 凯伦·西蒙扬 , 杰克·W·雷 , 埃里希·埃尔森 , 劳伦特·西弗雷 以下为:
通过从数万亿个令牌中检索来改进语言模型。 CoRR公司 abs/2112.04426 ( 2021 ) [i8] 杰克·W·雷 , 塞巴斯蒂安·博尔盖乌德 , 特雷弗·蔡 , 凯蒂·米利肯 , 乔丹·霍夫曼 , H.弗朗西斯·宋 , 约翰·阿斯兰尼德斯 , 萨拉亨德森 , 罗马戒指 , 苏珊娜·杨 , 伊丽莎·卢瑟福 , 汤姆·亨尼根 , 雅各布·梅尼克 , 阿尔宾·卡西尔 , 鲍威尔 , 乔治·范·登·德里斯(George van den Driessche) , 丽莎·安妮·亨德里克斯 , 玛丽贝斯·劳赫 , 黄伯森 , 阿米莉亚·格莱斯 , 约翰内斯·韦尔布尔 , 苏曼特·达塔赫里 , 藏红花黄 , 乔纳森·尤萨托 , 约翰·梅勒 , 伊琳娜·希金斯 , 安东尼娅·克雷斯韦尔 , 纳特·麦克莱塞 , 艾米·吴 , 埃里希·埃尔森 , Siddhant M.Jayakumar先生 , 埃琳娜·布恰茨卡娅 , 大卫·布登 , 埃斯梅·萨瑟兰 , 凯伦·西蒙扬 , 米歇拉·帕格尼尼 , 劳伦特·西弗雷 , 莉娜·马滕斯 , 李向洛林 , Adhiguna Kuncoro公司 , 艾达·内马扎德 , 埃琳娜·格里博夫斯卡娅 , 多梅尼克·多纳托 , 安吉利基·拉扎里杜 , 阿瑟·门施 , Jean-Baptiste Lespiau女士 , 玛丽亚·齐姆波基利 , 尼古拉·格里戈列夫 , 道格·弗里茨 , Thibault Sottiaux公司 , 曼塔斯·帕贾斯卡斯 , 托比·波伦 , 龚志涛 , 丹尼尔·富山 , Cyprien de Masson d'Autume公司 , 李宇佳 , 泰富·特尔齐 , 弗拉基米尔·米库利克 , 伊戈尔·巴布什金 , 艾丹·克拉克 , 迭戈·德·拉斯·卡斯 , 奥雷莉亚·盖伊 , 克里斯·琼斯 , 詹姆斯·布拉德伯里 , 马修·约翰逊 , 布莱克·赫奇曼 , 劳拉·魏丁格 , 艾森·加布里埃尔 , 艾萨克 , 爱德华·洛克哈特 , 西蒙·奥斯宾多 , 劳拉·里梅尔 , 克里斯·戴尔 , Oriol葡萄酒 , 卡里姆·阿尤布 , 杰夫·斯坦威 , 洛雷恩·贝内特 , 哈萨比斯 , 科雷·卡武科格鲁 , 杰弗里·欧文 以下为:
缩放语言模型:来自训练地鼠的方法、分析和见解。 CoRR公司 abs/2112.11446 ( 2021 ) 2020 【c4】 丹尼尔·海恩斯 , 达斯汀·莫里尔 , 沙耶根·奥米德沙维埃 , 雷米·穆诺斯 , 朱利安·佩罗拉 , 马克·兰科特 , Audrunas Gruslys公司 , Jean-Baptiste Lespiau女士 , 帕沃·帕尔马斯 , 埃德加·杜涅兹·古斯曼 , 卡尔·图尔斯 以下为:
神经复制动力学:通过对冲政策梯度的多智能体学习。 美国原子能机构 2020 以下为: 492-501 [c3] 雷米·穆诺斯 , 朱利安·佩罗拉 , Jean-Baptiste Lespiau女士 , 马克·罗兰 , 巴特·德·维尔德 , 马克·兰科特 , 芬巴尔木材 , 丹尼尔·海恩斯 , 沙耶根·奥米德沙维埃 , Audrunas Gruslys公司 , 穆罕默德·盖什拉希·阿扎尔 , 爱德华·洛克哈特 , 卡尔·图尔斯 以下为:
不完全信息博弈中纳什均衡的快速计算。 ICML公司 2020 以下为: 7119-7129 [i7] 朱利安·佩罗拉 , 雷米·穆诺斯 , Jean-Baptiste Lespiau女士 , 沙耶根·奥米德沙维埃 , 马克·罗兰 , 佩德罗·奥尔特加 , 尼尔·伯奇 , 托马斯·安东尼 , 大卫·巴尔杜齐 , 巴特·德·维尔德 , 乔治·皮里奥拉斯 , 马克·兰科特 , 卡尔·图尔斯 以下为:
从Poincaré递归到不完全信息博弈中的收敛:通过正则化找到均衡。 CoRR公司 abs/2002.08456 ( 2020 ) [i6] Audrunas集团 , 马克·兰科特 , 雷米·穆诺斯 , 芬巴尔木材 , 马丁·施密德 , 朱利安·佩罗拉 , 达斯汀·莫里尔 , 维尼希乌斯·弗洛雷斯·赞巴尔迪 , Jean-Baptiste Lespiau女士 , 约翰·舒尔茨 , 穆罕默德·盖什拉希·阿扎尔 , 迈克尔·鲍林 , 卡尔·图尔斯 以下为:
优势后悔匹配演员-关键。 CoRR公司 abs/2008.12234 ( 2020 )
2010 – 2019
2019 【c2】 拉尔斯·布兴 , 西奥芬妮·韦伯 , 尤里·兹沃斯 , 尼古拉斯·希斯 , 塞巴斯蒂安·拉卡尼埃 , 阿瑟·盖兹 , Jean-Baptiste Lespiau女士 以下为:
Woulda、Coulda和Shoulda:反事实导向的政策搜索。 ICLR(海报) 2019 【c1】 爱德华·洛克哈特 , 马克·兰科特 , 朱利安·佩罗拉 , Jean-Baptiste Lespiau女士 , 达斯汀·莫里尔 , 芬巴尔木材 , 卡尔·图尔斯 以下为:
利用可利用性下降计算序贯对抗博弈的近似均衡。 国际JCAI 2019 以下为: 464-470 [i5] Shayegan奥米德沙菲 , 克里斯托斯·帕帕迪米特里奥 , 乔治·皮里奥拉斯 , 卡尔·图尔斯 , 马克·罗兰 , Jean-Baptiste Lespiau女士 , Wojciech M.Czarnecki公司 , 马克·兰科特 , 朱利安·佩罗拉 , 雷米·穆诺斯 以下为:
α-等级:通过进化进行多智能体评估。 CoRR公司 abs/1903.01373 ( 2019 ) [i4] 爱德华·洛克哈特 , 马克·兰科特 , 朱利安·佩罗拉 , Jean-Baptiste Lespiau女士 , 达斯汀·莫里尔 , 芬巴尔木材 , 卡尔·图尔斯 以下为:
利用可利用性下降计算序贯对抗博弈的近似均衡。 CoRR公司 abs/1903.05614 ( 2019 ) [i3] 沙耶根·奥米德沙维埃 , 丹尼尔·海恩斯 , 达斯汀·莫里尔 , 雷米·穆诺斯 , 朱利安·佩罗拉 , 马克·兰科特 , Audrunas Gruslys公司 , Jean-Baptiste Lespiau女士 , 卡尔·图伊斯 以下为:
神经复制动力学。 CoRR公司 abs/1906.00190 ( 2019 ) [i2] 马克·兰科特 , 爱德华·洛克哈特 , Jean-Baptiste Lespiau女士 , 维尼希乌斯·弗洛雷斯·赞巴尔迪 , Satyaki Upadhyay公司 , 朱利安·佩罗拉 , 斯里拉姆·斯里尼瓦桑 , 芬巴尔木材 , 卡尔·图尔斯 , 沙耶根·奥米德沙维埃 , 丹尼尔·海恩斯 , 达斯汀·莫里尔 , 保罗·穆勒 , 蒂莫·埃瓦尔德斯 , 瑞恩·福克纳 , 杰诺斯·克拉马尔 , 巴特·德·维尔德 , 布伦南·塞塔 , 詹姆斯·布拉德伯里 , 大卫·丁 , 塞巴斯蒂安·博尔盖乌德 , 马修·赖 , 朱利安·施里特维瑟 , 托马斯·安东尼 , 爱德华·休斯 , 伊沃·达尼埃尔卡 , 乔纳·瑞安·达维斯 以下为:
OpenSpiel:游戏强化学习框架。 CoRR公司 abs/1908.09453 ( 2019 ) 2018 [i1] 拉尔斯·布兴 , 西奥芬妮·韦伯 , 尤里·兹沃斯 , 塞巴斯蒂安·拉卡尼埃 , 阿瑟·盖兹 , Jean-Baptiste Lespiau女士 , 尼古拉斯·希斯 以下为:
Woulda、Coulda和Shoulda:反事实导向的政策搜索。 CoRR公司 abs/1811.06272 ( 2018 )