皮埃尔·里奇蒙
人员信息
其他同名人员
优化列表
![笔记](https://dblp.uni-trier.de/img/note-mark.dark.12x12.png)
2020年–今天
2024 [i18] 汤云浩 , 赵汉·丹尼尔·郭 , 郑泽宇 , 丹尼尔·卡兰德里洛 , 雷米·穆诺斯 , 马克·罗兰 , 皮埃尔·哈维·里奇蒙 , 米查尔·瓦尔科 , 贝尔纳多·阿维拉·皮雷斯 , 比拉尔·皮奥 :
广义偏好优化:离线校准的统一方法。 CoRR公司 abs/2402.05749 ( 2024 ) [i17] 丹尼尔·卡兰德里洛 , 丹尼尔·郭 , 雷米·穆诺斯 , 马克·罗兰 , 汤云浩 , 贝尔纳多·阿维拉·皮雷斯 , 皮埃尔·哈维·里奇蒙 , 查林·勒兰 , 米查尔·瓦尔科 , 刘天琦 , 里沙布·乔希 , 郑泽瑜 , 比拉尔·皮奥 :
通过在线偏好优化实现大型语言模型的人工对齐。 CoRR公司 abs/2403.08635 ( 2024 ) [i16] SIMA团队 , 玛丽亚·阿比·拉德 , 阿伦·阿胡贾 , 卡塔琳娜·巴罗斯 , 弗雷德里克·贝塞 , 博尔特 , 阿德里安·博尔顿 , 贝萨尼·布朗菲尔德 , 加文·布蒂莫尔 , 最大铁路超高 , 莎拉·查卡拉 , 斯蒂芬妮·C.Y.·陈 , 杰夫·克莱恩 , 阿德里安·科利斯特 , 维基·科普曼 , 亚历克斯·卡卢姆 , Ishita Dasgupta公司 , 达里奥·德·塞萨尔 , 朱莉娅·迪·特拉帕尼 , 亚尼·唐切夫 , 艾玛·邓利维 , 马丁·恩格尔克 , 瑞恩·福克纳 , 弗兰基·加西亚 , 查尔斯·巴达莫西 , 龚志涛 , 露西·冈萨雷斯 , 克什蒂吉·古普塔 , 卡罗尔·格雷戈 , 阿恩·奥拉夫·哈林斯塔德 , 蒂姆·哈雷 , 萨姆·哈夫斯 , 费利克斯·希尔 , 埃德·赫斯特 , 德鲁·A·哈德森 , 乔尼·哈德森 , 斯蒂夫·休斯·菲特 , 丹尼尔·雷泽德 , 米米·贾萨列维奇 , 劳拉·坎皮斯 , 南·罗斯玛丽·科 , 托马斯·凯克 , 金俊庆(Junkyung Kim) , 奥斯卡·克纳格 , 卡维亚·科帕拉普 , 安德鲁·兰皮宁 , 谢恩·莱格 , 亚历山大·勒克纳 , 马乔丽·利蒙特 , 刘玉兰 , 玛丽亚·洛克斯·汤普森 , 约瑟夫·马里诺 , 凯瑟琳·马丁·库森 , 洛伊克·马特(Loic Matthey) , Siobhan Mcloughlin公司 , 皮尔玛丽亚·门多利奇奥 , 哈姆扎·梅尔齐克 , 安娜·米滕科娃 , 亚历山大·穆法雷克 , 瓦莱里亚·奥利维拉 , 扬科·吉塔希·奥利维拉 , 汉娜·Openshaw , 潘仁科 , 阿内什·帕普 , 亚历克斯·普拉托诺夫 , 奥利·珀基斯 , David P.Reichert(大卫·雷切尔) , 约翰·里德 , 皮埃尔·哈维·里奇蒙 , 泰森-罗伯茨 , 贾尔斯·鲁斯科 , 杰姆·桑切斯·埃利亚斯 , 塔沙·桑德斯 , 丹尼尔·索耶 , 蒂姆·斯科尔斯 , 盖·西蒙斯 , 丹尼尔·斯莱特 , 休伯特·索耶 , 海科·斯特拉赫曼 , 彼得·斯特斯 , Allison C.Tam公司 , 丹尼斯·特普利亚辛 , 泰富·特尔齐 , 大卫·维切利 , 博扬·武贾托维奇 , 马库斯·温赖特 , 简·X·王 , 王正东 , Daan Wierstra公司 , 邓肯·威廉姆斯 , 纳撒尼尔·王 , 莎拉·约克 , 尼克杨 :
在许多模拟世界中扩展可指导代理。 CoRR公司 abs/2404.10179 ( 2024 ) 2023 【c6】 马特科·博斯尼亚克 , 皮埃尔·哈维·里奇蒙 , 内纳德·托马塞夫 , 弗洛里安·斯特鲁布 , 雅各布·C·沃克 , 费利克斯·希尔 , 拉尔斯·霍尔格·布兴 , 拉兹万·帕斯卡努 , 查尔斯·布伦德尔 , 约瓦娜·米特罗维奇 :
SemPPL:预测伪标签以获得更好的对比表示。 ICLR公司 2023 【c5】 皮埃尔·哈维·里奇蒙 , Allison C.Tam公司 , 汤云浩 , 弗洛里安·斯特鲁布 , 比拉尔·皮奥特 , 费利克斯·希尔 :
正交性的边缘:BYOL勾选原因的简单视图。 ICML公司 2023 : 29063-29081 【c4】 汤云浩 , 赵汉·丹尼尔·郭 , 皮埃尔·哈维·里奇蒙 , 贝尔纳多·阿维拉·皮雷斯 , 亚什·昌达克 , 雷米·穆诺斯 , 马克·罗兰 , 穆罕默德·盖什拉吉·阿扎尔 , 查林·勒兰 , 克莱尔·莱尔 , 安德烈斯·吉尔吉 , Shantanu Thakoor公司 , 威尔·达布尼 , 比拉尔·皮奥特 , 丹尼尔·卡兰德里洛 , 米查尔·瓦尔科 :
理解强化学习的自我预测学习。 ICML公司 2023 : 33632-33656 【i15】 马特科·博斯尼亚克 , 皮埃尔·里奇蒙 , 内纳德·托马塞夫 , 弗洛里安·斯特鲁布 , 雅各布·C·沃克 , 费利克斯·希尔 , 拉尔斯·霍尔格·布兴 , 拉兹万·帕斯卡努 , 查尔斯·布伦德尔 , 约瓦娜·米特罗维奇 :
SemPPL:预测伪标签以获得更好的对比表示。 CoRR公司 abs/2301.05158 ( 2023 ) [第14条] 皮埃尔·里奇蒙 , Allison C.Tam公司 , 汤云浩 , 弗洛里安·斯特鲁布 , 比拉尔·皮奥 , 费利克斯·希尔 :
正交性的边缘:BYOL勾选原因的简单视图。 CoRR公司 abs/2302.04817 ( 2023 ) 2022 【c3】 斯蒂芬妮·C.Y.·陈 , 安德鲁·凯尔·兰皮宁 , 皮埃尔·哈维·里奇蒙 , 费利克斯·希尔 :
强化学习的Zipfian环境。 科拉斯 2022 : 406-429 【c2】 斯蒂芬妮·C.Y.·陈 , 亚当·桑托罗 , 安德鲁·兰皮宁 , 简·X·王 , 亚迪亚·辛格 , 皮埃尔·里奇蒙 , 詹姆斯·L·麦克莱兰 , 费利克斯·希尔 :
数据分布特性推动了《变形金刚》中的即时上下文学习。 NeurIPS公司 2022 [i13] 斯蒂芬妮·C.Y.·陈 , 安德鲁·兰皮宁 , 皮埃尔·里奇蒙 , 费利克斯·希尔 :
强化学习的Zipfian环境。 CoRR公司 abs/2203.08222 ( 2022 ) [i12] 斯蒂芬妮·C.Y.·陈 , 亚当·桑托罗 , 安德鲁·兰皮宁 , 简·X·王 , 亚迪亚·辛格 , 皮埃尔·里奇蒙 , 杰伊·麦克莱兰 , 费利克斯·希尔 :
数据分布特性推动了《变形金刚》中的即时上下文学习。 CoRR公司 腹肌/2205.05055 ( 2022 ) [i11] 皮埃尔·里奇蒙 , 桑德·迪尔曼 , 阿诺·杜塞特 :
具有单纯形扩散的分类SDE。 CoRR公司 abs/2210.14784 ( 2022 ) [i10] 桑德·迪尔曼 , 劳伦特·萨特兰 , 阿尔曼·罗斯哈奈 , 尼古拉·萨维诺夫 , 雅罗斯拉夫·加宁 , 皮埃尔·里奇蒙 , 阿诺·杜塞特 , 罗宾·斯特鲁德尔 , 克里斯·戴尔 , 科诺·杜尔坎 , 柯蒂斯·霍桑 , 雷米·勒布朗德 , 威尔·格雷斯沃尔 , 乔纳斯·阿德勒 :
分类数据的连续扩散。 CoRR公司 腹肌/2211.15089 ( 2022 ) [第九章] 汤云浩 , 赵汉·丹尼尔·郭 , 皮埃尔·哈维·里奇蒙 , 贝尔纳多·阿维拉·皮雷斯 , 亚什·昌达克 , 雷米·穆诺斯 , 马克·罗兰 , 穆罕默德·盖什拉希·阿扎尔 , 查林·勒兰 , 克莱尔·莱尔 , 安德烈斯·吉尔吉 , Shantanu Thakoor公司 , 威尔·达布尼 , 比拉尔·皮奥 , 丹尼尔·卡兰德里洛 , 米查尔·瓦尔科 :
了解自我预测学习以强化学习。 CoRR公司 abs/2212.03319 ( 2022 ) 2020 【c1】 Jean-Bastien烧烤 , 弗洛里安·斯特鲁布 , 佛罗伦特·阿尔奇 , 科伦蒂·塔莱克 , 皮埃尔·里奇蒙 , 埃琳娜·布恰茨卡娅 , 卡尔·多尔施 , 贝尔纳多·阿维拉·皮雷斯 , 赵汉国 , 穆罕默德·盖什拉希·阿扎尔 , 比拉尔·皮奥 , 科雷·卡武科格鲁 , 雷米·穆诺斯 , 米查尔·瓦尔科 :
引导你自己的潜能-一种自我监督学习的新方法。 NeurIPS公司 2020 [i8] Jean-Bastien烧烤 , 弗洛里安·斯特鲁布 , 佛罗伦特·阿尔奇 , 科伦蒂·塔莱克 , 皮埃尔·H·历峰 , 埃琳娜·布恰茨卡娅 , 卡尔·多尔施 , 贝尔纳多·阿维拉·皮雷斯 , 赵汉·丹尼尔·郭 , 穆罕默德·盖什拉希·阿扎尔 , 比拉尔·皮奥 , 科雷·卡武科格鲁 , 雷米·穆诺斯 , 米查尔·瓦尔科 :
引导自己的潜能:一种自我监督学习的新方法。 CoRR公司 abs/2006.07733 ( 2020 ) [i7] 皮埃尔·里奇蒙 , Jean-Bastien烧烤 , 佛罗伦特·阿尔奇 , 科伦蒂·塔莱克 , 弗洛里安·斯特鲁布 , 安德鲁·布洛克 , 塞缪尔·史密斯 , Soham De公司 , 拉兹万·帕斯卡努 , 比拉尔·皮奥 , 米查尔·瓦尔科 :
即使没有批次统计数据,BYOL也能正常工作。 CoRR公司 abs/2010.10241 ( 2020 )
2010 – 2019
2019 [i6] 皮埃尔·里奇蒙 , 郭一科 :
将学习速率衰减和权重衰减与复杂度梯度下降相结合。 CoRR公司 abs/1902.02881 ( 2019 ) [i5] 皮埃尔·里奇蒙 , 郭一科 :
静态激活函数规范化。 CoRR公司 abs/1905.01369 ( 2019 ) [i4] 皮埃尔·里奇蒙 , Arinbjörn Kolbeinsson公司 , 郭一科 :
以生物为灵感的架构,可实现高效的深度强化学习。 CoRR公司 abs/1911.11285 ( 2019 ) 2017 [i3] 布伦丹·马金尼斯 , 皮埃尔·里奇蒙 :
使用“经常性折扣关注”单元有效地关注连续数据。 CoRR公司 abs/1705.08480 ( 2017 ) [i2] 皮埃尔·里奇蒙 , 布伦丹·马金尼斯 :
关于Wasserstein强化学习和Fokker-Planck方程。 CoRR公司 abs/1712.07185 ( 2017 ) [i1] 皮埃尔·里奇蒙 , 布伦丹·马金尼斯 :
策略梯度和软Q学习等价性的简短变分证明。 CoRR公司 abs/1712.08650 ( 2017 )
合著者索引
![](https://dblp.uni-trier.de/img/cog.dark.24x24.png)