托马斯·梅斯纳德
人员信息
优化列表
![笔记](https://dblp.org/img/note-mark.dark.12x12.png)
2020年–今天
2024 [第14条] 郭尚敏 , 张彪 , 刘天林 , 刘天奇 , 米沙·卡尔曼 , 菲利佩·利纳雷斯 , 亚历山大·拉梅 , 托马斯·梅斯纳德 , 姚钊 , 比拉尔·皮奥 , 约翰·费雷特 , 马修·布隆德尔 :
在线人工智能反馈的直接语言模型校准。 CoRR公司 abs/2402.04792 ( 2024 ) [i13] 托马斯·梅斯纳德 , 卡西迪·哈丁 , 罗伯特·达达西 , 苏里亚·布帕蒂拉朱 , 什里娅·帕塔克 , 劳伦特·西弗雷 , Morgane Rivière公司 , Mihir Sanjay Kale先生 , 朱丽叶的爱 , 波亚·塔夫蒂 , 莱昂纳德·侯赛诺 , Aakanksha Chowdhery公司 , 亚当·罗伯茨 , 阿迪蒂亚·巴鲁阿 , 亚历克斯·博特夫 , 亚历克斯·卡斯特罗·罗斯 , 安布罗斯·斯隆 , Amélie Héliou , 安德烈亚·塔切蒂 , 安娜·布拉诺娃 , 安东尼娅·帕特森 , 贝思·蔡 , 博巴克·沙里亚里 , Charline Le Lan女士 , 克里斯托弗·乔奎特(Christopher A.Choquette-Choo) , Clément奶油蛋糕 , 丹尼尔·塞尔 , 达芙妮·伊波利托 , 魏明智 , 埃琳娜·布恰茨卡娅 , 埃里克·尼 , 埃里克·诺兰 , 耿燕 , 乔治·塔克 , 乔治·克里斯蒂安·穆拉鲁 , 格里戈里·罗日德斯特文斯基 , 亨利克·米查勒夫斯基 , 伊恩·坦尼 , 伊万·格里什琴科 , 杰克·奥斯汀 , 詹姆斯·基林 , 简·拉巴诺夫斯基 , 让-巴蒂斯特·莱斯皮奥 , 杰夫·斯坦威 , 珍妮·布伦南 , 杰里米·陈 , 约翰·费雷特 , 贾斯汀·邱 , 等。 :
双子座:基于双子座研究和技术的开放模型。 CoRR公司 abs/2403.08295 ( 2024 ) [i12] 阿列克桑达尔·博特夫 , Soham De公司 , 塞缪尔·史密斯 , 阿努山·费尔南多 , 乔治·克里斯蒂安·穆拉鲁 , 鲁巴·哈伦 , 伦纳德·贝拉达 , 拉兹万·帕斯卡努 , 朱塞佩·塞萨码头 , 罗伯特·达达西 , 莱昂纳德·侯赛诺 , 约翰·费雷特 , 谢尔坦·吉尔金 , 奥利维尔·巴瑟姆 , 亚历克·安德列夫 , 凯萨琳·凯尼利 , 托马斯·梅斯纳德 , 卡西迪·哈丁 , 苏里亚·布帕蒂拉朱 , Shreya Pathak先生 , 劳伦特·西弗雷 , Morgane Rivière公司 , Mihir Sanjay Kale先生 , 朱丽叶的爱 , 波亚·塔夫蒂 , 阿曼德·茹林 , 诺亚·菲德尔 , 埃文·森特 , 陈玉田 , 斯利瓦桑·斯里尼瓦桑 , 纪尧姆·德斯贾丁斯 , 大卫·布登 , 阿诺·杜塞特 , 莎拉·维克兰 , 亚当·帕斯克 , 特雷弗·盖尔 , 塞巴斯蒂安·博尔盖乌德 , 赵开方 , 柏安地 , 安东尼娅·帕特森 , 珍妮·布伦南 , 梅格·里斯达尔 , 拉杰·冈德卢鲁 , 内什·德瓦纳坦 , 保罗·慕尼 , 尼莱·乔汉 , 菲尔·卡利顿 , 路易斯·古斯塔沃·马丁斯 , 伊丽莎·班迪 , 大卫·亨茨佩格 , 格伦·卡梅隆 , 亚瑟·祖克 , 特里斯·沃肯廷 , 卢多维克·佩兰 , 明江 , 邹宾·加拉马尼 , 克莱门·法拉贝特 , 科雷·卡武科格鲁 , 哈萨比斯 , Raia Hadsell公司 , 叶惠德 , 南多·德弗里塔斯 :
RecurrentGemma:超越高效开放语言模型的变形金刚。 CoRR公司 abs/2404.07839 ( 2024 ) 2023 【b1】 托马斯·梅斯纳德 :
深度强化学习中的学分分配。 (专业人员的任命)。 法国巴黎理工学院, 2023 【c5】 丹尼尔·贾勒特 , 科伦蒂·塔莱克 , 佛罗伦特·阿尔奇 , 托马斯·梅斯纳德 , 雷米·穆诺斯 , 米查尔·瓦尔科 :
后视中的好奇心:随机环境中的内在探索。 ICML公司 2023 : 14780-14816 【c4】 托马斯·梅斯纳德 , 陈文琪 , 阿拉·萨阿德 , 汤云浩 , 马克·罗兰 , 西奥芬妮·韦伯 , 克莱尔·莱尔 , Audrunas Gruslys公司 , 米查尔·瓦尔科 , 威尔·达布尼 , 乔治·奥斯特罗夫斯基 , 埃里克·穆林斯 , 雷米·穆诺斯 :
分位数学分分配。 ICML公司 2023 : 24517-24531 [i11] 哈里森李 , 萨姆拉特·法塔尔 , 哈桑·曼苏尔 , 凯利·卢 , 托马斯·梅斯纳德 , 科尔顿主教 , 维克托·卡布恩 , 阿比纳夫·拉斯托吉 :
RLAIF:利用人工智能反馈从人类反馈中进行强化学习。 CoRR公司 abs/2309.00267 ( 2023 ) [i10] 雷米·穆诺斯 , 米查尔·瓦尔科 , 丹尼尔·卡兰德里洛 , 穆罕默德·盖什拉吉·阿扎尔 , 马克·罗兰 , 赵汉·丹尼尔·郭 , 汤云浩 , 马蒂厄·盖斯特 , 托马斯·梅斯纳德 , 安德烈亚·米奇 , 马可·塞尔维 , 谢尔坦·吉尔金 , 尼古拉·蒙切夫 , 奥利维尔·巴瑟姆 , 丹尼尔·曼科维茨 , Doina Precup公司 , 比拉尔·皮奥 :
纳什从人的反馈中学习。 CoRR公司 abs/2312.00886 ( 2023 ) [第九章] 爱德华多·皮格纳特里 , 约翰·费雷特 , 马蒂厄·盖斯特 , 托马斯·梅斯纳德 , 哈多·范·哈塞尔特 , 劳拉·托尼 :
深度强化学习中的时间学分分配研究。 CoRR公司 abs/2312.01072 ( 2023 ) 2022 [i8] 丹尼尔·贾勒特 , 科伦蒂·塔莱克 , 佛罗伦特·阿尔奇 , 托马斯·梅斯纳德 , 雷米·穆诺斯 , 米查尔·瓦尔科 :
事后诸葛亮的好奇心。 CoRR公司 abs/2211.10515 ( 2022 ) 2021 【c3】 托马斯·梅斯纳德 , 西奥芬妮·韦伯 , 法比奥·维奥拉 , Shantanu Thakoor公司 , 阿拉·萨阿德 , 安娜·哈鲁特云扬 , 威尔·达布尼 , 托马斯·斯特普顿 , 尼古拉斯·希斯 , 阿瑟·盖兹 , 埃里克·穆林斯 , 马库斯·赫特 , 拉尔斯·布兴 , 雷米·穆诺斯 :
无模型强化学习中的反事实学分分配。 ICML公司 2021 : 7654-7664 [i7] 赵汉·丹尼尔·郭 , 穆罕默德·盖什拉希·阿扎尔 , 阿拉·萨阿德 , Shantanu Thakoor公司 , 比拉尔·皮奥特 , 贝尔纳多·阿维拉·皮雷斯 , 米查尔·瓦尔科 , 托马斯·梅斯纳德 , 托拉蒂莫尔 , 雷米·穆诺斯 :
几何熵探索。 CoRR公司 腹肌/2101.02055 ( 2021 ) 2020 [i6] 托马斯·梅斯纳德 , 塞奥帕恩·韦伯(Théophane Weber) , 法比奥·维奥拉 , Shantanu Thakoor公司 , 阿拉·萨阿德 , 安娜·哈里顿扬(Anna Harutyunyan) , 威尔·达布尼 , 汤姆·斯特普顿 , 尼古拉斯·希斯 , 阿瑟·盖兹 , 马库斯·赫特 , 拉尔斯·布兴 , 雷米·穆诺斯 :
无模型强化学习中的反事实学分分配。 CoRR公司 abs/2011.09464 ( 2020 )
2010 – 2019
2019 【c2】 安娜·哈里顿扬(Anna Harutyunyan) , 威尔·达布尼 , 托马斯·梅斯纳德 , 穆罕默德·盖什拉希·阿扎尔 , 比拉尔·皮奥 , 尼古拉斯·希斯 , 哈多·范·哈塞尔特 , 格雷戈里·韦恩 , 萨汀德·辛格 , Doina Precup公司 , 雷米·穆诺斯 :
事后观察信贷分配。 NeurIPS公司 2019 : 12467-12476 [i5] 托马斯·梅斯纳德 , 加丹·维格努德 , 佐奥·萨克拉门托 , 沃尔特·森 , 本吉奥 :
幽灵单位在深层神经网络中产生生物学上合理的后盾。 CoRR公司 abs/1911.08585 ( 2019 ) [i4] 安娜·哈里顿扬(Anna Harutyunyan) , 威尔·达布尼 , 托马斯·梅斯纳德 , 穆罕默德·盖什拉希·阿扎尔 , 比拉尔·皮奥 , 尼古拉斯·希斯 , 哈多·范·哈塞尔特 , 格雷格·韦恩 , 萨汀德·辛格 , Doina Precup公司 , 雷米·穆诺斯 :
事后观察信贷分配。 CoRR公司 abs/1912.02503 ( 2019 ) 2018 [c1] 本杰明·斯凯利尔 , 阿尼鲁德·戈亚尔 , 乔纳森·比纳斯 , 托马斯·梅斯纳德 , 本吉奥 :
将平衡传播框架扩展到一般动力学。 ICLR(车间) 2018 [i3] 本杰明·斯凯利尔 , 阿尼鲁德·戈亚尔 , 乔纳森·比纳斯 , 托马斯·梅斯纳德 , 本吉奥 :
平衡传播到矢量场动力学的推广。 CoRR公司 abs/1808.04873 ( 2018 ) 2017 [j1] 本吉奥 , 托马斯·梅斯纳德 , 阿斯贾·费舍尔 , 张赛正 , 吴雨怀 :
STDP-基于能量的模型中反向传播的兼容近似。 神经计算。 29 ( 三 ) : 555-577 ( 2017 ) 2016 [i2] 托马斯·梅斯纳德 , 沃尔夫拉姆·郭士纳 , 约翰尼·布雷亚 :
在具有对比Hebbian可塑性的基于能量的模型中,使用尖峰神经元进行深度学习。 CoRR公司 abs/1612.03214 ( 2016 ) 2015 [i1] 本吉奥 , 托马斯·梅斯纳德 , 阿斯贾·费舍尔 , 张赛正 , 吴玉海 :
STDP的目标函数。 CoRR公司 abs/1509.05936 ( 2015 )
合著者索引
![](https://dblp.org/img/cog.dark.24x24.png)