托比亚斯·波伦
人员信息
SPARQL查询
优化列表
2020年–今天
2022 【c4】 彼得·康威·汉弗莱斯 , 大卫·拉波索 , 托比亚斯·波伦 , 格雷戈里·桑顿 , 拉奇塔·查帕里亚 , 阿利斯泰尔·穆达尔 , 艾布拉森 , 佩特科·乔治耶夫 , 亚当·桑托罗 , 蒂莫西·利利克拉普 :
学习控制计算机的数据驱动方法。 ICML公司 2022 : 9466-9482 [i7] 彼得·康威·汉弗莱斯 , 大卫·拉波索 , 托比·波伦 , 格雷戈里·桑顿 , 拉奇塔·查帕里亚 , 阿利斯泰尔·穆达尔 , 艾布拉森 , 佩特科·乔治耶夫 , 亚历克斯·戈尔丁 , 亚当·桑托罗 , 蒂莫西·利利克拉普 :
学习控制计算机的数据驱动方法。 CoRR公司 abs/2202.08137 ( 2022 ) [i6] 朱利安·佩罗拉 , 巴特·德·维尔德 , 丹尼尔·海恩斯 , 尤金·塔拉索夫 , 弗洛里安·斯特鲁布 , 文森特·德·波尔 , 保罗·穆勒 , 杰罗姆·康纳 , 尼尔·伯奇 , 托马斯·安东尼 , 斯蒂芬·麦卡勒 , 罗穆尔·伊利 , 莎拉·岑 , 王哲(Zhe Wang) , Audrunas Gruslys公司 , 亚历山大·马利舍娃 , 米纳·汗 , 谢尔吉尔·奥扎尔 , 芬巴尔木材 , 托比·波伦 , 汤姆·埃克尔斯 , 马克·罗兰 , 马克·兰科特 , Jean-Baptiste Lespiau女士 , 比拉尔·皮奥 , 沙耶根·奥米德沙维埃 , 爱德华·洛克哈特 , 劳伦特·西弗雷 , Nathalie Beauguerlange公司 , 雷米·穆诺斯 , 大卫·西尔弗 , 萨汀德·辛格 , 哈萨比斯 , 卡尔·图尔斯 :
通过无模型多智能体强化学习掌握Stratego游戏。 CoRR公司 abs/2206.15378 ( 2022 ) 2021 [i5] 杰克·W·雷 , 塞巴斯蒂安·博尔盖乌德 , 特雷弗·蔡 , 凯蒂·米利肯 , 乔丹·霍夫曼 , H.弗朗西斯·宋 , 约翰·阿斯兰尼德斯 , 萨拉亨德森 , 罗马戒指 , 苏珊娜·杨 , 伊丽莎·卢瑟福 , 汤姆·亨尼根 , 雅各布·梅尼克 , 阿尔宾·卡西尔 , 鲍威尔 , 乔治·范·登·德里斯(George van den Driessche) , 丽莎·安妮·亨德里克斯 , 玛丽贝斯·劳赫 , 黄伯森 , 阿米莉亚·格莱斯 , 约翰内斯·韦尔布尔 , 苏曼特·达塔赫里 , 藏红花黄 , 乔纳森·尤萨托 , 约翰·梅勒 , 伊琳娜·希金斯 , 安东尼娅·克雷斯韦尔 , 纳特·麦克莱塞 , 艾米·吴 , 埃里希·埃尔森 , Siddhant M.Jayakumar先生 , 埃琳娜·布恰茨卡娅 , 大卫·布登 , 埃斯梅·萨瑟兰 , 凯伦·西蒙扬 , 米歇拉·帕格尼尼 , 劳伦特·西弗雷 , 莉娜·马滕斯 , 李向洛林 , 阿希古纳·昆科罗 , 艾达·内马扎德 , 埃琳娜·格里博夫斯卡娅 , 多梅尼克·多纳托 , 安吉利基·拉扎里杜 , 阿瑟·门施 , Jean-Baptiste Lespiau女士 , 玛丽亚·齐姆波基利 , 尼古拉·格里戈列夫 , 道格·弗里茨 , Thibault Sottiaux公司 , 曼塔斯·帕贾斯卡斯 , 托比·波伦 , 龚志涛 , 丹尼尔·富山 , Cyprien de Masson d'Autume公司 , 李宇佳 , 泰富·特尔齐 , 弗拉基米尔·米库利克 , 伊戈尔·巴布什金 , 艾丹·克拉克 , 迭戈·德·拉斯·卡斯 , 奥雷莉亚·盖伊 , 克里斯·琼斯 , 詹姆斯·布拉德伯里 , 马修·约翰逊 , 布莱克·赫奇曼 , 劳拉·魏丁格 , 艾森·加布里埃尔 , 艾萨克 , 爱德华·洛克哈特 , 西蒙·奥斯宾多 , 劳拉·里梅尔 , 克里斯·戴尔 , Oriol葡萄酒 , 卡里姆·阿尤布 , 杰夫·斯坦威 , 洛雷恩·贝内特 , 哈萨比斯 , Koray Kavukcuoglu公司 , 杰弗里·欧文 :
缩放语言模型:来自训练地鼠的方法、分析和见解。 CoRR公司 abs/2112.11446 ( 2021 )
2010 – 2019
2019 [j1] Oriol葡萄酒 , 伊戈尔·巴布什金 , 沃伊切赫·M·恰尔内茨基 , 米歇尔·马修 , 安德鲁·杜季克 , 钟俊英 , 大卫·H·崔 , 鲍威尔 , 蒂莫·埃瓦尔德斯 , 佩特科·乔治耶夫 , Junhyuk噢 , 丹·霍根 , 曼纽尔·克罗伊斯 , 伊沃·达尼埃尔卡 , Aja Huang(黄亚佳) , 劳伦特·西弗雷 , 特雷弗·蔡 , 约翰·阿加皮欧 , 马克斯·贾德伯格 , 亚历山大·萨沙·维日涅维茨 , 雷米·勒布朗德 , 托比亚斯·波伦 , 瓦伦丁·达利巴德 , 大卫·布登 , 尤里·苏尔斯基 , 詹姆斯·莫洛伊 , 汤姆·勒佩恩 , 圣格雷 , 王子玉 , 托拜厄斯·普法夫 , 吴雨怀 , 罗马戒指 , Dani Yogatama公司 , 达里奥·温施 , 卡特里娜·麦金尼 , 奥利弗·史密斯 , 汤姆·绍尔 , 蒂莫西·利利克拉普 , Koray Kavukcuoglu公司 , 哈萨比斯 , Chris应用程序 , 大卫·西尔弗 :
星际争霸II中使用多智能体强化学习的大师级。 国家。 575 ( 7782 ) : 350-354 ( 2019 ) 2018 【c3】 博尔贾·伊巴兹 , 简·雷克 , 托比亚斯·波伦 , 杰弗里·欧文 , 谢恩·莱格 , 达里奥·阿莫迪 :
奖励从人类偏好和Atari演示中学习。 NeurIPS公司 2018 : 8022-8034 [i4] 托比亚斯·波伦 , 比拉尔·皮奥 , 托德·海丝特 , 穆罕默德·盖什拉希·阿扎尔 , 丹·霍根 , 大卫·布登 , 加布里埃尔·巴特·马龙 , 哈多·范·哈塞尔特 , 约翰·泉 , 梅尔·韦塞克 , 马特奥·赫塞尔 , 雷米·穆诺斯 , 奥利维尔·皮特金 :
观察并进一步观察:在Atari上实现一致的性能。 CoRR公司 abs/1805.11593 ( 2018 ) [i3] 赵汉·丹尼尔·郭 , 穆罕默德·盖什拉希·阿扎尔 , 比拉尔·皮奥 , 伯纳多·皮雷斯 , 托比·波伦 , 雷米·穆诺斯 :
神经预测信念表征。 CoRR公司 abs/1811.06407 ( 2018 ) [i2] 博尔贾·伊巴兹 , 简·雷克 , 托比亚斯·波伦 , 杰弗里·欧文 , 谢恩·莱格 , 达里奥·阿莫迪 :
奖励从人类偏好和Atari演示中学习。 CoRR公司 abs/1811.06521 ( 2018 ) 2017 【c2】 托比亚斯·波伦 , 亚历山大·赫尔曼斯 , 马库斯·马蒂亚斯 , 巴斯蒂安·雷贝 :
街道场景中语义分割的全分辨率残差网络。 CVPR公司 2017 : 3309-3318 2016 【c1】 托比亚斯·波伦 , 伊什拉特·巴达米 , 马库斯·马蒂亚斯 , 巴斯蒂安·雷贝 :
模块化家具的语义分割。 WACV公司 2016 : 1-9 [i1] 托比亚斯·波伦 , 亚历山大·赫尔曼斯 , 马库斯·马蒂亚斯 , 巴斯蒂安·莱贝 :
街道场景中语义分割的全分辨率残差网络。 CoRR公司 abs/1611.08323 ( 2016 )