蒂莫西·曼恩
人员信息
附属: 谷歌DeepMind,英国伦敦
其他同名人员
优化列表
2020年–今天
2022 [公元29年] 丹·安德烈·卡利安 , 弗洛里安·斯汀伯格 , 奥利维娅·威尔斯 , 西尔维斯特·阿尔维斯·雷布菲 , 安德烈斯·吉尔吉 , 蒂莫西·曼恩 , 斯文·戈瓦尔 :
通过对抗性增强防御图像腐败。 ICLR公司 2022 [i27] 阿莫尔·曼德哈内 , 安东·哲尔诺夫 , 玛丽贝斯·劳赫 , 顾晨杰 , 王妙森 , 薛花 , 温迪·尚 , 德里克·庞 , 雷内·克劳斯 , 蒋清汉 , 程晨 , 韩静宁 , 陈安琪 , 丹尼尔·曼科维茨 , 杰克逊·布洛舍 , 朱利安·施里特维瑟 , 托马斯·休伯特 , Oriol葡萄酒 , 蒂莫西·曼恩 :
MuZero与VP9视频压缩中速率控制的自竞争。 CoRR公司 abs/2202.06626 ( 2022 ) 2021 [公元28年] 丹·卡利安 , 丹尼尔·曼科维茨 , 汤姆·扎哈维 , 徐忠文 , Junhyuk噢 , 尼尔·莱文 , 蒂莫西·曼恩 :
使用Meta-Gradent D4PG平衡约束和回报。 ICLR公司 2021 [公元27年] 斯文·戈瓦尔 , 黄伯森 , 阿伦·范登·奥尔德 , 蒂莫西·曼恩 , Pushmet Kohli公司 :
低标签、高数据状态下的自我监督对抗鲁棒性。 ICLR公司 2021 [c26] 斯文·戈瓦尔 , 西尔维斯特·阿尔维斯·雷布菲 , 奥利维娅·威尔斯 , 弗洛里安·斯汀伯格 , 丹·安德烈·卡利安 , 蒂莫西·曼恩 :
使用生成的数据提高健壮性。 NeurIPS公司 2021 : 4218-4233 [公元25年] 西尔维斯特·阿尔维斯·雷布菲 , 斯文·戈瓦尔 , 丹·安德烈·卡利安 , 弗洛里安·斯汀伯格 , 奥利维娅·威尔斯 , 蒂莫西·曼恩 :
数据增强可以提高稳健性。 NeurIPS公司 2021 : 29935-29948 [i26] 西尔维斯特·阿尔维斯·雷布菲 , 斯文·戈瓦尔 , 丹·卡利安 , 弗洛里安·斯汀伯格 , 奥利维娅·威尔斯 , 蒂莫西·曼恩 :
修正数据增强以提高对抗稳健性。 CoRR公司 abs/2103.01946 ( 2021 ) [i25] 丹·卡利安 , 弗洛里安·斯汀伯格 , 奥利维娅·威尔斯 , 西尔维斯特·阿尔维斯·雷布菲 , 安德烈斯·吉尔吉 , 蒂莫西·曼恩 , 斯文·戈瓦尔 :
通过对抗性增强防御图像腐败。 CoRR公司 abs/2104.01086 ( 2021 ) 【i24】 斯文·戈瓦尔 , 西尔维斯特·阿尔维斯·雷布菲 , 奥利维娅·威尔斯 , 弗洛里安·斯汀伯格 , 丹·安德烈·卡利安 , 蒂莫西·曼恩 :
使用生成的数据提高健壮性。 CoRR公司 abs/2110.09468 ( 2021 ) [第23条] 西尔维斯特·阿尔维斯·雷布菲 , 斯文·戈瓦尔 , 丹·卡利安 , 弗洛里安·斯汀伯格 , 奥利维娅·威尔斯 , 蒂莫西·曼恩 :
数据增强可以提高稳健性。 CoRR公司 abs/2111.05328 ( 2021 ) 2020 [公元24年] 斯文·戈瓦尔 , 秦崇礼 , 黄伯森 , A.塔兰·杰吉尔 , 克里希纳穆西·德维约坦 , 蒂莫西·曼恩 , Pushmet Kohli公司 :
通过与非纠缠表示的对抗性混合实现野外鲁棒性。 CVPR公司 2020 : 1208-1217 【c23】 丹尼尔·曼科维茨 , 尼尔·莱文 , Rae Jeong先生 , 阿巴斯·阿卜杜勒马利基 , 约斯特·托比亚斯·斯普林伯格 , 袁元石 , 杰基·凯 , 托德·海丝特 , 蒂莫西·曼恩 , 马丁·里德米勒 :
模型失范连续控制的鲁棒强化学习。 ICLR公司 2020 [公元22年] 克莱尔·沃纳德 , 安德烈斯·吉尔吉 , 蒂莫西·曼恩 :
具有中间观测值的非稳态延迟强盗。 ICML公司 2020 : 9722-9732 【c21】 安东·哲尔诺夫 , 克里希那穆尔蒂(Dj)Dvijotham , 伊万·洛波夫 , 丹·卡利安 , 米歇尔·X·龚 , 娜塔拉詹·钱德拉舍卡尔 , 蒂莫西·曼恩 :
NodeHopper:通过快速双解算器实现具有约束的低延迟排名。 KDD公司 2020 : 1285-1294 [i22] 克莱尔·沃纳德 , 安德烈斯·吉尔吉 , 蒂莫西·曼恩 :
具有中间观测的非稳定土匪。 CoRR公司 abs/2006.02119 ( 2020 ) 【i21】 斯文·戈瓦尔 , 秦崇礼 , 乔纳森·尤萨托 , 蒂莫西·曼恩 , Pushmet Kohli公司 :
针对有规范的对手示例揭示对手训练的局限性。 CoRR公司 abs/2010.03593 ( 2020 ) [i20] 丹·卡利安 , 丹尼尔·曼科维茨 , 汤姆·扎哈维 , 徐忠文 , Junhyuk噢 , 尼尔·莱文 , 蒂莫西·曼恩 :
使用Meta-Gradent D4PG平衡约束和回报。 CoRR公司 abs/2010.06324 ( 2020 ) [i19] 丹尼尔·曼科维茨 , 丹·卡利安 , Rae Jeong先生 , 科斯敏·帕杜拉鲁 , 尼古拉斯·希斯 , 苏曼特·达塔赫里 , 马丁·里德米勒 , 蒂莫西·曼恩 :
模型失范连续控制的鲁棒约束强化学习。 CoRR公司 abs/2010.10644 ( 2020 )
2010 – 2019
2019 [公元20年] 斯文·戈瓦尔 , 克里希纳穆西·德维约坦 , 罗伯特·斯坦福思 , 鲁迪·本内尔 , 秦崇礼 , 乔纳森·尤萨托 , Relja Arandjelovic公司 , 蒂莫西·阿瑟·曼 , Pushmet Kohli公司 :
可扩展的验证训练,用于显著稳健的图像分类。 ICCV公司 2019 : 4841-4850 [第19条] 雷·江 , 斯文·戈瓦尔 , 钱玉秋 , 蒂莫西·曼恩 , 丹尼尔·雷泽德 :
超越贪婪排名:通过List-CVAE优化板岩。 ICLR(海报) 2019 [第18条] 蒂莫西·曼恩 , 斯文·戈瓦尔 , 安德烈斯·吉尔吉 , 胡慧仪 , 雷·江 , 巴拉吉·拉克什米纳拉亚南 , 普拉夫·斯里尼瓦桑 :
通过应用于推荐系统的代理从延迟结果中学习。 ICML公司 2019 : 4324-4332 [第17条] 斯文·戈瓦尔 , 克里希纳穆西·德维约坦 , 罗伯特·斯坦福思 , 蒂莫西·曼恩 , Pushmet Kohli公司 :
验证和训练深层网络的双重方法。 国际JCAI 2019 : 6156-6160 [第16条] 卡洛斯·里克尔梅 , 雨果·佩内顿斯 , 达米安·文森特 , 哈特穆特·梅内尔 , 西尔万·盖利 , 蒂莫西·曼恩 , 安德烈·巴雷托 , Gergely Neu公司 :
基于状态不确定性估计的自适应时差学习策略评估。 NeurIPS公司 2019 : 11872-11882 [第15条] 埃丝特·德曼 , 丹尼尔·曼科维茨 , 蒂莫西·曼恩 , 谢·曼诺 :
稳健强化学习的贝叶斯方法。 阿拉伯联合酋长国 2019 : 648-658 [i18] 埃丝特·德曼 , 丹尼尔·曼科维茨 , 蒂莫西·曼恩 , 谢·曼诺 :
稳健强化学习的贝叶斯方法。 CoRR公司 abs/1905.08188 ( 2019 ) [i17] 丹尼尔·曼科维茨 , 尼尔·莱文 , Rae Jeong先生 , 阿巴斯·阿卜杜勒马利基 , 约斯特·托比亚斯·斯普林伯格 , 蒂莫西·曼恩 , 托德·海丝特 , 马丁·里德米勒 :
模型失范连续控制的鲁棒强化学习。 CoRR公司 abs/1906.07516 ( 2019 ) [i16] 雨果·佩内顿斯 , 卡洛斯·里克尔梅 , 达米安·文森特 , 哈特穆特·梅内尔 , 蒂莫西·曼恩 , 安德烈·巴雷托 , 西尔万·盖利 , Gergely Neu公司 :
基于状态不确定性估计的自适应时差学习策略评估。 CoRR公司 abs/1906.07987 ( 2019 ) 【i15】 斯文·戈瓦尔 , 乔纳森·尤萨托 , 秦崇礼 , 黄伯森 , 蒂莫西·曼恩 , Pushmet Kohli公司 :
基于PGD的对抗测试的替代损失。 CoRR公司 abs/1910.09338 ( 2019 ) [第14条] 斯文·戈瓦尔 , 秦崇礼 , 黄伯森 , A.塔兰·杰吉尔 , 克里希纳穆西·德维约坦 , 蒂莫西·曼恩 , Pushmet Kohli公司 :
通过与非纠缠表示的对抗性混合实现野外鲁棒性。 CoRR公司 abs/1912.03192 ( 2019 ) 2018 [c14] 丹尼尔·曼科维茨 , 蒂莫西·曼恩 , Pierre-Luc培根 , Doina Precup公司 , 谢·曼诺 :
学习稳健的选项。 AAAI公司 2018 : 6409-6416 [第13条] 埃丝特·德曼 , 丹尼尔·曼科维茨 , 蒂莫西·曼恩 , 谢·曼诺 :
软约束参与者-关键策略-渐变。 阿拉伯联合酋长国 2018 : 208-218 [第12条] 克里希纳穆西·德维约坦 , 罗伯特·斯坦福思 , 斯文·戈瓦尔 , 蒂莫西·曼恩 , Pushmet Kohli公司 :
深度网络可扩展验证的双重方法。 阿拉伯联合酋长国 2018 : 550-559 [i13] 丹尼尔·曼科维茨 , 蒂莫西·曼恩 , Pierre-Luc培根 , Doina Precup公司 , 谢·曼诺 :
学习稳健的选项。 CoRR公司 abs/1802.03236 ( 2018 ) [i12] 雷·江 , 斯文·戈瓦尔 , 蒂莫西·曼恩 , 丹尼尔·雷泽德 :
通过Slate-CVAE优化Slate建议。 CoRR公司 abs/1803.01682 ( 2018 ) [i11] 埃丝特·德曼 , 丹尼尔·曼科维茨 , 蒂莫西·曼恩 , 谢·曼诺 :
软约束参与者-关键策略-渐变。 CoRR公司 abs/1803.04848 ( 2018 ) [i10] 克里希纳穆西·德维约坦 , 罗伯特·斯坦福思 , 斯文·戈瓦尔 , 蒂莫西·曼恩 , Pushmet Kohli公司 :
深度网络可扩展验证的双重方法。 CoRR公司 abs/1803.06567 ( 2018 ) [第九章] 雨果·佩内顿斯 , 达米安·文森特 , 哈特穆特·梅内尔 , 西尔万·盖利 , 蒂莫西·曼恩 , 安德烈·巴雷托 :
神经网络时差学习-泄漏传播问题的研究。 CoRR公司 abs/1807.03064 ( 2018 ) [i8] 蒂莫西·曼恩 , 斯文·戈瓦尔 , 雷·江 , 胡慧仪 , 巴拉吉·拉克什米纳拉亚南 , 安德烈斯·吉尔吉 :
通过中间观察从延迟结果中学习。 CoRR公司 腹肌/1807.09387 ( 2018 ) [i7] 斯文·戈瓦尔 , 克里希纳穆西·德维约坦 , 罗伯特·斯坦福思 , 鲁迪·本内尔 , 秦崇礼 , 乔纳森·尤萨托 , Relja Arandjelovic公司 , 蒂莫西·曼恩 , Pushmet Kohli公司 :
区间有界传播训练可验证鲁棒模型的有效性。 CoRR公司 abs/1810.12715 ( 2018 ) 2017 [第11条] 蒂莫西·曼恩 , 谢·曼诺 , Doina Precup公司 :
具有临时扩展动作的近似值迭代(扩展抽象)。 国际JCAI 2017 : 5035-5039 2016 [第10条] 丹尼尔·曼科维茨 , 蒂莫西·曼恩 , 谢·曼诺 :
自适应技能自适应分区(ASAP)。 NIPS公司 2016 : 1588-1596 [i6] 丹尼尔·曼科维茨 , 蒂莫西·曼恩 , 谢·曼诺 :
错位问题的迭代层次优化(IHOMP)。 CoRR公司 abs/1602.03348 ( 2016 ) [i5] 丹尼尔·曼科维茨 , 蒂莫西·曼恩 , 谢·曼诺 :
自适应技能,自适应分区(ASAP)。 CoRR公司 abs/1602.03351 ( 2016 ) [i4] 蒂莫西·曼恩 , 雨果·佩内顿斯 , 谢·曼诺 , 托德·海丝特 :
自适应Lambda最小二乘时间差分学习。 CoRR公司 abs/1612.09465 ( 2016 ) 2015 [注2] 蒂莫西·曼恩 , 谢·曼诺 , Doina Precup公司 :
具有临时扩展动作的近似值迭代。 J.阿蒂夫。 智力。 物件。 53 : 375-438 ( 2015 ) 【c9】 蒂莫西·曼恩 , 丹尼尔·曼科维茨 , 谢·曼诺 :
学习何时在高维领域中切换技能。 AAAI研讨会:学习视频游戏的一般能力 2015 【c8】 阿萨夫·哈拉克 , 弗朗索瓦·施尼茨勒 , 蒂莫西·曼恩 , 谢·曼诺 :
未知因素动态下的非政策模型学习。 ICML公司 2015 : 711-719 [i3] 阿萨夫·哈拉克 , 弗朗索瓦·施尼茨勒 , 蒂莫西·曼恩 , 谢·曼诺 :
未知结构MDP的非政策评估。 CoRR公司 abs/1502.03255 ( 2015 ) [i2] 尼尔·莱文 , 蒂莫西·曼恩 , 谢·曼诺 :
积极学习在推特上吸引粉丝。 CoRR公司 abs/1504.04114 ( 2015 ) [i1] 丹尼尔·曼科维茨 , 蒂莫西·曼恩 , 谢·曼诺 :
引导技能。 CoRR公司 abs/1506.03624 ( 2015 ) 2014 【c7】 蒂莫西·曼恩 , 谢·曼诺 :
用选项放大近似值迭代:用更少的迭代实现更好的策略。 ICML公司 2014 : 127-135 【c6】 蒂莫西·曼恩 , 丹尼尔·曼科维茨 , 谢·曼诺 :
时间规则中断选项(TRIO)。 ICML公司 2014 : 1350-1358 【c5】 奥达尔里克·梅勒德(Odarlic-Ambrym Maillard) , 蒂莫西·曼恩 , 谢·曼诺 :
我的MDP有多难? “救援分配规范”。 NIPS公司 2014 : 1835-1843 2013 [j1] 蒂莫西·曼恩 , Yunjung公园 , Sungmoon Jeong先生 , 米荷·李 , Yoonsuck Choe先生 :
通过感觉运动相互作用对双目视觉深度估计的自主和交互改进。 IEEE传输。 自动。 门。 开发。 5 ( 1 ) : 74-84 ( 2013 ) 2012 【c4】 蒂莫西·曼恩 , Yoonsuck Choe先生 :
利用转移知识进行强化学习的定向探索。 EWRL公司 2012 : 59-76 2011 【c3】 蒂莫西·曼恩 , Yoonsuck Choe先生 :
通过有针对性的探索扩大强化学习。 AAAI公司 2011 : 435至440 2010 【c2】 蒂莫西·曼恩 , Yoonsuck Choe先生 :
通过与运动兼容的感官表征,从出生前到出生后的运动技能转移。 ICDL公司 2010 : 185-190
2000 – 2009
2008 【c1】 Bum Soon Jang先生 , 蒂莫西·曼恩 , Yoonsuck Choe先生 :
随机、无标度和小世界网络中延迟分布变化的影响。 集团公司 2008 : 316-321