安德烈·科洛波夫
人员信息
优化列表
2020年–今天
2024 [第23条] 弗洛里安·阿赫尔曼 , 托马斯·斯塔斯尼 , 博格丹丹丘 , 安德烈·科洛波夫 , Jen Jen Chung先生 , 西格沃特 , 尼古拉斯·R·J·劳伦斯 :
WindSeer:小型无人机上复杂地形上的实时体积风预测。 CoRR公司 abs/2401.09944 ( 2024 ) [i22] 郑瑞杰(Ruijie Zheng) , 程安成 , 哈尔·达美三世 , 黄芙蓉 , 安德烈·科洛博夫 :
PRISE:将时间动作抽象学习为序列压缩问题。 CoRR公司 abs/2402.10450 ( 2024 ) 【i21】 阿伦·聂 , 程安成 , 安德烈·科洛波夫 , 阿迪思·斯瓦米纳坦 :
定向反馈对基于LLM的优化器的重要性。 CoRR公司 腹肌/2405.16434 ( 2024 ) 2023 [注2] 马克西姆·库兹涅佐夫 , 安德烈·科洛波夫 , 弗拉基米尔·古伯诺夫 , 安德烈·波列沙耶夫 :
热损失对链支化反应模型中反应波混沌动力学的影响。 国际法学分会。 混乱 33 ( 12 ) : 2350137:1-2350137:11 ( 2023 ) [公元34年] 加勒特·托马斯 , 程安成 , 里基·洛因德 , 菲利佩·维埃拉·弗鲁杰里 , Vibhav葡萄藤 , 米哈·加洛贝努 , 安德烈·科洛波夫 :
PLEX:充分利用机器人操作预训练的可用数据。 CoRL公司 2023 : 2624-2641 [公元33年] 维韦克·迈尔斯 , 安德烈·王赫 , 宽芳 , 荷马·里奇·沃克 , 菲利普·汉森(Philippe Hansen-Estruch) , 程安成 , 米哈伊·贾洛巴努 , 安德烈·科洛波夫 , 安卡·D·德拉甘 , 谢尔盖·莱文 :
指令遵循的目标表示:一个半监督的控制语言接口。 CoRL公司 2023 : 3894-3908 [公元32年] 维尼萨·兰加尼尼 , 迈克·辛克拉尔 , 埃亚尔·奥菲克 , 阿莫斯·米勒 , 乔纳森·坎贝尔 , 安德烈·科洛波夫 , 爱德华·卡特尔 :
探索盲人导航助手的控制级别。 人力资源部 2023 : 4-12 [公元31年] 李安琪 , 迪彭德拉·米斯拉 , 安德烈·科洛波夫 , 程安成 :
离线强化学习的生存本能。 NeurIPS公司 2023 [i20] 维尼萨·兰加尼尼 , 迈克·辛克拉尔 , 埃亚尔·奥菲克 , 阿莫斯·米勒 , 乔纳森·坎贝尔 , 安德烈·科洛波夫 , 爱德华·卡特尔 :
探索盲人导航助手的控制级别。 CoRR公司 abs/2301.02336 ( 2023 ) [i19] 加勒特·托马斯 , 程安成 , 里基·洛因德 , Vibhav葡萄藤 , 米哈·加洛贝努 , 安德烈·科洛波夫 :
PLEX:充分利用机器人操作预训练的可用数据。 CoRR公司 abs/2303.08789 ( 2023 ) [i18] Sinong Geng公司 , 阿尔多·帕奇亚诺 , 安德烈·科洛波夫 , 程安成 :
通过混合启发式改进离线RL。 CoRR公司 abs/2306.00321 ( 2023 ) [i17] 李安琪 , 迪彭德拉·米斯拉 , 安德烈·科洛波夫 , 程安成 :
离线强化学习的生存本能。 CoRR公司 abs/2306.03286 ( 2023 ) [i16] 维维克·迈尔斯 , 何安德烈 , 宽芳 , 霍默·沃克 , 菲利普·汉森(Philippe Hansen-Estruch) , 程安成 , 米哈·加洛贝努 , 安德烈·科洛波夫 , 安卡·D·德拉甘 , 谢尔盖·莱文 :
指令遵循的目标表示:一个半监督的控制语言接口。 CoRR公司 abs/2307.00117 ( 2023 ) 【i15】 刘慧涵 , 谭秋晴 , 朱玉可(Yuke Zhu) , 阿迪思·斯瓦米纳坦 , 安德烈·科洛波夫 , 程安成 :
交互式机器人从言语纠正中学习。 CoRR公司 abs/2310.17555 ( 2023 ) [第14条] 程安成 , 安德烈·科洛波夫 , 迪潘德拉·米斯拉 , 阿伦·聂 , 阿迪思·斯瓦米纳坦 :
LLF-Bench:基于语言反馈的交互式学习基准。 CoRR公司 abs/2312.06853 ( 2023 ) 2022 [公元30年] 博格丹·马祖(Bogdan Mazoure) , 艾哈迈德·M·艾哈迈德 , R.Devon Hjelm公司 , 安德烈·科洛波夫 , 帕特里克·麦克阿尔宾 :
RL中零炮综合的交叉轨迹表示学习。 ICLR公司 2022 [公元29年] 诺兰·瓦格纳 , 安德烈·科洛波夫 , 菲利佩·维埃拉·弗鲁杰里 , 里基·洛因德 , 程庆安 , 马修·霍斯克内克 :
MoCapAct:模拟仿人控制的多任务数据集。 NeurIPS公司 2022 [i13] R.Devon Hjelm公司 , 博格丹·马祖(Bogdan Mazoure) , 弗洛里安·戈列莫 , 菲利佩·弗鲁杰里 , 米哈·加洛贝努 , 安德烈·科洛博夫 :
通用代理研究沙盒环境(SEGAR)。 CoRR公司 abs/2203.10351 ( 2022 ) [i12] 诺兰·瓦格纳 , 安德烈·科洛波夫 , 菲利佩·维埃拉·弗鲁杰里 , 里基·洛因德 , 程安成 , 马修·霍斯克内克 :
MoCapAct:模拟仿人控制的多任务数据集。 CoRR公司 abs/2208.07363 ( 2022 ) 2021 [公元28年] 程安成 , 安德烈·科洛波夫 , 阿迪思·斯瓦米纳坦 :
启发式强化学习。 NeurIPS公司 2021 : 13550-13563 [i11] 莎拉达·莫汉蒂 , Jyotish Poonganam(约提什·蓬加南) , 阿德里安·盖登 , 安德烈·科洛波夫 , 布莱克·沃尔夫 , Dipam Chakraborty公司 , Grazvydas Semetulskis公司 , 若昂·沙普克 , 乔纳斯·库比利乌斯 , 尤吉斯·帕苏科尼斯 , 利纳斯·克里马斯 , 马修·霍斯克内克 , 帕特里克·麦克阿尔宾 , Quang Nhat Tran公司 , 托马斯·图米尔 , 小城汤 , 陈新伟(Xinwei Chen) , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 威廉·赫布根·格斯 , Sahika基因 , 约翰·舒尔曼 , 卡尔·科布 :
测量强化学习基准中的样本效率和泛化:NeurIPS 2020 Procgen基准。 CoRR公司 abs/2103.15332 ( 2021 ) [i10] 博格丹·马祖(Bogdan Mazoure) , 艾哈迈德·艾哈迈德 , 帕特里克·麦克阿尔宾 , R.Devon Hjelm公司 , 安德烈·科洛波夫 :
RL中零炮综合的交叉轨迹表示学习。 CoRR公司 abs/2106.02193 ( 2021 ) [第九章] 程安成 , 安德烈·科洛波夫 , 阿迪思·斯瓦米纳坦 :
启发式强化学习。 CoRR公司 abs/2106.02757 ( 2021 ) 2020 [公元27年] 弗洛里安·阿赫尔曼 , 安德烈·科洛波夫 , Debadeepta戴 , 蒂莫·辛兹曼 , Jen Jen Chung先生 , 西格沃特 , 尼古拉斯·R·J·劳伦斯 :
多点:热成像和光学成像的交叉光谱配准。 CoRL公司 2020 : 1746-1760 [公元26年] 安德烈·科洛博夫 , 塞巴斯蒂安·布贝克 , 朱利安·齐默特 :
主动缓存同步的在线学习。 ICML公司 2020 : 5371-5380 [公元25年] 程安成 , 安德烈·科洛波夫 , 阿列克·阿加瓦尔 :
通过模仿多个甲骨文改进政策。 NeurIPS公司 2020 [c24] 沙拉达·莫汉蒂 , Jyotish Poonganam(约提什·蓬加南) , 阿德里安·盖登 , 安德烈·科洛波夫 , 布莱克·沃尔夫 , Dipam Chakraborty公司 , Grazvydas Semetulskis公司 , 乔·夏普克 , 乔纳斯·库比利乌斯 , 尤吉斯·帕苏科尼斯 , 利纳斯·克里玛斯 , 马修·霍斯克内克 , 帕特里克·麦克阿尔宾 , Quang Nhat Tran公司 , 托马斯·图米埃尔 , 小城汤 , 陈新伟(Xinwei Chen) , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 威廉·赫布根·格斯 , Sahika基因 , 约翰·舒尔曼 , 卡尔·科布 :
测量强化学习基准中的样本效率和泛化:NeurIPS 2020 Procgen基准。 NeurIPS(竞争和演示) 2020 : 361-395 【c23】 马蒂奥·图切塔 , 安德烈·科洛波夫 , 什塔尔·沙阿 , 安德烈亚斯·克劳斯 , 阿列克·阿加瓦尔 :
通过课程导入进行安全强化学习。 NeurIPS公司 2020 [i8] 安德烈·科洛波夫 , 塞巴斯蒂安·布贝克 , 朱利安·齐默特 :
主动缓存同步的在线学习。 CoRR公司 2002年12月14日 ( 2020 ) [i7] 马蒂奥·图切塔 , 安德烈·科洛波夫 , 什塔尔·沙阿 , 安德烈亚斯·克劳斯 , 阿列克·阿加瓦尔 :
通过课程导入进行安全强化学习。 CoRR公司 abs/2006.12136 ( 2020 ) [i6] 程安成 , 安德烈·科洛波夫 , 阿列克·阿加瓦尔 :
多位专家的政策改进。 CoRR公司 abs/2007.00795 ( 2020 )
2010 – 2019
2019 [公元22年] 安德烈·科洛波夫 , 尤瓦尔·佩雷斯 , 程璐 , 霍尔维茨 :
使用强化学习进行日程安排,及时了解在线内容更改。 NeurIPS公司 2019 : 579-589 【c21】 安德烈·科洛波夫 , 尤瓦尔·佩雷斯 , 埃亚尔·卢贝茨基 , 霍尔维茨 :
礼貌约束下的最佳新鲜度爬行。 SIGIR公司 2019 : 495-504 2018 [公元20年] 塞缪尔·塔波尔 , 伊恩·吉利亚德 , 安德烈·科洛波夫 :
ArduSoar:一种用于资源节约型自动驾驶仪的开源热控控制器。 IROS公司 2018 : 6255-6262 [第19条] 伊恩·吉利亚德 , 理查德·罗根 , 吉姆·皮亚维斯 , 安德烈·科洛波夫 :
作为部分可观测马尔可夫决策过程的自治热传导。 机器人学:科学与系统 2018 [i5] 塞缪尔·塔波尔 , 伊恩·吉利亚德 , 安德烈·科洛波夫 :
ArduSoar:一种用于资源节约型自动驾驶仪的开源热控控制器。 CoRR公司 abs/1802.08215 ( 2018 ) [i4] 伊恩·吉利亚德 , 理查德·罗根 , 吉姆·皮亚维斯 , 安德烈·科洛波夫 :
作为部分可观测马尔可夫决策过程的自治热传导(扩展版)。 CoRR公司 abs/1805.09875 ( 2018 ) 2016 [第18条] 奥夫拉·阿米尔 , 埃塞·卡马尔 , 安德烈·科洛波夫 , 芭芭拉·格罗斯 :
代理培训的交互式教学策略。 国际JCAI 2016 : 804-811 2015 [第17条] 扬·范·哈伦 , 安德烈·科洛波夫 , 杰西·戴维斯 :
托德勒:二阶深度转移学习。 AAAI公司 2015 : 3007-3015 [第16条] 阿卜杜勒拉赫曼·埃洛杰尔 , 安德烈·科洛波夫 , 马修·奥尔登 , 安库尔·特雷德赛 :
通过并行计划增强选择RTS游戏中的稳健策略。 美国原子能机构 2015 : 155-162 [第15条] 克里斯托弗·H·林 , 安德烈·科洛波夫 , 埃塞·卡马尔 , 霍尔维茨 :
不确定性规划的元推理。 国际JCAI 2015 : 1601-1609 [i3] 克里斯托弗·H·林 , 安德烈·科洛博夫 , 埃塞·卡马尔 , 霍尔维茨 :
不确定性规划的元推理。 CoRR公司 腹肌/1505.000399 ( 2015 ) 2014 [第14条] 乔纳森·斯普劳尔 , 安德烈·科洛波夫 , 佛罗伦特·泰克泰尔·科尼斯布赫(Florent Teichteil-Königsbuch) :
饱和路径约束MDP:不确定性和确定性模型检验约束下的规划。 AAAI公司 2014 : 2367-2373 [c13] Debadeepta戴 , 安德烈·科洛波夫 , 里奇·卡鲁阿纳 , 埃塞·卡马尔 , 霍尔维茨 , 阿什什·卡普尔 :
高斯会见加拿大旅行者:相关自然动力学的最短路径问题。 美国原子能机构 2014 : 1101-1108 [第12条] 乔纳森·布拉格 , 安德烈·科洛博夫 , 四季倾城 , 丹尼尔·S·韦尔德 :
众包并行任务路由。 HCOMP公司 2014 : 11-21 2013 【b2】 安德烈·科洛波夫 :
不确定性规划的可扩展方法和表达模型。 美国华盛顿大学, 2013 [第11条] 安德烈·科洛波夫 , 四季倾城 , 丹尼尔·S·韦尔德 :
多任务联合众包。 HCOMP(正在进行的工作/演示) 2013 2012 【b1】 四季倾城 , 安德烈·科洛波夫 :
马尔可夫决策过程规划:人工智能视角。 人工智能与机器学习综合讲座 , 摩根克莱普尔出版社 2012 ,国际标准图书编号 978-3-031-00431-5 [j1] 安德烈·科洛波夫 , 四季倾城 , 丹尼尔·S·韦尔德 :
发现分解MDP中的隐藏结构。 Artif公司。 智力。 189 : 19-47 ( 2012 ) [第10条] 安德烈·科洛波夫 , 四季倾城 , 丹尼尔·S·韦尔德 :
在线概率规划的LRTDP与UCT。 AAAI公司 2012 : 1786-1792 【c9】 安德烈·科洛波夫 , 彭戴 , 四季倾城 , 丹尼尔·S·韦尔德 :
具有大分支因子的有限水平MDP的反向迭代深化。 ICAPS公司 2012 【c8】 安德烈·科洛波夫 , 四季倾城 , 丹尼尔·S·韦尔德 :
有死胡同的面向目标MDP理论。 阿拉伯联合酋长国 2012 : 438-447 [i2] 安德烈·科洛波夫 , 四季倾城 , 丹尼尔·S·韦尔德 :
有死胡同的面向目标MDP理论。 CoRR公司 abs/1210.4875 ( 2012 ) 2011 【c7】 安德烈·科洛波夫 , 四季倾城 , 丹尼尔·S·韦尔德 , 赫克托·杰夫纳 :
广义随机最短路径MDPs的启发式搜索。 ICAPS公司 2011 【c6】 安德烈·科洛波夫 , 四季倾城 , 丹尼尔·S·韦尔德 :
面向可扩展MDP算法。 国际JCAI 2011 : 2818-2819 2010 【c5】 安德烈·科洛波夫 , 四季倾城 , 丹尼尔·S·韦尔德 :
第六感:快速可靠地识别MDP中的死胡同。 AAAI公司 2010 : 1108-1114 【c4】 安德烈·科洛波夫 , 四季倾城 , 丹尼尔·S·韦尔德 :
MDP启发式中的经典规划:借助于泛化的一点帮助。 ICAPS公司 2010 : 97-104
2000 – 2009
2009 【c3】 安德烈·科洛波夫 , 四季倾城 , 丹尼尔·S·韦尔德 :
ReTrASE:近似概率规划的集成范例。 国际JCAI 2009 : 1746-1753 2005 【c2】 布莱恩·米尔奇 , 巴斯卡拉·玛蒂 , 大卫·A·桑塔格 , 斯图尔特·罗素 , 丹尼尔·L·昂 , 安德烈·科洛波夫 :
无限关联贝叶斯网络的近似推理。 AISTATS公司 2005 【c1】 布莱恩·米尔奇 , 巴斯卡拉·玛蒂 , 斯图尔特·罗素 , 大卫·A·桑塔格 , 丹尼尔·L·昂 , 安德烈·科洛波夫 :
BLOG:具有未知对象的概率模型。 国际JCAI 2005 : 1352-1359 [i1] 布莱恩·米尔奇 , 巴斯卡拉·玛蒂 , 斯图尔特·罗素 , 大卫·A·桑塔格 , 丹尼尔·L·昂 , 安德烈·科洛波夫 :
BLOG:具有未知对象的概率模型。 概率、逻辑和关系学习 2005