2024
SGD噪声的蝴蝶效应:行为克隆和自回归中的误差放大
Adam Block、Dylan J.Foster、Akshay Krishnamurthy、,马克斯·辛乔维茨,Cyril Zhang。提交中,2024年。
基于权重合并的车队策略学习及其在机器人工具使用中的应用
王丽瑞、张开清、周爱伦、,马克斯·辛乔维茨,Russ Tedrake。ICLR公司,2024年。
2023
情景强化学习中的腐败稳健探索
α: 利库里斯(Thodoris Lykouris),马克斯·辛乔维茨、Aleksandrs Slivkins、Wen Sun。运筹学数学, 2023.
生殖行为克隆的可证明保证:在低水平稳定性和高水平行为之间架起桥梁
α: Adam Block、Daniel Pfrommer、,马克斯·辛乔维茨.纽里普斯, 2023.
分段仿射系统中预测的平滑在线学习
α: 亚当·布洛克,马克斯·辛乔维茨,Russ Tedrake。NeurIPS公司,聚光灯, 2023.
RePo:通过正则化后验可预测性实现基于弹性模型的强化学习
朱春宁,马克斯·辛乔维茨、Siri Gadipudi、Abhishek Gupta。纽里普斯,聚光灯, 2023.
模拟复杂轨迹:在低水平稳定性和高水平行为之间架起桥梁
α: Adam Block、Daniel Pfrommer、,马克斯·辛乔维茨.Frontiers4LCD研讨会,ICML, 2023.
基于测地凸集图的非核素运动规划
托马斯·科恩、马克·彼得森、,马克斯·辛乔维茨,Russ Tedrake。RSS、,最佳论文入围者, 2023.
面向分段连续决策的Oracle高效平滑在线学习
α: Adam Block、Sasha Rakhlin、,马克斯·辛乔维茨.COLT公司, 2023.
处理组合分布偏移:矩阵完成视角
马克斯·辛乔维茨阿比舍克·古普塔(Abhishek Gupta)、张开清(Kaiqing Zhang)。COLT公司, 2023.
强化学习的探索与激励
马克斯·辛乔维茨、Aleksandrs Slivkins。运筹学,2023(即将出现)。
异质分布转移下的统计学习
马克斯·辛乔维茨阿努拉·阿杰(Anurag Ajay)、普基特·阿格拉瓦尔(Pulkit Agrawal)、阿克谢·克里希纳穆提(Akshay Krishnamurthy)。ICML公司, 2023.
学习局部线性模型对非线性政策优化的作用
丹尼尔·普弗洛默*,马克斯·辛乔维茨*、Tyler Westenbroek、Nikolai Matni、Stephen Tu。ICML公司, 2023.
学习外推法:一种转导方法
阿维夫·内塔尼亚胡(Aviv Netanyahu)、阿比谢克·古普塔(Abhishek Gupta)、,马克斯·辛乔维茨张开清(Kaiqing Zhang)、阿格拉瓦尔(Pulkit Agrawal)。ICLR公司, 2023.
2022
使用不同模拟器进行接触丰富操作策略优化的病理学和挑战
H.J.Terry Suh,马克斯·辛乔维茨张开庆,俄罗斯特德雷克。ICRA 2022研讨会:丰富接触操作的强化学习, 2022.
学习外推法:一种转导方法
阿维夫·内塔尼亚胡(Aviv Netanyahu)、阿比谢克·古普塔(Abhishek Gupta)、,马克斯·辛乔维茨张开清(Kaiqing Zhang)、阿格拉瓦尔(Pulkit Agrawal)。NeurIPS 2022配电转移研讨会(DistShift), 2022.
广义线性函数的高效近最优平滑在线学习
α: 亚当·布洛克,马克斯·辛乔维茨.NeurIPS公司, 2022.
基于动态滤波器的输出估计全局收敛策略搜索
杰克·乌姆伯格*,马克斯·辛乔维茨*Juan C.Perdomo、Kaiqing Zhang、Russ Tedrake。NeurIPS公司, 2022.
不同的模拟器能提供更好的政策梯度吗?
H.J.Terry Suh,马克斯·辛乔维茨张开庆,俄罗斯特德雷克。ICML公司,杰出论文奖, 2022.
在线性马尔可夫决策过程中,无奖励RL并不比奖励软件RL困难
Andrew Wagenmaker、Yifang Chen、,马克斯·辛乔维茨西蒙·S·杜(Simon S.Du)、凯文·杰米森(Kevin Jamieson)。ICML公司,聚光灯。2022
线性函数逼近强化学习中的一阶后悔:一种稳健估计方法
Andrew Wagenmaker、Yifang Chen、,马克斯·辛乔维茨西蒙·S·杜(Simon S.Du)、凯文·杰米森(Kevin Jamieson)。ICML公司,口头。, 2022.
超越无悔:依赖实例的PAC强化学习
Andrew Wagenmaker,马克斯·辛乔维茨,凯文·贾米森。COLT公司, 2022.
2021
错误先验下的贝叶斯决策及其在元学习中的应用
马克斯·辛乔维茨克里斯托弗·托什(Christopher Tosh)、阿克谢·克里希纳穆西(Akshay Krishnamurthy)、丹尼尔·徐(Daniel Hsu)、,
Thodoris Lykouris、Miroslav Dudík、Robert E.Schapire。纽里普斯,聚光灯, 2021.
利用策略梯度方法稳定动态系统
Juan C.Perdomo、Jack Umenberger、,马克斯·辛乔维茨.诺伊里普斯, 2021.
未知时变动力系统的在线控制
Edgar Minasyan、Paula Gradu、,马克斯·辛乔维茨埃拉·哈赞(Elad Hazan)。纽里普斯, 2021.
非线性下降视界控制的稳定性:一个几何观点
Tyler Westenbroek公司*,马克斯·辛乔维茨*,迈克尔·I·乔丹,S·尚卡·萨斯特里。疾病预防控制中心, 2021.
线性动力系统中的任务优化探索
Andrew Wagenmaker,马克斯·辛乔维茨凯文·杰米森。ICML公司, 2021.
对自适应线性控制的无量纲理解
胡安·佩尔多莫,马克斯·辛乔维茨阿列克·阿加瓦尔(Alekh Agarwal)、彼得·巴特利特(Peter Bartlett)。COLT公司, 2021.
α: 情景强化学习中的腐败稳健探索
利库里斯(Thodoris Lykouris),马克斯·辛乔维茨、Aleksandrs Slivkins、Wen Sun。COLT(扩展摘要), 2021.
2020
使非随机控制(几乎)与随机控制一样简单
马克斯·辛乔维茨.NeurIPS公司, 2020.
从非线性学习线性二次正则观察
扎克·穆罕默德、迪伦·福斯特,马克斯·辛乔维茨迪潘德拉·米斯拉,
阿克谢·克里希纳穆西(Akshay Krishnamurthy)、萨沙·拉赫林(Sasha Rakhlin)、约翰·朗福德(John Langford)。NeurIPS公司, 2020.
凹凸和背包环境下的约束情景强化学习
α: KiantéBrantley、Miroslav Dudik、Thodoris Lykouris、Sobhan Miryoosefi、,
马克斯·辛乔维茨、Aleksandrs Slivkins、Wen Sun.NeurIPS公司, 2020.
非随机控制的不当学习
马克斯·辛乔维茨卡兰·辛格(Karan Singh)、伊拉德·哈赞(Elad Hazan)。COLT公司, 2020.
天真的探索是在线LQR的最佳选择
马克斯·辛乔维茨迪伦·福斯特。ICML公司, 2020.
用噪声数据平衡竞争目标:基于分数的分类器用于Welfare-Aware机器学习
埃丝特·罗尔夫,马克斯·辛乔维茨、莎拉·迪恩、莉迪亚·刘晓东、丹尼尔·BjöMarkegren、Moritz Hardt、Joshua Blumenstock。ICML公司, 2020.
对抗干扰下在线控制的对数后悔
迪伦·福斯特,马克斯·辛乔维茨.ICML公司, 2020.
强化学习的无偿探索
α: Chi Jin、Akshay Krishnamurthy、,马克斯·辛乔维茨、天成余。ICML公司, 2020.
线性回归的梯度复杂性
α: Mark Braverman、Elad Hazan、,马克斯·辛乔维茨,Blake Woodworth。COLT公司, 2020.
一种自适应机器人寻源的逐次消除方法
Esther Rolf、David Fridovich-Keil、,马克斯·辛乔维茨本杰明·雷奇特(Benjamin Recht)、克莱尔·汤姆林(Claire Tomlin)。IEEE机器人汇刊, 2020.
2019
表列MDP的非共鸣Gap-依赖后悔界
马克斯·辛乔维茨凯文·杰米森。NeurIPS公司, 2019.
用半参数最小二乘学习线性动力系统
马克斯·辛乔维茨罗斯·博查尔(Ross Boczar)、本杰明·雷奇特(Benjamin Recht)。COLT公司, 2019.
无约束学习的内隐公平标准
Lydia Liu,马克斯·辛乔维茨莫里茨·哈德(Moritz Hardt)。ICML公司, 2019.
利用不完整数据平衡Welfare-Aware机器学习的竞争目标。
埃丝特·罗尔夫,马克斯·辛乔维茨、莎拉·迪恩、莉迪亚·刘晓东、丹尼尔·BjöMarkegren、Moritz Hardt、Joshua Blumenstock。人工智能社会公益神经信息处理系统联合研讨会,最佳论文奖, 2019.
一阶方法几乎总是避免鞍点
Jason D.Lee、Ioannis Panageas、Georgios Piliouras、,马克斯·辛乔维茨迈克尔·乔丹(Michael I.Jordan)、本杰明·雷希特(Benjamin Recht)。数学规划(第1-27页), 2019.
2018
不混合学习:线性系统辨识的尖锐分析
马克斯·辛乔维茨,Horia Mania,Stephen Tu,Benjamin Recht,Michael I.Jordan。COLT公司,2018年。
公平机器学习的延迟影响
Lydia T.Liu、Sarah Dean、Esther Rolf、,马克斯·辛乔维茨莫里茨·哈德(Moritz Hardt)。ICML公司,最佳论文奖2018
基于有限样本变形Wigner定律的PCA紧查询复杂度下限
马克斯·辛乔维茨艾哈迈德·阿拉维(Ahmed El Alaoui)、本杰明·雷希特(Benjamin Recht)。STOC公司,2018年。
成对比较的近似排名
莱因哈德·赫克尔,马克斯·辛乔维茨坎南·兰昌德兰(Kannan Ramchandran)、马丁·温赖特(Martin J.Wainwright)。AISTATS公司,2018年。
2017
模拟器:加深对中等置信度下自适应抽样的理解
马克斯·辛乔维茨Kevin Jamieson和Benjamin Recht。COLT公司, 2017.
2016
K级强盗中的佼佼者
马克斯·辛乔维茨Kevin Jamieson和Benjamin Recht。COLT公司, 2016.
梯度下降收敛到最小化.
Jason D.Lee,马克斯·辛乔维茨Michael I.Jordan和Benjamin Recht。COLT公司, 2016.
基于Procrustes流的线性矩阵方程的低阶解。
Stephen Tu、Ross Boczar、,马克斯·辛乔维茨马赫迪·索塔诺尔科塔比(Mahdi Soltanolkotabi)、本杰明·雷希特(Benjamin Recht)。ICML公司, 2016.