-
扩散世界模型
丁子汉、张艾米、田远东、,郑庆庆
[纸张]
-
生成建模和决策的引导流
郑庆庆马特·勒、内塔·绍尔、亚伦·利普曼、阿迪蒂亚·格罗弗、Ricky T.Q.Chen
[纸张]
-
双重RL:强化与模仿学习的统一与新方法
ICLR 2024年
(聚光灯)
哈拉希·西科奇,郑庆庆、艾米·张、斯科特·尼库姆
[纸张]
[代码]
-
无动作轨迹的半监督离线强化学习
郑庆庆米凯尔·赫纳夫、布兰登·阿莫斯、阿迪蒂亚·格罗弗
ICML 2023年
[纸张]
[代码]
-
用于可靠离线强化学习的连续加权行为克隆
董阮,郑庆庆阿迪蒂亚·格罗弗
[纸张]
[代码]
-
潜在状态边缘化作为改进勘探的低成本方法
张定怀、阿伦·库维尔、约舒亚·本吉奥、,秦青郑、Amy Zhang、Ricky T.Q.Chen
ICLR 2023年
[纸张]
-
在线决策变压器
郑钦清、Amy Zhang、Aditya Grover
ICML 2022年
(长篇口头报告)
[纸张]
[代码]
[海报]
-
有界随机变量的近最优置信序列
Arun Kumar Kuchibhotla*,郑庆庆*(*同等出资)
ICML 2021年
(聚光灯)
[纸张]
[代码]
-
个性化联合学习的替代性定理陈树晓,郑庆庆、齐龙、苏伟杰
提交。
[纸张]
-
联邦\(f\)-差异隐私
郑庆庆陈树晓、齐龙、苏伟杰
AISTATS 2021年
[纸张]
[代码]
-
基于Edgeworth展开的高斯差分隐私的尖锐合成边界
郑庆庆、董金硕、齐龙、苏伟杰
ICML 2020年
[纸张]
[代码]
-
ShadowSync:在后台执行同步以实现高度可扩展的分布式训练
郑庆庆、Bor-Ying Su、Jiyan Yang、Alisson Azzolini、Qiang Wu、Ou Jin、Shri Karandikar、Hagay Lupesko、Liang Xiong、Eric Zhou
[纸张]
-
基于Burr-Monteiro分解和梯度下降的矩形矩阵完备化收敛性分析
郑庆庆约翰·拉弗蒂
[纸张]
-
随机线性测量中秩最小化和半定规划的收敛梯度下降算法
郑庆庆,约翰·拉弗蒂
NeurIPS 2015
[纸张]
[海报]
-
利用子空间范数插值凸和非凸张量分解
郑庆庆、Ryota Tomioka
NeurIPS 2015
[纸张]
[代码]
[海报]