-
语言模型对齐的自演偏好优化
吴岳*、孙志清*、袁慧卓*、季凯轩、杨一鸣和顾全全,arXiv公司:2405.00675, 2024.
-
用于文本图像生成的扩散模型的自玩微调
袁慧卓*、陈子香*、季凯轩*、顾全全*,arXiv公司:2402.10210, 2024.
-
自我游戏微调将弱语言模型转换为强语言模型
陈子祥*、邓一禾*、袁慧卓*、季凯轩和顾全全,程序中。第41届国际机器学习会议(ICML)奥地利维也纳,2024年。[arXiv]
-
近似正交数据上双层ReLU和Leaky ReLU网络梯度下降的隐式偏差
口一文*、陈子祥*和顾全泉,程序中。神经信息处理系统(NeurIPS)的进展362023年,美国洛杉矶新奥尔良。[arXiv]
-
为什么Sharness-Aware Minimization的通用性优于SGD?
陈子祥*、张俊凯*、寇艺文、陈香凝、谢卓绝和顾全全,程序中。神经信息处理系统(NeurIPS)进展362023年,美国洛杉矶新奥尔良。[arXiv]
-
线性马尔可夫决策过程的近似极小极大最优强化学习
何家凡、赵合阳、周东若、顾全全,程序中。第40届国际机器学习会议(ICML)美国夏威夷,2023年。[arXiv]
-
双层ReLU卷积神经网络的良性过拟合
寇一文*、陈子祥*、陈元洲和顾全全,程序中。第40届国际机器学习会议(ICML),美国夏威夷,2023年。[arXiv]
-
线性强盗与强化的方差相关回归界学习:适应性和计算效率
赵合阳、何家凡、周东如、张彤、顾全全,程序中。第36届学习理论年会(COLT)印度班加罗尔,2023年。[arXiv]
-
线性混合MDP的计算效率无水平强化学习
周东若、顾泉泉,程序中。神经信息处理系统(NeurIPS)的进展352022年,美国洛杉矶新奥尔良。口头报告 [arXiv]
-
具有对抗性的线性上下文带的近似最优算法腐蚀
何家凡、周东若、张彤、顾全全,程序中。神经信息处理系统(NeurIPS)的进展352022年,美国洛杉矶新奥尔良。[arXiv]
-
插值中最小二乘法的多通道SGD风险界政体
邹迪凡*、吴京峰*、弗拉基米尔·布拉弗曼、顾全全和沙姆·M·卡卡德,程序中。神经信息处理系统(NeurIPS)的进展35,美国洛杉矶新奥尔良,2022年。[arXiv]
-
双层卷积神经网络中的良性过拟合
袁操*、陈子祥*、米哈伊尔·贝尔金和顾全全,程序中。神经信息处理系统(NeurIPS)的进展352022年,美国洛杉矶新奥尔良。口头报告 [arXiv]
-
具有衰减步长的SGD的最后迭代风险界超参数线性回归
吴京峰*、邹迪凡*、弗拉基米尔·布拉弗曼、顾全全和沙姆·M·卡卡德,程序中。第39届国际机器学习会议(ICML)美国马里兰州巴尔的摩,2022年。长演示文稿 [arXiv]
-
SGD隐式正则化在最小二乘问题中的益处
邹迪凡*、吴京峰*、弗拉基米尔·布拉弗曼、顾全全、院长P.福斯特和Sham M.卡卡德,程序中。神经信息处理系统(NeurIPS)的进展34, 2021.[arXiv]
-
次高斯混合下超参数最大利润分类的风险边界
袁操、顾全全、米哈伊尔·贝尔金、,程序中。神经信息处理系统(NeurIPS)的进展34, 2021.[arXiv]
-
线性回归中常步长SGD的良性过度拟合
邹迪凡、吴京峰、弗拉基米尔·布拉弗曼、顾全全和沙姆·M·卡卡德,程序中。第34届学习理论年会(COLT), 2021.[arXiv]
-
线性混合马尔可夫决策过程的近似Minimax最优强化学习
周东若、顾全全、塞佩斯瓦里,程序中。第34届学习理论年会(COLT), 2021.[arXiv]
-
基于软边缘的梯度下降半空间的不可知学习
Spencer Frei、Yuan Cao和顾全泉,程序中。第38届国际机器学习会议(ICML), 2021.长谈 [arXiv]
-
针对折扣MDP的有效强化学习要素映射
周东若、何家凡、顾全全,程序中。第38届国际机器学习会议(ICML), 2021.[arXiv]
-
多大程度的超参数化足以深入了解ReLU网络?
陈子祥*、袁操*、邹迪凡*、顾全全*,程序中。第九届国际学习代表大会, 2021.[arXiv]
-
两层神经网络的广义神经切线核分析
陈子祥、袁操、顾全全、张彤,程序中。神经信息处理系统(NeurIPS)的进展33, 2020.[arXiv]
-
宽深度神经网络随机梯度下降的推广界
袁操、顾全全,程序中。神经信息处理系统(NeurIPS)进展32,加拿大温哥华, 2019.聚光灯演示 [arXiv]
-
参数化深度神经网络训练的改进分析
邹迪凡、顾全全,程序中。神经信息处理系统(NeurIPS)进展32,加拿大温哥华, 2019.[arXiv]
-
梯度下降优化超参数深层ReLU网络
邹迪凡*、袁操*、周东若和顾全全,机器学习杂志(MLJ)接受, 2019.[arXiv]
-
光滑非凸有限和优化的下界
周东若、顾泉泉,在Proc。第36届国际机器学习会议(ICML),美国加利福尼亚州长滩, 2019.[arXiv]
-
非凸优化的随机嵌套方差约简
周东若、潘旭、顾全全,程序中。神经信息处理系统(NeurIPS)进展31,加拿大蒙特利尔, 2018.聚光灯演示 [arXiv]