亚历克斯·达米安
人员信息
其他同名人员
优化列表
2020年-今天
2024 [i8] 埃沙安·尼查尼 , 亚历克斯·达米安 , 杰森·D·李 :
变形金刚如何通过梯度下降学习因果结构。 CoRR公司 abs/2402.14735 ( 2024 ) [i7] 亚历克斯·达米安 , Loucas Pillaud-Vivien公司 , 杰森·D·李 , 琼·布鲁纳 :
高斯单指数模型中的计算统计间隙。 CoRR公司 abs/2403.05529 ( 2024 ) 2023 【c5】 亚历克斯·达米安 , 埃沙安·尼查尼 , 杰森·D·李 :
自我稳定:稳定边缘梯度下降的隐含偏差。 ICLR公司 2023 [c4] 亚历克斯·达米安 , 埃沙安·尼查尼 , 荣歌 , 杰森·D·李 :
平滑环境增强了SGD的信号:学习单指数模型的最佳样本复杂度。 NeurIPS公司 2023 【c3】 萨迪卡·马拉迪 , 天宇高 , Eshaan Nichani公司 , 亚历克斯·达米安 , 杰森·D·李 , 陈丹琪 , 桑吉弗·阿罗拉 :
具有正向传递的微调语言模型。 NeurIPS公司 2023 【c2】 埃沙安·尼查尼 , 亚历克斯·达米安 , 杰森·D·李 :
三层神经网络中非线性特征学习的可证明保证。 NeurIPS公司 2023 [i6] Eshaan Nichani公司 , 亚历克斯·达米安 , 杰森·D·李 :
三层神经网络中非线性特征学习的可证明保证。 CoRR公司 abs/2305.06986 ( 2023 ) [i5] 亚历克斯·达米安 , 埃沙安·尼查尼 , 荣格 , 杰森·D·李 :
平滑环境增强了SGD的信号:学习单指数模型的最佳样本复杂度。 CoRR公司 腹肌/230510633 ( 2023 ) [i4] 萨迪卡·马拉迪 , 天宇高 , 埃沙安·尼查尼 , 亚历克斯·达米安 , 杰森·D·李 , 陈丹琪 , 桑吉弗·阿罗拉 :
具有正向传递的微调语言模型。 CoRR公司 abs/2305.17333 ( 2023 ) 2022 [i3] 亚历克斯·达米安 , 杰森·D·李 , 马赫迪·索塔诺尔科塔比 :
神经网络可以通过梯度下降学习表示。 CoRR公司 abs/2206.15144 ( 2022 ) [i2] 亚历克斯·达米安 , 埃沙安·尼查尼 , 杰森·D·李 :
自我稳定:稳定边缘梯度下降的隐含偏差。 CoRR公司 abs/2209.15594 ( 2022 ) 2021 【c1】 亚历克斯·达米安 , 马腾宇(Tengyu Ma) , 杰森·D·李 :
标签噪声SGD显然更喜欢平面全局最小化。 NeurIPS公司 2021 : 27449-27461 [i1] 亚历克斯·达米安 , 马腾宇(Tengyu Ma) , 杰森·D·李 :
标签噪声SGD显然更喜欢平面全局最小化。 CoRR公司 abs/2106.06530 ( 2021 )