我们可以使用链接到您的Project Euclid帐户的电子邮件地址帮助您重置密码。
我们考虑一个强凸目标函数的最小化问题,该目标函数通过具有恒定步长的随机梯度下降(SGD)获得其梯度的无偏估计。虽然仅对二次函数进行了详细分析,但我们提供了平均SGD迭代矩的显式渐近展开,概述了对初始条件的依赖性、噪声的影响和步长,以及在一般(非二次)情况下缺乏收敛性。为此,我们将马尔可夫链理论的工具引入随机梯度分析。然后,我们证明了Richardson–Romberg外推可以用于更接近全局最优值,并且我们证明了新外推方案的经验改进。
Aymeric Dieuleveut。 阿兰·杜莫斯。 弗朗西斯·巴赫。 “架起恒定步长随机梯度下降和马尔可夫链之间的桥梁。” 安。统计师。 48 (3) 1348 - 1382, 2020年6月。 https://doi.org/10.1214/19-AOS1850