开放式访问
2020年6月 弥合常步长随机梯度下降和马尔可夫链之间的差距
艾默尔·迪乌列韦特,阿兰·杜尔姆斯,弗朗西斯·巴赫
安。统计师。 48(3): 1348-1382 (2020年6月)。 数字对象标识码:10.1214/19-AOS1850

摘要

我们考虑一个强凸目标函数的最小化问题,该目标函数通过具有恒定步长的随机梯度下降(SGD)获得其梯度的无偏估计。虽然仅对二次函数进行了详细分析,但我们提供了平均SGD迭代矩的显式渐近展开,概述了对初始条件的依赖性、噪声的影响和步长,以及在一般(非二次)情况下缺乏收敛性。为此,我们将马尔可夫链理论的工具引入随机梯度分析。然后,我们证明了Richardson–Romberg外推可以用于更接近全局最优值,并且我们证明了新外推方案的经验改进。

引用

下载引文

Aymeric Dieuleveut。 阿兰·杜莫斯。 弗朗西斯·巴赫。 “架起恒定步长随机梯度下降和马尔可夫链之间的桥梁。” 安。统计师。 48 (3) 1348 - 1382, 2020年6月。 https://doi.org/10.1214/19-AOS1850

问询处

收到日期:2018年4月1日;修订日期:2019年4月1日;出版日期:2020年6月
欧几里德项目首次提供:2020年7月17日

zbMATH公司:07241594
数学科学网:MR4124326
数字对象标识符:10.1214/19-AOS1850

学科:
主要用户:62L20型
次要:90立方厘米,第93页第35页

关键词:马尔可夫链,随机梯度下降算法

版权所有©2020数学统计研究所

第48卷•第3期•2020年6月
返回页首