Adam: A Method for Stochastic Optimization

Kingma, Diederik P.; Ba, Jimmy

计算机科学>机器学习

arXiv:1412.6980（cs）

【提交日期：2014年12月22日(第1版)，最新修订日期：2017年1月30日（本版本，第9版）]

职务：Adam：一种随机优化方法

作者：迪德里克·金马,吉米·巴

查看PDF

摘要：我们介绍了Adam，一种基于低阶矩自适应估计的随机目标函数一阶梯度优化算法。该方法实现简单，计算效率高，内存需求少，对梯度的对角线缩放不变性，非常适合于数据和/或参数较大的问题。该方法也适用于非平稳目标和具有非常噪声和/或稀疏梯度的问题。超参数具有直观的解释，通常只需要很少的调整。讨论了Adam受到启发的相关算法的一些联系。我们还分析了该算法的理论收敛性，并给出了收敛速度的遗憾界，该收敛速度与在线凸优化框架下的最佳已知结果相当。实证结果表明，Adam在实践中表现良好，与其他随机优化方法相比，具有良好的性能。最后，我们讨论AdaMax，它是Adam基于无穷范数的变体。

评论：	在2015年圣地亚哥第三届国际学习代表大会上作为会议论文发表
学科：	机器学习（cs.LG）
引用为：	arXiv:1412.6980【cs.LG】
	（或 arXiv:1412.6980v9【cs.LG】对于此版本）
	https://doi.org/10.44850/arXiv.1412.6980

提交历史记录

发件人：Diederik P Kingma理学硕士[查看电子邮件]
[第1版]2014年12月22日星期一13:54:29 UTC（280 KB）
[版本2]2015年1月17日星期六20:26:06 UTC（283 KB）
[第3版]2015年2月27日星期五21:04:48 UTC（289 KB）
[第4版]2015年3月3日星期二17:51:27 UTC（289 KB）
[第5版]2015年4月23日星期四16:46:07 UTC（289 KB）
[版本6]2015年6月23日星期二19:57:17 UTC（958 KB）
[第7版]2015年7月20日星期一09:43:23 UTC（519 KB）
[第8版]2015年7月23日星期四20:27:47 UTC（526 KB）
[第9版]2017年1月30日星期一01:27:54 UTC（490 KB）

计算机科学>机器学习

职务：Adam：一种随机优化方法

提交历史记录

访问纸张：

参考文献和引文

42个博客链接

DBLP公司-CS书目

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>机器学习

职务：Adam：一种随机优化方法

提交历史记录

访问纸张：

参考文献和引文

42个博客链接

DBLP公司-CS书目

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目