刘金兰;孔骏;徐东坡;齐、苗;陆英华 非凸优化中带松弛界函数的AdaBound的收敛性分析。 (英语) Zbl 1521.68191号 神经网络。 145, 300-307 (2022).MSC公司:68T07型 90立方厘米 90C26型 90 C90 PDF格式BibTeX公司 XML格式引用 \textit{J.Liu}等人,神经网络。145300-307(2022年;兹比尔1521.68191) 全文: 内政部
陈景润;金、石;吕丽瑶 一种基于共识的自适应动量估计全局优化方法。 (英语) Zbl 1508.68283号 Commun公司。计算。物理学。 31,第4期,1296-1316(2022).MSC公司:68T05型 90立方厘米 90C26型 90 C90 PDF格式BibTeX公司 XML格式引用 \textit{J.Chen}等人,Commun。计算。物理学。31,第4号,1296--1316(2022;Zbl 1508.68283) 全文: 内政部 arXiv公司
瑞秋·沃德;吴晓霞;莱昂·博图 AdaGrad步长:在非凸地形上急剧收敛。 (英语) Zbl 1531.68104号 J.马赫。学习。物件。 21,第219号论文,第30页(2020年).MSC公司:68T05型 90C06型 90立方厘米 90C26型 90 C90 PDF格式BibTeX公司 XML格式引用 \textit{R.Ward}等人,J.Mach。学习。第21号决议,第219号文件,第30页(2020年;兹bl 1531.68104) 全文: arXiv公司 链接
Tomoumi Takase;佐藤小山;栗原、Masahito 为什么大批量训练会导致泛化能力差?从随机优化的角度进行全面的解释和更好的策略。 (英语) Zbl 1472.68159号 神经计算。 2005-2023年第7期30号(2018年).MSC公司:68T05型 68T07型 90立方厘米 90C26型 PDF格式BibTeX公司 XML格式引用 \textit{T.Takase}等人,《神经计算》。2005年7月30日-2023年(2018年;Zbl 1472.68159) 全文: 内政部 链接