丁、田;李大伟;孙若愚 具有光滑激活的宽神经网络存在次优局部极小值。 (英语) Zbl 1510.90210号 数学。操作。物件。 47,第4期,2784-2814(2022).MSC公司:90C26型 68T07型 49 K10 PDF格式BibTeX公司 XML格式引用 \textit{T.Ding}等人,数学。操作。第47号决议,第4号,2784--2814(2022年;Zbl 1510.90210) 全文: 内政部
梁世玉;孙若愚;R·斯里坎特。 重新审视深层神经网络中的景观分析:消除通向无穷大的递减路径。 (英语) 兹伯利1507.90136 SIAM J.Optim公司。 32,第4号,2797-2827(2022).MSC公司:90C26型 90立方 90 C90 PDF格式BibTeX公司 XML格式引用 \textit{S.Liang}等人,SIAM J.Optim。32,第4号,2797--2827(2022;Zbl 1507.90136) 全文: 内政部 arXiv公司
李大伟;丁、田;孙若愚 关于神经网络宽度的好处:流域消失。 (英语) Zbl 1493.68331号 SIAM J.Optim公司。 32,第3期,1728-1758(2022).MSC公司:68T07型 PDF格式BibTeX公司 XML格式引用 \textit{D.Li}等人,SIAM J.Optim。32,第3号,1728-1758(2022;Zbl 1493.68331) 全文: 内政部 arXiv公司
孙若瑜 深度学习优化:概述。 (英语) Zbl 1463.90212号 《运营杂志》。Res.Soc.中国 8,第2期,249-294(2020).MSC公司:90立方 第68季度32 PDF格式BibTeX公司 XML格式引用 \textit{R.-Y.Sun},J.Oper。中国研究院8号,第2期,249--294(2020;Zbl 1463.90212) 全文: 内政部