深度网络中谱普适性的出现
Jeffrey Pennington、Samuel Schoenholz、Surya Ganguli
第二十届国际人工智能与统计会议记录,PMLR 84:1924-19322018年。
摘要
最近的工作表明,深度网络的输入-输出雅可比矩阵的奇异值的整个谱在初始化时紧密地集中在1附近,可以按数量级加速学习。因此,为了指导重要的设计选择,重要的是在初始化时建立对雅可比谱的完整理论理解。为此,我们利用自由概率理论的强大工具,对深度网络的雅可比谱如何依赖于各种超参数(包括非线性、权重和偏差分布以及深度)提供了详细的分析理解。对于各种非线性,我们的工作揭示了新的普遍极限光谱分布的出现,即使深度达到无穷大,这些分布仍然集中在一个周围。
引用本文
相关材料