141引文
BN如何增加折叠神经网络滤波器?
2020
少即是多:深度神经网络的自适应可训练梯度删除
2023
基于Sharkovsky定理的ReLU网络深度-宽度权衡
2020
深整流网络中神经元死亡的概率界
2020
用可变性解释多层感知器可训练性
2021
常目标函数ReLU激活深度神经网络训练中随机梯度下降的收敛性证明
2021
深度神经网络的鲁棒训练和初始化:自适应基观点
2020
78参考文献
哪些神经网络结构会导致梯度的爆炸和消失?
2018
激活函数中的小非线性会在神经网络中产生坏的局部极小值
2019
自归一化神经网络
2017
深度学习中初始化和动量的重要性
2013
深线性神经网络非线性学习动力学的精确解
2014
深度网络与浅层网络:近似理论视角
2016