@第{JMLR:v25-23-1073条,author={潘舟、谢星宇、林周晨、金传德、颜水成},title={Win:Weight-Decay集成Nesterov加速,加快网络训练},journal={机器学习研究杂志},年份={2024},体积={25},数字={83},页数={1--74},url={http://jmlr.org/papers/v25/23-173.html}}