基于云边协同子类蒸馏的卷积神经网络模型压缩方法

doi:10.11896/jsjkx.240100038

摘要

摘要：在当前卷积神经网络模型的训练和分发过程中，云具有足够的计算资源和数据集，但难以满足边缘场景中的碎片化需求。边缘侧可以直接训练和推断模型，但很难直接使用根据统一规则在云中训练的卷积神经网络模型。针对边缘端资源有限的情况下，用于模型压缩的卷积神经网络算法训练和推理效率低的问题，首先提出了一种基于云边缘协作的模型分发和训练框架。该框架可以结合云和边缘的优势进行模型再训练，满足边缘对指定识别目标、指定硬件资源和指定精度的要求。其次，基于云边缘协同框架的训练方法，提出了基于logits和channel的新的子类知识提取方法（SLKD和SCKD），以改进知识提取技术。云服务器首先提供一个具有多目标识别的模型，然后通过子类知识提取方法，将该模型从边缘重新定义为一个轻量级模型，该模型可以部署在资源有限的场景中。最后，在CIFAR-10数据集上验证了联合训练框架和两个子类蒸馏算法的有效性。实验结果表明，在压缩比为50%时，与全分类模型相比，推理精度提高了10%-11%。与模型的再训练相比，通过知识蒸馏方法训练的模型的精度也得到了很大的提高，并且压缩比越高，模型精度的提高越显著。

关键词： 云边缘协作，深度学习，知识提炼，模型压缩，特征提取

CLC编号：

TP391.4标准

孙静、王晓霞。基于云边缘协同子类提取的卷积神经网络模型压缩方法[J]。计算机科学，2024，51（5）：313-320。

工具书类

[1] SIMONYAN K，ZISSERMAN A.用于大规模图像识别的超深卷积网络[J]。计算机科学，2014,18（3）：178-182。
[2] IANDOLA F N，HAN S，MOSKEWICZ M W，等.Squeeze-Net：AlexNet级精度，参数少50倍，模型大小小于0.5MB[J].arXiv.1602.073602016。
[3] SANDLER M，HOWARD A，ZHU M，等.MobileNetV2:倒置残差与线性瓶颈[C]//IEEE/CVF计算机视觉与模式识别会议论文集。盐湖城：IEEE出版社，2018:4510-4520。
[4] FRANKLE J，CARBIN M.彩票假设：发现稀疏、可训练的神经网络[C]//Se-venth国际学习表征会议论文集。新奥尔良：ICLR，2019年。
[5] 刘泽，孙敏，周涛，等.网络剪枝价值的再思考[C]//第七届学习表征国际会议论文集。新奥尔良：ICLR，2019。
[6] 辛顿G，维尼亚尔斯O，迪安J.在神经网络中提取知识[J]。计算机科学，2015,14（7）：38-39。
[7] PANG Y H，ZHANG Y M，WANG Y，等，探索模型压缩极限和规律：卫星在轨目标识别的金字塔知识提取框架[J]。IEEE地球科学与遥感汇刊，2024（62）：1-13。
[8] 蔡永浩，姚振伟，董振华，等，Zeroq:一种新的零镜头量化框架[C]//2020 IEEE/CVF计算机视觉与模式识别会议论文集。IEEE，2020:13166-13175。
[9] AKBARI A，JAFARI R.利用深度生成域自适应技术传输新型可穿戴传感器的活动识别模型[C]//第18届传感器网络信息处理国际会议论文集。纽约：ACM，2019:85-96。
[10] ROKNI S A，GHASEMZADEH H.同步动态视图学习：使用可穿戴传感器自主训练活动识别模型的框架[C]//第16届ACM/IEEE传感器网络信息处理国际会议论文集。2017:79-90。
[11] 张毅，湘T，HOSPEDALES T M，等.深度互学[C]//IEEE计算机视觉与模式识别会议论文集.2018:4320-4328。
[12] FURLANELLO T，LIPTON Z C，TSCHANNEN M，等.再生神经网络[C]//国际机器学习会议.2018:1607-1616。
[13] MIRZADEH S I，FARAJTABAR M，LI A，et al.通过教师助理改进知识蒸馏[C]//美国人工智能学会人工智能会议论文集.2020:5191-5198。
[14] 阿德里安娜·R，BALLASN，KAHOU SE，等。Fitnets:thin deep nets的提示[J]。arXiv:1412.65502014。
[15] PARK W，KIM D，LU Y，等。关系知识提取[C]//IEEE/CVF计算机视觉与模式识别会议论文集。长滩：IEEE出版社，2019:3967-3976。
[16] HEO B，KIM J，YUN S，等.特征提取的全面检修[C]//IEEE国际计算机视觉会议论文集.2019:1920-1931。
[17] LOPES R G，FENU S，STARNER T.深度神经网络的无数据知识提取[J].arXiv:1710.075352017。
[18] YE J，JI Y，WANG X，et al.通过组Stack dual gan进行无数据知识融合[C]//IEEE/CFF计算机视觉和模式识别会议论文集。CVPR，2020:12513-12522。
[19] YOO J，CHO M Y，KIM T.无观测数据的知识提取[J]。神经信息处理系统进展32.NeurIPS，2019,32:2701-2710。
[20] 宋杰，陈毅，叶杰，等.点自适应知识提取[J]。IEEE图像处理汇刊，IEEE，2022,31:3359-3370。
[21]赵斌，崔琦，宋瑞杰，等.解耦知识提取[C]//IEEE/CVF计算机视觉与模式识别会议论文集.2022:1953-11962。
[22]BEYER L，ZHAI X，ROYER A，et al.知识提炼：一个好老师是耐心和始终如一的[C]//IEEE/CVF计算机视觉和模式识别会议论文集.2022:10925-10934。
[23]何凯，张欣，任仕，等.基于深度卷积网络的视觉识别空间金字塔池[J]。IEEE模式分析与机器智能事务，2015,37（9）：1904-1916。
[24]何克明，张晓云，任世清，等.图像识别的深度剩余学习[C]//2016 IEEE计算机视觉与模式识别会议。IEEE，2016:770-778。

相关文章15

[1]	鲍开南、张俊波、宋丽、李天瑞。ST-WaveMLP：用于交通流预测的时空全球软件网络[J] ●●●●。计算机科学，2024，51（5）：27-34。
[2]	张建良、李阳、朱青山、薛红玲、马俊伟、张丽霞、毕生。基于双域稀疏变压器的变电站设备故障报警算法[J] ●●●●。计算机科学，2024，51（5）：62-69。
[3]	何世阳、王朝辉、龚盛荣、钟山。基于交叉模式信息过滤的可视问答网络[J] ●●●●。计算机科学，2024，51（5）：85-91。
[4]	宋建峰、张文英、韩璐、胡国正、迈克奇光。黑白电影的多阶段智能色彩恢复算法[J] ●●●●。计算机科学，2024，51（5）：92-99。
[5]	何晓辉、周涛、李潘乐、常静、李家棉。基于多尺度注意的遥感图像建筑物提取研究[J] ●●●●。计算机科学，2024，51（5）：134-142。
[6]	徐学杰、王宝辉。基于文本和历史数据的多标签专利分类[J] ●●●●。计算机科学，2024，51（5）：172-178。
[7]	李自晨、易修文、陈顺、张俊波、李天瑞。基于深度多视网络的政府事件调度方法[J] ●●●●。计算机科学，2024，51（5）：216-222。
[8]	洪体静、刘登峰、刘毅。基于多尺度全卷积神经网络和GRU的雷达有源干扰识别[J] ●●●●。计算机科学，2024，51（5）：306-312。
[9]	陈润环、戴华、郑贵能、李辉、杨庚。基于差异补偿和短时采样对比损耗的城市电力负荷预测方法[J] ●●●●。计算机科学，2024，51（4）：158-164。
[10]	林斌伟、余志勇、黄芳婉、郭显伟。基于Transformer的街道停车位数据完善与预测[J] ●●●●。计算机科学，2024，51（4）：165-173。
[11]	王旭、刘长虹、李胜春、刘爽、赵康廷、陈亮。基于自然语言生成的制造企业自动图表分析方法研究[J] ●●●●。计算机科学，2024，51（4）：174-181。
[12]	宋浩、毛冠民、朱舟。基于GAANET的立体匹配算法[J] ●●●●。计算机科学，2024，51（4）：229-235。
[13]	薛金强、吴琴。卷积神经网络和小波变换相结合的渐进多级图像去噪算法多层感知器[J] ●●●●。计算机科学，2024，51（4）：243-253。
[14]	刘伟、刘玉钊、唐聪科、王渊源、佘伟、田昭。基于区块链的联合蒸馏数据共享模型研究[J] ●●●●。计算机科学，2024，51（3）：39-47。
[15]	黄坤、孙伟伟。基于缺失数据的交通速度预测算法[J] ●●●●。计算机科学，2024，51（3）：72-80。

韵律学

已查看

全文

摘要

引用

共享

讨论

基于云边缘协同子类提取的卷积神经网络模型压缩方法

PDF（PC）

摘要

引用这篇文章

分享这篇文章

工具书类

相关文章15

韵律学

评论

推荐0