计算机科学››2024,第51卷››问题(5): 313-320.数字对象标识:10.11896/jsjkx.240100038

•计算机网络• 以前的文章   下一篇文章

基于云边缘协同子类提取的卷积神经网络模型压缩方法

孙静1,王晓霞2  

  1. 1华东政法大学智能科学与信息法系,中国上海,201620
    2西北师范大学计算机科学与工程学院,兰州,730070
  • 收到:2024-01-02 修订过的:2024-03-25 在线:2024-05-15 出版:2024-05-08
  • 关于作者:孙静,1985年生,博士,讲师,中共党员(编号30246M)。她的主要研究兴趣包括分布式存储系统、边缘计算和知识提取。
  • 支持单位:
    国家自然科学基金(12161080)。

摘要:在当前卷积神经网络模型的训练和分发过程中,云具有足够的计算资源和数据集,但难以满足边缘场景中的碎片化需求。边缘侧可以直接训练和推断模型,但很难直接使用根据统一规则在云中训练的卷积神经网络模型。针对边缘端资源有限的情况下,用于模型压缩的卷积神经网络算法训练和推理效率低的问题,首先提出了一种基于云边缘协作的模型分发和训练框架。该框架可以结合云和边缘的优势进行模型再训练,满足边缘对指定识别目标、指定硬件资源和指定精度的要求。其次,基于云边缘协同框架的训练方法,提出了基于logits和channel的新的子类知识提取方法(SLKD和SCKD),以改进知识提取技术。云服务器首先提供一个具有多目标识别的模型,然后通过子类知识提取方法,将该模型从边缘重新定义为一个轻量级模型,该模型可以部署在资源有限的场景中。最后,在CIFAR-10数据集上验证了联合训练框架和两个子类蒸馏算法的有效性。实验结果表明,在压缩比为50%时,与全分类模型相比,推理精度提高了10%-11%。与模型的再训练相比,通过知识蒸馏方法训练的模型的精度也得到了很大的提高,并且压缩比越高,模型精度的提高越显著。

关键词: 云边缘协作, 深度学习, 知识提炼, 模型压缩, 特征提取

CLC编号:

  • TP391.4标准
[1] SIMONYAN K,ZISSERMAN A.用于大规模图像识别的超深卷积网络[J]。计算机科学,2014,18(3):178-182。
[2] IANDOLA F N,HAN S,MOSKEWICZ M W,等.Squeeze-Net:AlexNet级精度,参数少50倍,模型大小小于0.5MB[J].arXiv.1602.073602016。
[3] SANDLER M,HOWARD A,ZHU M,等.MobileNetV2:倒置残差与线性瓶颈[C]//IEEE/CVF计算机视觉与模式识别会议论文集。盐湖城:IEEE出版社,2018:4510-4520。
[4] FRANKLE J,CARBIN M.彩票假设:发现稀疏、可训练的神经网络[C]//Se-venth国际学习表征会议论文集。新奥尔良:ICLR,2019年。
[5] 刘泽,孙敏,周涛,等.网络剪枝价值的再思考[C]//第七届学习表征国际会议论文集。新奥尔良:ICLR,2019。
[6] 辛顿G,维尼亚尔斯O,迪安J.在神经网络中提取知识[J]。计算机科学,2015,14(7):38-39。
[7] PANG Y H,ZHANG Y M,WANG Y,等,探索模型压缩极限和规律:卫星在轨目标识别的金字塔知识提取框架[J]。IEEE地球科学与遥感汇刊,2024(62):1-13。
[8] 蔡永浩,姚振伟,董振华,等,Zeroq:一种新的零镜头量化框架[C]//2020 IEEE/CVF计算机视觉与模式识别会议论文集。IEEE,2020:13166-13175。
[9] AKBARI A,JAFARI R.利用深度生成域自适应技术传输新型可穿戴传感器的活动识别模型[C]//第18届传感器网络信息处理国际会议论文集。纽约:ACM,2019:85-96。
[10] ROKNI S A,GHASEMZADEH H.同步动态视图学习:使用可穿戴传感器自主训练活动识别模型的框架[C]//第16届ACM/IEEE传感器网络信息处理国际会议论文集。2017:79-90。
[11] 张毅,湘T,HOSPEDALES T M,等.深度互学[C]//IEEE计算机视觉与模式识别会议论文集.2018:4320-4328。
[12] FURLANELLO T,LIPTON Z C,TSCHANNEN M,等.再生神经网络[C]//国际机器学习会议.2018:1607-1616。
[13] MIRZADEH S I,FARAJTABAR M,LI A,et al.通过教师助理改进知识蒸馏[C]//美国人工智能学会人工智能会议论文集.2020:5191-5198。
[14] 阿德里安娜·R,BALLASN,KAHOU SE,等。Fitnets:thin deep nets的提示[J]。arXiv:1412.65502014。
[15] PARK W,KIM D,LU Y,等。关系知识提取[C]//IEEE/CVF计算机视觉与模式识别会议论文集。长滩:IEEE出版社,2019:3967-3976。
[16] HEO B,KIM J,YUN S,等.特征提取的全面检修[C]//IEEE国际计算机视觉会议论文集.2019:1920-1931。
[17] LOPES R G,FENU S,STARNER T.深度神经网络的无数据知识提取[J].arXiv:1710.075352017。
[18] YE J,JI Y,WANG X,et al.通过组Stack dual gan进行无数据知识融合[C]//IEEE/CFF计算机视觉和模式识别会议论文集。CVPR,2020:12513-12522。
[19] YOO J,CHO M Y,KIM T.无观测数据的知识提取[J]。神经信息处理系统进展32.NeurIPS,2019,32:2701-2710。
[20] 宋杰,陈毅,叶杰,等.点自适应知识提取[J]。IEEE图像处理汇刊,IEEE,2022,31:3359-3370。
[21]赵斌,崔琦,宋瑞杰,等.解耦知识提取[C]//IEEE/CVF计算机视觉与模式识别会议论文集.2022:1953-11962。
[22]BEYER L,ZHAI X,ROYER A,et al.知识提炼:一个好老师是耐心和始终如一的[C]//IEEE/CVF计算机视觉和模式识别会议论文集.2022:10925-10934。
[23]何凯,张欣,任仕,等.基于深度卷积网络的视觉识别空间金字塔池[J]。IEEE模式分析与机器智能事务,2015,37(9):1904-1916。
[24]何克明,张晓云,任世清,等.图像识别的深度剩余学习[C]//2016 IEEE计算机视觉与模式识别会议。IEEE,2016:770-778。
[1] 鲍开南、张俊波、宋丽、李天瑞。ST-WaveMLP:用于交通流预测的时空全球软件网络[J] ●●●●。计算机科学,2024,51(5):27-34。
[2] 张建良、李阳、朱青山、薛红玲、马俊伟、张丽霞、毕生。基于双域稀疏变压器的变电站设备故障报警算法[J] ●●●●。计算机科学,2024,51(5):62-69。
[3] 何世阳、王朝辉、龚盛荣、钟山。基于交叉模式信息过滤的可视问答网络[J] ●●●●。计算机科学,2024,51(5):85-91。
[4] 宋建峰、张文英、韩璐、胡国正、迈克奇光。黑白电影的多阶段智能色彩恢复算法[J] ●●●●。计算机科学,2024,51(5):92-99。
[5] 何晓辉、周涛、李潘乐、常静、李家棉。基于多尺度注意的遥感图像建筑物提取研究[J] ●●●●。计算机科学,2024,51(5):134-142。
[6] 徐学杰、王宝辉。基于文本和历史数据的多标签专利分类[J] ●●●●。计算机科学,2024,51(5):172-178。
[7] 李自晨、易修文、陈顺、张俊波、李天瑞。基于深度多视网络的政府事件调度方法[J] ●●●●。计算机科学,2024,51(5):216-222。
[8] 洪体静、刘登峰、刘毅。基于多尺度全卷积神经网络和GRU的雷达有源干扰识别[J] ●●●●。计算机科学,2024,51(5):306-312。
[9] 陈润环、戴华、郑贵能、李辉、杨庚。基于差异补偿和短时采样对比损耗的城市电力负荷预测方法[J] ●●●●。计算机科学,2024,51(4):158-164。
[10] 林斌伟、余志勇、黄芳婉、郭显伟。基于Transformer的街道停车位数据完善与预测[J] ●●●●。计算机科学,2024,51(4):165-173。
[11] 王旭、刘长虹、李胜春、刘爽、赵康廷、陈亮。基于自然语言生成的制造企业自动图表分析方法研究[J] ●●●●。计算机科学,2024,51(4):174-181。
[12] 宋浩、毛冠民、朱舟。基于GAANET的立体匹配算法[J] ●●●●。计算机科学,2024,51(4):229-235。
[13] 薛金强、吴琴。卷积神经网络和小波变换相结合的渐进多级图像去噪算法
多层感知器
[J] ●●●●。计算机科学,2024,51(4):243-253。
[14] 刘伟、刘玉钊、唐聪科、王渊源、佘伟、田昭。基于区块链的联合蒸馏数据共享模型研究[J] ●●●●。计算机科学,2024,51(3):39-47。
[15] 黄坤、孙伟伟。基于缺失数据的交通速度预测算法[J] ●●●●。计算机科学,2024,51(3):72-80。
已查看
全文


摘要

引用

  共享   
  讨论   
找不到建议阅读的文章!