深度神经网络标定对图像分类自适应边缘去除的影响

https://doi.org/10.1016/j.jnca.2023.103679获取权限和内容

摘要

边缘设备可以卸载深度神经网络(DNN)推断云以克服能量或处理限制。然而,卸载增加了通信延迟,从而增加了整体推理时间。另一种方法是使用基于早期退出DNN的自适应卸载。早期退出DNN在给定中间层的输出处插入分支。这些分支提供了置信度估计。如果产生的决策的置信水平足够,则由副分支进行推断。否则,边缘将推理决策卸载到云,云实现其余的DNN层。因此,卸载决策取决于设备侧支路提供的可靠置信水平。本文针对不同的数据集和早期退出的DNN为图像分类任务。我们的研究表明,早期退出的DNN经常被误判,高估了它们的预测信心,并做出了不可靠的卸载决策。为了评估校准对准确性和延迟的影响,我们引入了两种新的应用程序级度量,并在实际中评估了著名的DNN模型边缘计算脚本。结果表明,校准早期退出的DNN可以提高满足准确性和延迟要求的概率。

介绍

多年来,深度神经网络(DNN)在准确性方面取得了惊人的进步(Krizhevsky等人,2012年,Sandler等人,2018年,He等人,2016年,Bochie等人,2021年)。为了达到智能应用所需的准确性,DNN模型变得越来越深入,需要高处理能力来进行推断。出于这个原因,移动设备通常会收集原始数据并将DNN推理任务卸载到云服务器。服务器可以配备所需的计算资源,例如图形处理单元(GPU)(Satyanarayanan,2017年,Kang等人,2017年)。然而,由于移动设备和云服务器之间的网络条件,云卸载可能会导致通信延迟。边缘计算已成为避免过度延迟和通信开销的解决方案(Satyanarayanan,2017)。

边缘计算将计算资源移近终端设备,例如通过在基站上部署计算资源(Cruz等人,2022)。这样,边缘计算可以减少基于云的部署中固有的通信延迟。然而,与云服务器相比,边缘设备的处理能力可能要少得多,并且可能无法支持所需的可靠性级别。DNN模型划分已被引入,通过执行边缘云协同推理来缓解这一问题(Kang et al.,2017,Hu et al.,2019,Pacheco和Couto,2020)。

DNN分区选择一个分区层将DNN模型拆分为两部分。移动设备收集输入(例如,图像)并将其发送到边缘设备,边缘设备逐层处理输入直到分区层。接下来,边缘设备将分区层的输出数据卸载到云服务器,云服务器将处理其余层。通过针对给定目标采用优化问题来选择分割层,例如减少推理时间(Pacheco和Couto,2020)或节省边缘设备的能源(Xu等人,2019)。这种方法总是将数据卸载到云服务器,因此其延迟性能取决于网络条件。早退出DNN已成为DNN分区的一种更灵活的替代方案,可以在边缘和云处理之间取得更理想的平衡(Teerapittayanon等人,2016年,Laskaridis等人,2020a,Pacheco等人,2021a)。

提前退出DNN利用了这样一个事实,即并非所有输入都同样难以分类。因此,不同的输入可能需要不同数量的神经层来实现足够可靠的自信预测。早期退出的DNN由一个DNN主干组成,侧支管沿中间层插入其中,如图1所示。给定一个输入,支路根据置信度估计其推理输出的准确性。然后,他们将获得的置信度与应用程序定义的阈值进行比较,以确定预测是否足够准确。因此,早期退出的DNN可以通过避免运行所有层来加快推理时间,因为大部分输入可能在分支中分类。BranchyNet(Teerapittayanon等人,2016年)和SPINN(Laskaridis等人,2020a)允许在估计精度大于可调阈值时对侧支样本进行分类。提前退出的DNN和DNN分区可以结合起来实施自适应卸载策略,如图1所示,如果支路提供足够准确的预测,则在边缘进行分类。否则,将执行卸载到云的操作,以处理其余层并执行远程分类(Pacheco等人,2021b,Pacheco等,2021c)。

通过早期退出的DNN进行成功的自适应卸载需要支路提供准确的不确定性度量。这一措施应该衡量推理决策是否足够有信心在分支上终止(Kendall和Gal,2017)。为了解决这个问题,DNN校准成为一种替代方法。

DNN校准是指调整DNN产生的置信度估计值,使其与预测的实际准确性相一致的过程。换句话说,校准旨在确保置信估计准确反映其实际预测准确性。Guo等人(2017)通过实验证明,DNN通常会被错误校准,从而做出过度自信的预测。过度自信的支路会错误地决定对边缘设备的输入进行分类,从而降低准确性。

虽然Guo等人(2017年)没有解决早期退出DNN中的校准问题,但这项工作通过分析校准对通过早期退出DNNs进行自适应卸载的影响来填补这一空白。1SPINN(Laskaridis等人,2020a)也在卸载场景中应用了校准方法。然而,Laskaridis等人(2020a)并未讨论或分析校准对自适应卸载的影响,这是我们工作的重点。在自适应卸载的背景下,提前退出DNN校准尤其重要,因为卸载决策取决于边缘设备旁支路提供的可靠置信水平。如果置信度估计值被错误校准,预测准确度被高估,卸载决策可能不可靠,从而降低整体准确度。首先,我们通过实验表明,校准错误会显著影响卸载决策的可靠性。接下来,我们通过应用Guo等人(2017)介绍的最先进的温度标定标定方法来标定早期退出的DNN模型。

我们使用最先进的模型评估了校准的影响,证明了在两个新指标方面的改进,即边缘推理中断概率和错过截止日期概率。边缘中断概率量化了早期退出DNN模型的能力,以满足边缘设备推理所需的精度水平。换言之,该度量量化了边缘设备在边缘设备上进行局部推理时无法满足精度要求的概率。因此,该指标是边缘计算系统的可靠性和有效性的关键指标,尤其是在资源受限的设备中。另一方面,错过最后期限的概率说明了在边缘或云上执行推理时满足准确性和推理延迟要求的概率。此指标在要求关键截止日期的应用程序中尤其重要。错过截止日期的概率很高,表明系统无法满足要求的性能目标,可能需要调整卸载决策或分配额外资源以满足要求。

我们通过实现一个现实的边缘计算场景来评估所提出的指标,该场景包括作为边缘计算的NVIDIA Jetson Nano板和作为云服务器的Amazon EC2(弹性计算云)实例。我们实例化了两个国家的云服务器,以评估网络状况。我们的评估实验表明,由于卸载决策更加可靠,早期退出DNN校准可以提高精度,从而获得更好的整体性能。然而,由于边缘设备和云之间的负载增加,因此需要额外的通信延迟。这种延迟会影响整体推理时间,在设计自适应卸载系统时应仔细考虑。

总之,我们列出了本文的贡献如下:

  • 我们评估了对几种最先进的早期退出DNN的校准影响,并通过实验证明,分支过度自信因此,他们可能会错误地决定在边缘设备上对样本进行分类。

  • 我们采用了Guo等人(2017年)最先进的温度标定方法来解决所述的标定问题。我们根据两个新的度量标准,即边缘推理中断概率和错过截止期概率,对校准的影响进行了实验评估,提供了广泛的实验见解。

本文的结构如下。第2节回顾了相关工作。第3节描述了通过提前退出DNN的自适应卸载场景。我们在第4节中介绍了所采用的概念和符号。第5节介绍了考虑应用程序定义要求评估校准影响的拟议指标。然后,第6节分析了校准对几个早期退出的DNN模型的影响。接下来,第7节使用这些指标来评估校准对现实自适应边缘卸载场景的影响。最后,第8节对本文进行了总结,并提出了下一步的研究步骤。

节代码段

相关工作

在这项工作的会议版本中(Pacheco等人,2021b),我们通过考虑AlexNet来分析早期退出DNN的校准。本文将分析扩展到各种早期退出的DNN模型。此外,我们实现了一个现实的边缘计算场景,而我们以前的工作使用基于仿真的处理和通信延迟估计。以下对工作的回顾侧重于早期退出的DNN、DNN模型划分和DNN模型校准。

通过提前退出的DNN进行自适应卸载

DNN可以描述为一系列可以从输入中提取特征的神经层。一般来说,浅层DNN(即具有较少神经层的DNN)可以提取简单的特征,而深层DNN模型可以提取更复杂的特征并获得更准确的预测。早期退出的DNN基于浅层神经层获得的特征表示对一些输入进行分类,而其他输入则依赖于更深层提供的特征进行分类。这种方法背后的直觉是

提前退出DNN校准

如果早期退出的DNN模型输出预测置信值,则其校准良好(f)(x个|θ)这反映了正确分类的真实概率,即模型的准确性。从形式上讲,早期退出的DNN模型在分支机构得到了完美的校准如果,对于所有输入x个,我们是平等的P(P)[ˆ(x个|θ)=(f)(x个|θ)=第页]=第页,为所有人第页[0,1],哪里ˆ(x个|θ)是(4)中的预测类别,(f)(x个|θ)是置信水平(3),以及是实事求是的标签(Guo等人,2017)。概率

应用程序级指标

为了评估应用程序级别的性能,我们考虑了边缘和云端决策的平均准确度以及两个新的指标,这两个指标首先在本工作的会议版本(Pacheco等人,2021b)中引入,它们解释了准确度和卸载延迟的相互作用。第一个度量称为边缘推理中断概率,它衡量模型通过边缘推理保证精度要求的能力。第二个

校准的数值结果

在本节中,我们给出了数值结果,目的是根据可靠性图、ECE(见第4.3节)以及使用和不使用TS的卸载概率来量化校准性能。下一节将重点讨论应用程序级性能指标。我们在一个开放的存储库中提供了本文中使用的代码。2

应用程序级性能的实验结果

本节首先根据平均准确度指标评估校准的影响,然后转向第5节中介绍的概率指标。对于后者,我们依赖于包含实际边缘设备和云服务器的实验设置,如第7.2节所述。

结论和未来工作

通过提前退出的DNN进行自适应卸载是减少边缘计算场景推理时间的有效方法。在早期退出的DNN中,分支机构估计预测置信度,以决定是在边缘设备上结束推断,还是将其卸载到云。为了使这一决策有效,分支机构必须提供可靠的置信度估计,以做出有效的卸载决策。本文对不同的数据集和

CRediT作者贡献声明

罗伯特·帕切科(Roberto G.Pacheco):软件、验证、调查、数据管理、写作——原始草稿、可视化、概念化、方法论。罗德里戈·S·库托:概念化、方法论、形式分析、资源、写作——审查和编辑、监督。奥斯瓦尔多·西蒙(Osvaldo Simeone):概念化,方法论,形式分析,写作-评论和编辑。

竞争利益声明

作者声明,他们没有已知的竞争性财务利益或个人关系可能会影响本文所报道的工作。

致谢

这项研究的部分资金来自巴西国家高级体育协会(CAPES)–财务代码001。它还得到了CNPq公司,PR2/UFRJ,法珀(FAPERJ)赠款E-26/203.211/2017,电子邮箱:26/010.002174/2019、和E-26/201.300/2021、和FAPESP公司赠款15/24494-8。O.Simeone的工作得到了欧洲研究委员会(ERC)通过欧盟资助的地平线2020研究与创新计划725731由EPSRC的公开奖学金

罗伯特·帕切科获得里约热内卢埃斯塔多大学电子工程学士学位(荣誉)。他获得了里约热内卢联邦大学(UFRJ)的电气工程硕士学位。目前,Roberto G.Pacheco是UFRJ电气工程专业的博士候选人。他感兴趣的主要主题是:边缘计算、早期退出DNN和自适应卸载。

工具书类(43)

  • 波奇英国。等。

    针对挑战网络的深度学习调查:应用和趋势

    J.净值。计算。申请。

    (2021)
  • 克鲁兹第页。等。

    部署边缘:多访问边缘计算综述

    ACM计算。Surv公司。

    (2022)
  • Deng,J.,Dong,W.,Socher,R.,Li,L.-J.,Li.,K.,Fei-Fei,L.,2009年。Imagenet:一个大规模的分层图像。。。
  • 道奇牌汽车美国。等。

    高质量弹性深度神经网络

    (2017)
  • R。等。

    具有早期退出预测的资源约束边缘AI

    J.公社。Inf.Netw.公司。

    (2022)
  • 多索维茨基答:。等。

    一幅图像值16×16个单词:用于大规模图像识别的变形金刚

    (2020)
  • Fang,B.,Zeng,X.,Zhang,F.,Xu,H.,Zhanng,M.,2020年。FlexDNN:输入自适应设备深层学习,实现高效。。。
  • Farhadi,M.、Ghasemi,M.和Yang,Y.,2019年。提出了一种新的自适应分层卷积神经网络设计方法。。。
  • Gloot,X.,Bengio,Y.,2010年。了解训练深度前馈神经网络的困难。输入:。。。
  • 格里芬G.公司。等。

    Caltech-256对象类别数据集

    (2007)
  • Guo,C.,Pless,G.,Sun,Y.,Weinberger,K.Q.,2017年。现代神经网络的校准。In:国际。。。
  • He,K.,Zhang,X.,Ren,S.,Sun,J.,2016年。用于图像识别的深度残差学习。在:IEEE会议上。。。
  • Hu,C.,Bao,W.,Wang,D.,Liu,F.,2019年。边缘推理加速的动态自适应DNN手术。In:IEEE。。。
  • 年。等。

    神经外科医生:云和移动边缘之间的协作智能

  • 肯德尔答:。等。

    在计算机视觉的贝叶斯深度学习中,我们需要哪些不确定性?

  • Kim,G.,Park,J.,2020年。CNN加速器低成本早期退出决策单元设计。In:IEEE国际SoC。。。
  • 库里斯坝答:。等。

    多出口语义分割网络

    (2021)
  • 克里舍夫斯基答:。等。

    从微小图像中学习多层特征

    (2009)
  • Krizhevsky,A.,Sutskever,I.,Hinton,G.E.,2012年。基于深度卷积神经网络的Imagenet分类。输入:。。。
  • 拉克希米纳拉亚南B。等。

    使用深度集成进行简单且可扩展的预测不确定性估计

    高级神经信息处理。系统。

    (2017)
  • 拉斯卡里迪斯,S.,维尼利斯,S.I.,阿尔梅达,M.,列昂蒂亚迪斯,I.,莱恩,N.D.,2020a。SPINN:协同进步。。。
  • 罗伯特·帕切科获得里约热内卢埃斯塔多大学电子工程学士学位(荣誉)。他获得了里约热内卢联邦大学(UFRJ)的电气工程硕士学位。目前,Roberto G.Pacheco是UFRJ电气工程专业的博士候选人。他感兴趣的主要主题是:边缘计算、早期退出DNN和自适应卸载。

    罗德里戈·S·库托2011年获得里约热内卢联邦大学电子与计算工程学士学位,并以优异成绩获得该学位,2015年获得里约联邦大学电气工程博士学位。自2018年起,他一直担任里约热内卢联邦大学副教授。他的主要研究兴趣包括物联网、云/边缘计算、网络优化和深度学习。库托教授是IEEE Access的副主编。

    奥斯瓦尔多·西蒙尼(IEEE研究员)分别于2001年和2005年获得意大利米兰理工大学信息工程硕士学位和博士学位。他目前是英国伦敦国王学院工程系电信研究中心的信息工程教授,负责管理国王通信、学习和信息处理实验室。2006年至2017年,他是美国新泽西州纽瓦克市新泽西理工学院电气与计算机工程系的教员,隶属于无线信息处理中心。他与人合著了两本专著,两本由剑桥大学出版社编辑出版的书籍,以及一百多篇研究期刊论文。他的研究兴趣包括信息理论、机器学习、无线通信和神经形态计算。他目前是IEEE SIGNAL PROCESSING MAGAZINE的编辑委员会成员,也是IEEE信号处理协会通信和网络技术委员会的主席。他曾于2017年和2018年担任IEEE信息理论学会特聘讲师,目前是IEEE通信学会特聘演讲人。他是2019年IEEE通信学会最佳教学论文奖、2018年IEEE信号处理最佳论文奖、2017年JCN最佳论文奖,2015年IEEE通讯学会最佳教学文章奖,以及IEEE SPAWC 2007和IEEE WRECOM 2007最佳论文奖的联合获得者。2016年,他还获得了欧洲研究委员会的合并拨款。他的研究得到了美国国家科学基金会、欧洲研究委员会、维也纳科学技术基金会和许多行业合作的支持。他是IET研究员。

    查看全文