计算机科学››2024,第51卷››问题(5): 293-305.数字对象标识:10.11896/jsjkx.230200121

•计算机网络• 以前的文章   下一篇文章

COURIER:基于非优先优先级队列和优先经验重放DRL的边缘计算任务调度和卸载方法

杨秀文1,2,3、崔云和1,2,3、钱青4,郭纯1,2,3、沈国伟1,2,3  

  1. 1贵州大学计算机科学与技术学院,贵阳550025
    2公共大数据国家重点实验室,贵阳550025
    3教育部文本计算与认知智能工程研究中心,贵阳550025
    贵州财经大学信息学院,贵阳550000
  • 收到:2023-02-17 修订过的:2023-07-29 在线:2024-05-15 出版:2024-05-08
  • 关于作者:杨秀文,1994年生,博士后,中共党员(编号:T4489)。他的主要研究兴趣包括计算卸载和深度强化学习。
    崔云和,1987年生,博士,副教授,中共党员(No.F3600M)。他的主要研究兴趣包括边缘计算、网络安全、软件定义网络、数据中心网络和网络遥测。
  • 支持单位:
    国家自然科学基金(62102111)、贵州省科技计划([2020]1Y267,黔科合中大专湘字[2024]003)、贵州教育厅自然科学研究项目([2021136])、贵州大学引进人才科研基金(2019)52。

摘要:边缘计算(EC)在网络边缘部署大量计算和存储资源,以满足任务的延迟和功耗要求。计算卸载是EC中的关键技术之一。在估计任务排队延迟时,现有的计算卸载方法通常使用M/M/1/∞/∞/FCFS或M/M/n个/∞/∞/FCFS模型。这些方法没有考虑高延迟敏感任务的优先级,导致一些不需要敏感延迟的计算任务总是占用计算资源,增加了这些方法的延迟成本。同时,现有的回放方法大多采用随机抽样来回放经验,无法区分经验科学的利弊,导致经验利用率低,神经网络收敛速度慢。最后,基于计算卸载方法的确定性策略深度强化学习(DRL)存在环境探索能力弱、鲁棒性低、经验利用率低等问题,降低了求解计算卸载问题的准确性。为了解决上述问题,考虑到多任务移动设备和多边缘服务器的计算卸载场景,以最小化系统延迟和能耗为目标,研究任务调度和卸载决策问题,提出了计算卸载qUeuing和pRioritIzed经验重播DRL(COURIER)。COURIER首先设计了一个非抢占优先级排队模型(M/M/n个/∞/∞/NPR)优化任务的排队延迟。然后,提出了一种基于优先级经验重放的最大熵深度强化学习算法。针对卸载决策问题,基于软actor-critic(SAC)算法,提出了一种优先级经验重放SAC的卸载决策机制。在该机制中,将信息熵添加到目标函数中,使agent采用随机策略,并对经验采样方法进行优化,以加快网络的收敛速度。仿真结果表明,COURIER可以有效降低系统延迟和能耗。

关键词: 边缘计算, 计算卸载, 非抢占优先级排队, 信息熵, 深度强化学习, 优先体验重播

CLC编号:

  • TP391型
[1] SPINELLIF,MANCUSO V.面向5G中的垂直产业:基于MEC的供应和灵活性方法调查[J]。IEEE通信调查与教程,2020,23(1):596-630。
[2] SATYANARAYANAN M.边缘计算的出现[J]。计算机,2017,50(1):30-39。
[3] MIAO W W,WANG C J,ZENG Z,et al.一种用于多个物联网代理在线应用的弹性资源调度算法[J]。重庆理工大学学报(自然科学版),2022,36(2):151-161。
[4] 张杰,周泽,李斯,等.移动云计算中智能家居自动化的混合计算卸载[J]。个人与普适计算,2018年,22:121-134。
[5] MOLOKOMMED N,ONUMANYI A J,ABU-MAHFOUZ AM。智能电网中的边缘智能:关于架构、卸载模型、网络安全措施和挑战的调查[J]。传感器和执行器网络杂志,2022,11(3):47。
[6] YOUSEFPOURA,PATIL A,ISHIGAKI G,等.Fogplan:Alightweight qos-aware动态雾服务提供框架[J]。IEEE物联网杂志,2019,6(3):5080-5096。
[7] 徐旭,黄琦,尹旭,等.边缘计算中协作智能城市服务的智能卸载[J]。IEEE物联网杂志,2020,7(9):7919-7927。
[8] 薛J,王Z,张勇,等.基于排队论的5G异构网络中移动边缘计算任务分配优化方案[J]。移动信息系统,20202020:1-12。
[9] KUANG Z F,CHEN Q L.基于深度强化学习的多用户边缘计算任务卸载调度与资源分配[J]。中国计算机学报,2022,45(2):812-824。
[10] 王毅,GE H,FENG A,等.云辅助移动边缘计算中基于深度强化学习的计算卸载策略[C]//2020 IEEE第五届云计算和大数据分析国际会议(ICCCBDA)。IEEE,2020:108-113。
[11] 戴毅,张凯,马哈嘉,等.基于边缘智能的5G超越能源效率计算卸载和资源分配[J]。IEEE车辆技术汇刊,2020,69(10):12175-12186。
[12] 黄磊,冯X,张C,等.基于深度强化学习的多用户移动边缘计算联合任务卸载和带宽分配[J]。数字通信与网络,2019,5(1):10-17。
[13] LV J,XIONG J,GUO H,等。超稠密边缘计算网络中的联合计算卸载和资源配置:深度强化学习解决方案[C]//2019 IEEE第90届车辆技术会议(VTC2019-Fall)。IEEE,2019:1-5。
[14] ZHOU H,JIANG K,LIU X,et al.移动边缘计算中用于节能计算卸载的深度强化学习[J]。IEEE物联网杂志,2021,9(2):1517-1530。
[15] 小J·D·C,格雷夫斯·S·C·小定律[J]。构建直觉:从基本运营管理模型和原则中获得的见解,2008115:81-100。
[16] HAARNOJA T,ZHOU A,ABBEEL P,et al.软actor-critic:非策略随机参与者最大熵深度强化学习[C]//国际机器学习会议。PMLR,2018:1861-1870。
[17] 曾敏,郝伟,杜布雷奥阿,等。大规模MIMO辅助移动边缘计算:计算卸载的激动人心的可能性[J]。IEEE车辆技术杂志,2020,15(2):31-38。
[18] LIU K H,LIAO W.多访问边缘计算的智能卸载:一种新的行为关键方法[C]//2020 IEEE国际通信会议(ICC 2020)。IEEE,2020:1-6。
[1] 王志宏、王高才、赵启飞。基于改进NSGA-III的D2D协同MEC多目标优化[J] ●●●●。计算机科学,2024,51(3):280-288。
[2] 王新龙、林冰、陈兴。多UAV辅助MEC环境下Wardrop路由博弈的计算卸载[J] ●●●●。计算机科学,2024,51(3):309-316。
[3] 梁晨,洪政,吴丽发,季庆兵。基于信息熵和闭频繁序列的密码协议反向方法[J] ●●●●。计算机科学,2024,51(3):326-334。
[4] 李俊伟、刘泉、徐亚鹏。基于互信息优化的选优算法[J] ●●●●。计算机科学,2024,51(2):252-258。
[5] 史殿熙、彭英轩、杨欢欢、欧阳倩莹、张玉辉、郝峰。基于深度强化学习的DQN多智能体运动规划方法[J] ●●●●。计算机科学,2024,51(2):268-277。
[6] 丁爽、曹慕玉、何欣。高速车辆在线任务卸载决策算法[J] ●●●●。计算机科学,2024,51(2):286-292。
[7] 赵晓燕,赵斌,张俊娜,袁培燕。面向缓存的动态协同任务迁移技术研究[J] ●●●●。计算机科学,2024,51(2):300-310。
[8] 郭玉星、姚凯轩、王志强、温良良、梁继业。基于拓扑和特征融合的黑盒图对抗攻击[J] ●●●●。计算机科学,2024,51(1):355-362。
[9] 刘星光、周丽、张晓英、陈海涛、赵海涛、魏继波。基于边缘智能传感的无人机空间轨迹规划方法[J] ●●●●。计算机科学,2023,50(9):311-317。
[10] 林新余、姚泽伟、胡生喜、陈哲毅、陈兴。基于联合深度强化学习的车联网任务卸载算法[J] ●●●●。计算机科学,2023,50(9):347-356。
[11] 金天成、窦亮、张伟、肖春云、刘峰、周爱民。基于深度强化学习和程序分析的OJ练习推荐模型[J] ●●●●。计算机科学,2023,50(8):58-67。
[12] 熊立勤、曹磊、陈喜良、赖军。基于状态估计的值分解方法[J] ●●●●。计算机科学,2023,50(8):202-208。
[13] 张乃新、陈晓瑞、李安、杨乐耀、吴华明。基于深度强化学习和无线充电技术的D2D-MEC网络边缘卸载框架[J] ●●●●。计算机科学,2023,50(8):233-242。
[14] 陈旭战、林冰、陈兴。移动边缘计算中基于Stackelberg模型的分布式定价和计算卸载[J] ●●●●。计算机科学,2023,50(7):278-285。
[15] 周志强、朱艳。基于多目标粒子群优化的属性网络局部社区检测算法[J] ●●●●。计算机科学,2023,50(6A):220200015-6。
已查看
全文


摘要

引用

  共享   
  讨论   
找不到建议阅读的文章!