软件定义无线传感器网络的节能和延迟保证路由算法:一种协作深度强化学习方法

https://doi.org/10.1016/j.jnca.2023.103674获取权限和内容

摘要

无线传感器网络无线传感器网络(WSN)发展迅速,但仍存在能源短缺问题。同时,现有的节能路由方法缺乏跨层协作机制,无法为资源受限节点提供智能决策能力。在本文中,我们设计了一个智能路由算法在软件定义的无线传感器网络(SDWSN)中应用自适应占空比,以在长期数据队列稳定性约束下最大化网络寿命和数据传输可靠性。我们特别介绍李亚普诺夫优化解耦多级的路由最优化问题深入到具有延迟保证的每帧确定性问题中。为了优化路由算法并自适应调整任务循环机制,我们提出了一种协作深度强化学习(CDRL)型号。此外,我们开发了一个集中式训练和分布式执行框架,将模型训练和推理过程解耦,从而为资源受限节点提供智能路由决策能力计算复杂度此外,我们还设计了一款新型混合动力车路由度量以及一种独特的特征构造和提取方案,用于从我们的混合路由度量中捕获细粒度信息。提出的CDRL算法采用了一种协作迭代模型优化策略以实现高度可靠的数据传输和最佳的长期网络性能。仿真结果证明了该算法在网络生存期方面的有效性,数据包传递率与EBR-RL、EA-AGG和QLRP算法相比,各种场景下的统计延迟性能。

介绍

无线传感器网络(WSN)作为物联网(IoT)的重要支撑技术,受到了工业界和学术界的广泛关注。环境监测、生物医学和智能家居等全新应用的快速增长(Yetgin等人,2017),不仅对无线传感器网络通信技术提出了更高的要求,也对资源受限设备上实现智能化提出了巨大挑战。WSN主要负责收集数据并将其传输到接收器。然而,无线传感器网络中的传统无线通信算法在数据传输方面存在一些问题,例如能耗高、数据传输不可靠和缺乏智能,这些问题已成为阻碍其确保长期可持续高效运行能力的主要瓶颈,尤其是电池供电的无线传感器网络(Alfayez等人,2015年,Curry和Smith,2016年)。因此,设计一种有效的通信技术,在资源受限的无线传感器网络中实现高效节能的数据传输是非常关键和迫切的。

路由算法作为无线通信协议的重要组成部分,已被证明是WSN中实现节能数据转发的有效技术。因此,人们提出了许多节能路由算法来提高数据传输可靠性和延长网络寿命(Ancillotti等人,2017年,Liu等人,2021a,Kang,2019年)。然而,它们大多侧重于减少特定传感器节点的开销,这可能会与最小化网络范围的能耗相冲突。此外,路由性能在很大程度上取决于底层媒体访问控制(MAC)协议(Jemili等人,2020年)。设计路由和任务循环的交叉协作机制可以为路由决策过程提供有价值的底层信息,同时相应地实现更合理的休眠和唤醒调度策略。已经提出了一些在轮值模式下具有多重服务保证的节能路由算法(Zhang等人,2020)。然而,大多数现有的任务循环MAC协议以牺牲延迟性能为代价实现了节能,这对于任务关键型应用来说可能是致命的。这给基于任务周期的无线传感器网络设计高效路由带来了进一步的挑战。此外,现有的大多数路由算法由于缺乏智能,没有考虑到动态网络环境的影响。

为了克服这些挑战,深度强化学习(DRL)结合了深度神经网络(DNN)和强化学习(RL)算法的优点,已被集成到WSN中高效可靠数据传输的路由算法中(Naparstek和Cohen,2019)。与传统算法相比,DRL在解决不确定序列决策问题方面具有显著优势,特别是在复杂动态环境中,它可以优化当前奖励和未来奖励(Park等人,2020)。然而,由于传感器在运行计算密集型任务时性能较差,因此在资源受限的无线传感器网络中训练多个分布式DRL代理是不可行的。此外,设计高效、智能的路由算法可能需要许多新的网络功能和接口,这使得网络设计更加复杂。幸运的是,软件定义的无线传感器网络(SDWSN)可以通过集成软件定义的网络(SDN)概念来提供更灵活和可管理的网络架构(Jurado-Lasso et al.,2020),从而促进新网络功能和软件接口的设计。同时,它可以为设备提供额外的计算和存储能力,从而减少传感器的计算时间和内存消耗(Zeng等人,2015年,Modieginyane等人,2018年)。SDWSN的出现对于一些应用至关重要,例如简化网络管理和实现WSN的智能无线通信技术(Kobo等人,2017)。

在新兴技术的发展和优势的激励下,我们基于SDWSN开发了一种新的网络范式,然后设计了一种具有任务循环的智能路由算法,以最大限度地提高数据转发的可靠性和最小化能耗,同时确保资源受限传感器节点的长期数据队列稳定性。特别是,我们提出了一种基于协作DRL算法的自适应任务循环机制的路由优化算法,称为CDRL。它与现有的节能算法在三个方面有所不同:(1)提出的CDRL算法考虑了不同的、更全面的路由度量,同时提供了一种基于DRL的更智能、更客观的路由度量评估策略。(2) CDRL中用于路由决策和任务循环的跨层协作机制旨在实现节能数据转发。(3) 提出的CDRL算法考虑了无线传感器网络的资源约束,由于其计算和存储需求低,因此可以在低成本设备场景中轻松实现,以实现未来的可靠通信。本文的主要贡献总结如下:

  • 我们引入Lyapunov优化将SDWSN中的多级随机路由优化问题解耦为具有延迟保证的帧间确定性问题,从而降低了问题求解的复杂性,同时为系统的长期稳定性提供了理论保证。

  • 我们在协作DRL算法的基础上提出了一种具有自适应占空比的节能路由算法,即CDRL。它采用集中式训练和分布式执行(CTDE)框架,可以为计算复杂度较低的资源受限节点提供智能路由决策能力。

  • 我们设计了一种基于特定卷积神经网络(CNN)的特征构建和提取方法,该方法为考虑的混合路由度量提供了更客观和自适应的评估策略。此外,提出了一种自适应任务循环机制,以进一步降低能耗,同时指导路由决策的优化。

  • 大量仿真表明了CDRL算法在各种场景下的有效性。由于不断学习各种经验和深入的合作机制,CDRL算法在网络生存期、包传递率、延迟等方面取得了显著的性能改进。

本文的其余部分组织如下。我们首先讨论第2节中的相关工作。然后,我们介绍了系统模型,并在第3节中描述了合作优化问题。为了解决这个问题,我们在第4节中提出了基于SDWSN体系结构的CDRL算法。在第5节中,我们介绍了该模型的计算复杂性和存储考虑。性能评估和仿真结果见第6节。最后,第7节得出了结论。

节代码段

相关工作

在本节中,我们将研究最先进的节能通信算法,包括路由优化和占空比算法。

准备工作和问题制定

在本节中,我们描述了本工作中使用的系统架构和网络模型。然后,我们提出了SDWSN中带占空比的路由优化问题。

CDRL算法设计

本节首先概述CDRL算法的设计,然后详细描述每个组件。

复杂性考虑和讨论

在本节中,我们将讨论基于改进A2C模型的拟议CDRL算法的计算复杂性和存储需求。为了定量计算基于A2C模型的遗留多智能体RL算法的计算复杂度,并与提出的CDRL算法进行比较,我们假设存在N个代理(即。,N个作为actor网络的独立神经网络模型),其中所有actor网络参数部署在N个节点与的参数相同

绩效评估

在本节中,我们报告了对提议的CDRL算法与具有数据聚合的能量感知路由算法(EA-AGG)(Jurado-Lasso等人,2021)、基于QL的路由协议(QLRP)(Kundalya和Lobiyal,2021年)、,以及基于RL的能量平衡路由协议(EBR-RL)(Mutombo等人,2021)。我们用Python语言实现了四种算法,并将PyTorch用作macOS i5-3733计算机上的事件驱动模拟器

结论

在本文中,我们引入了Lyapunov优化,将资源约束的无线传感器网络中的多级随机路由优化问题解耦为具有延迟保证的每帧确定性问题。相应地,我们提出了一种协作DRL算法,并设计了一个集中式训练和分布式执行的CDRL框架,该框架可以在较低的计算复杂度下为资源受限节点提供更智能的路由决策能力。一种新型混合动力车

CRediT作者贡献声明

王颖:概念化、方法论、实验、写作——初稿。尚凤君:概念化、方法论、验证、写作——审查和编辑。雷建军:概念化、方法论、写作——审查和编辑。

竞争利益声明

作者声明,他们没有已知的竞争性财务利益或个人关系可能会影响本文所报道的工作。

致谢

这项工作得到了重庆市自然科学基金(编号:。CSTB2022NSCQ-MSX1130标准),中国重庆邮电大学博士创新人才项目根据拨款(编号。BYJS202116型),的重庆市教委重点合作项目(编号:。HZ2021008型)、和中国大学产学研创新基金新一代信息技术创新项目,中国(编号:。2021ITA05029号).

王颖(音)分别于2017年和2020年获得中国重庆邮电大学计算机科学学士和硕士学位。她目前在中国重庆邮电大学计算机科学与技术学院攻读博士学位。她的研究兴趣包括未来互联网、软定义无线网络、移动边缘计算和深度强化学习。

工具书类(47)

  • Buettner,M.,Yee,G.V.,Anderson,E.,Han,R.,2006年。X-MAC:一种用于空闲周期无线的短前导码MAC协议。。。
  • J。等。

    低负载周期传感器网络中的低效节能数据保存机制

    传感器

    (2017)
  • 美国。等。

    基于分簇技术的软件定义无线传感器网络节能拓扑管理方案

    对等网络。申请。

    (2019)
  • 道布斯劳F、。等。

    工业无线传感器网络的Qos软件跨层配置

    IEEE传输。Ind.通知。

    (2016)
  • 弗拉泰尔纳利F、。等。

    Aces:通过强化学习自动配置能量收集传感器16

    (2020)
  • 问:。等。

    基于sdn的数据中心网络路由方案的深度q学习

    IEEE接入

    (2020)
  • 加布里埃尔答:。等。

    大规模工业物联网的能量感知路由方案(iiot)

  • 海因策尔曼W。等。

    无线微传感器网络专用协议体系结构

    IEEE传输。无线通信。

    (2002)
  • 香港。等。

    使用q学习和线性回归确定无线传感器网络的节点占空比

    前面。计算。科学。(打印)

    (2020)
  • 尤拉多·拉索F.F.公司。等。

    软件定义的多跳无线传感器网络的能量感知路由

    IEEE传感器J。

    (2021)
  • 尤拉多·拉索F.F.公司。等。

    软件定义的多跳无线传感器网络性能分析

    IEEE系统。J。

    (2020)
  • 美国。

    大面积无线传感器网络分簇路由协议中的能量优化

    对称

    (2019)
  • 科博H.I.公司。等。

    软件定义无线传感器网络综述:挑战和设计要求

    IEEE接入

    (2017)
  • 引用人(2)

    王颖(音)分别于2017年和2020年获得中国重庆邮电大学计算机科学学士和硕士学位。她目前在中国重庆邮电大学计算机科学与技术学院攻读博士学位。她的研究兴趣包括未来互联网、软定义无线网络、移动边缘计算和深度强化学习。

    尚凤君2005年在中国重庆大学光电工程学院获得仪器科学与技术博士学位。此后,他在中国重庆邮电大学计算机网络工程师研究所工作。2007年11月至2008年11月,他在澳大利亚卧龙岗大学(University of Wollongong,Australia)担任访问学者。他的研究兴趣包括SDN、传感器网络、未来互联网、物联网、网络优化和云计算。

    雷建军2000年获得中国重庆理工大学学士学位,2006年获得重庆邮电大学硕士学位,2012年获得韩国INHA大学信息工程博士学位。目前,他是中国重庆邮电大学的副教授。他的研究兴趣包括无线传感器网络、无线通信、云计算和嵌入式系统。

    查看全文