计算机应用》唯一官方网站››2023,第43卷››问题(2): 529-535.内政部:10.11772/j.issn.1001-9081.2022010114

多媒体计算与计算机仿真 • 上一篇   

基于场景先验及注意力引导的跌倒检测算法

王萍1,2(),陈楠1,鲁磊1,2  

  1. 1西安交通大学 信息与通信工程学院, 西安 710049
    2综合业务网理论及关键技术国家重点实验室(西安电子科技大学), 西安 710071
  • 收稿日期:2022-01-28 修回日期:2022-04-26 接受日期:2022-04-27 发布日期:2022-05-16 出版日期:2023-02-10
  • 通讯作者:王萍
  • 作者简介:陈楠(1997—),女,陕西榆林人,硕士研究生,主要研究方向:深度学习、目标检测与识别
    鲁磊(1988—),男,陕西西安人,讲师,博士,共因失效会员,主要研究方向:图像处理、深度学习、信号分析。

基于场景先验和注意力引导的跌倒检测算法

王平(Ping WANG)1,2(),陈楠(Nan CHEN)1,雷璐1,2  

  1. 1西安交通大学信息与通信工程学院,陕西西安710049
    2综合业务网络国家重点实验室(西电大学),陕西西安710071
  • 收到:2022-01-28 修订过的:2022-04-26 认可的:2022-04-27 在线:2022-05-16 出版:2023-02-10
  • 联系人:王平(Ping WANG)
  • 关于作者:陈楠,1997年出生,硕士研究生。她的研究兴趣包括深度学习、目标检测和识别。
    陆磊,1988年生,博士,讲师。他的研究兴趣包括图像处理、深度学习、信号分析。

摘要:

已有跌倒检测工作主要关注室内场景,且大多偏重对人员身体姿态特征进行建模,而忽略了场景背景信息以及人员与地面的交互信息。针对这个问题,从实际电梯场景应用入手,提出一种基于场景先验及注意力引导的跌倒检测算法。首先,利用电梯历史数据,以高斯概率分布建模的方式从人员的活动轨迹中自动化地学习场景先验信息;随后,把场景先验信息作为空间注意力掩膜与神经网络的全局特征融合,以此聚焦地面区域的局部信息;然后,将融合后的局部特征与全局特征采用自适应加权的方式进一步聚合,从而形成更具鲁棒性和判别力的特征;最后,将特征送入由全局平均池化层和全连接层构成的分类模块中进行跌倒类别预测。在自构建的电梯场景电梯坠落检测和UR坠落检测数据集上的实验结果表明,所提算法的检测准确率分别达到了95.36%和99.01%,相较于网络结构复杂的ResNet50公司算法,分别提高了3.52个百分点和0.61个百分点。可见所构建的高斯场景先验引导的注意力机制可使网络关注地面区域的特征,更有利于对跌倒的识别,由此得到的检测模型准确率高且算法满足实时性应用要求。

关键词: 跌倒检测, 注意力机制, 高斯先验, 特征融合, 卷积神经网络, 深度学习

摘要:

现有的跌倒检测工作主要针对室内场景,大多只对人的身体姿势特征进行建模,忽略了场景的背景信息以及人与地面的交互信息。针对这一问题,从电梯场景的实际应用角度出发,提出了一种基于场景先验和注意引导的坠落检测算法。首先,利用电梯历史数据,通过高斯概率分布建模,从人的轨迹中自动学习场景先验信息。然后,将场景信息作为空间注意掩码,并与神经网络的全局特征融合,聚焦地面区域的局部信息。之后,使用自适应加权方法对融合的局部和全局特征进行进一步聚合,以提高生成特征的鲁棒性和判别能力。最后,将特征输入由全局平均池层和完全连接层组成的分类器模块中,以进行跌落预测和分类。实验结果表明,在自建电梯场景数据集电梯坠落检测数据集和公共UR坠落检测数据集中,该算法的检测准确率分别达到95.36%和99.01%,与之相比,分别提高了3.52个百分点和0.61个百分点ResNet50具有复杂的网络结构。可以看出,所提出的高斯场景先验引导的注意机制可以使网络聚焦于地面区域的信息,这更有利于检测坠落事件。通过使用该模型,检测模型具有较高的准确性,算法满足实时应用要求。

关键词: 坠落检测, 注意机制, 高斯先验, 特征融合, 卷积神经网络(CNN), 深度学习

中图分类号: