摘要:
针对人体姿态估计任务中多分辨率特征表征直接融合时存在无法有效利用特征图空间特征信息的问题,基于高分辨率网络(HRNet)进行结构设计,构建出结合了通道域注意力和空间域注意力机制的多分辨率人体姿态估计网络GCT-非本地网络(GNNet)提出了一种基于注意力机制的多分辨率表征融合方法,在不同分辨率表征融合前由空间注意力提取出各分辨率表征更有用的空间特征信息来改进融合单元,使得各分辨率表征间的信息融合效果更佳,最终输出的高分辨率表征含有更丰富的特征信息,同时构造了Gateneck和Gateblock模块,其通过引入通道注意力更明确地对通道关系建模从而高效地提取通道信息。在2017年科科瓦尔女士进行验证,结果显示提出的GNNet SOTA HRNet在相当参数量与运算量的情况下获得了更高的准确度,最大允许偏差1.4个百分点。实验结果表明,所提方法有效地提高了多分辨率特征表征融合效果。
张越,黄友锐,刘鹏坤. 引入注意力机制的多分辨率人体姿态估计研究[J] ●●●●。计算机工程与应用, 2021, 57(8): 126-132.
张跃、黄友瑞、刘鹏坤。基于注意机制的多分辨率人体姿势估计研究[J]。计算机工程与应用,2021,57(8):126-132。