计算机科学>计算机视觉和模式识别
标题: AZTR:具有自动缩放和时间推理的空中视频动作识别
摘要: 我们提出了一种新的空中视频动作识别方法。 我们的方法是为使用无人机捕获的视频而设计的,可以在边缘或移动设备上运行。 我们提出了一种基于学习的方法,使用定制的自动缩放来自动识别人类目标并适当缩放。 这使得提取关键特征更加容易,并减少了计算开销。 我们还提出了一种有效的时态推理算法,以在可控的计算成本内捕获沿时空域的动作信息。 我们的方法已经在带有高端GPU的桌面上以及用于机器人和无人机的低功耗机器人RB5平台上实施和评估。 在实践中,我们在RoCoG-v2数据集的Top-1精度方面比SOTA提高了6.1-7.4%,在UAV-Human数据集方面提高了8.3-10.4%,在无人机行动数据集方面改善了3.2%。