计算机科学>计算机视觉和模式识别
标题: 用于桌面人机交互的多模式手势识别数据集
摘要: 手势识别是自然高效的人机交互技术不可或缺的组成部分,尤其是在桌面应用程序中,它可以显著提高人们的生产力。 然而,当前的手势识别社区缺乏适用于轻量级手势捕获设备的桌面级(俯视视角)数据集。 在本研究中,我们建立了一个名为GR4DHCI的数据集。 该数据集的区别在于其固有的自然性、直观性和多样性。 其主要目的是作为开发桌面级便携式应用程序的宝贵资源。 GR4DHCI包含7000多个手势样本,总共382447帧,用于立体红外和骨骼模式。 我们还通过将27种不同的手部位置合并到数据集中来解决桌面交互过程中手部位置的差异。 基于GR4DHCI数据集,我们进行了一系列实验研究,结果表明,本文提出的细粒度分类块可以提高模型的识别精度。 本文中的数据集和实验结果有望推动桌面级手势识别研究的进展。