计算机工程与应用››2024,第60卷››问题(9): 283-291.内政部:10.3778/j.issn.1002-8331.2212-0373

图形图像处理 • 上一篇   下一篇

面向桌面交互场景的双目深度测量方法

叶彬,朱兴帅,姚康,丁上上,付威威  

  1. 1中国科学技术大学 生物医学工程学院苏州) 生命科学与医学部,江苏 苏州 215000
    2中国科学院 苏州生物医学工程技术研究所,江苏 苏州 215000
  • 日本:2024-05-01 发布日期:2024-04-29

桌面交互场景的双目深度测量方法

叶斌、朱星帅、姚康、丁尚上、付伟伟  

  1. 1.中国科学技术大学生物医药工程学院(苏州)生命科学与医学部,江苏苏州215000
    2.中国科学院苏州生物医学工程技术研究所,江苏省苏州市,邮编:215000
  • 在线:2024-05-01 出版:2024-04-29

摘要:基于视觉的虚拟现实交互方式在桌面书写应用场景中尚未有针对性的解决方案,书写交互中精细动作准确识别的实现,需要一种全新的高精度手笔联合三维识别技术,其中深度准确度是影响三维识别精度的重要因素。为此提出一种高精度双目深度测量方法,该方法信息技术合多尺度语义信息;同时利用视差级联模块缩小匹配范围,提高网络实时性。实验证明,提出的深度测量方法在手部和笔尖交互区域精度高,实时性好,能够有效辅助提高手笔联合三维识别精度以提供更好的虚拟书写交互体验,具有广泛的应用前景。

关键词: 双目视觉, 深度学习, 立体匹配, 深度测量, 桌面交互

摘要:基于视觉的虚拟现实交互方法在桌面书写应用场景中没有具体的解决方案。为了提供精细交互动作的准确识别,需要一种基于手笔结合的高精度三维识别技术。此外,深度精度是影响三维识别精度的重要因素。因此,本文提供了一种用于本研究的高精度深度测量方法。该方法的核心概念是使用高分辨率和近距离图像对作为书写交互的输入,并提出全局和局部重要信息交叉融合的思想,以提高速度和准确性,降低计算成本。在该算法中,区域检测模块用于提取图像对中手和笔尖的关键区域,然后根据重要性对输入进行缩放。引入区域特征金字塔结构提取多尺度语义信息。同时,采用视差级联模块缩小匹配范围,提高了实时性。最后,实验结果证实,该深度测量方法在手笔交互区域具有较高的精度和良好的实时性,可以有效地帮助提高三维识别精度,从而提供更好的书写交互体验。总之,本研究可以为深度测量在写作互动中的应用前景提供新的认识和理论依据。

关键词: 双目视觉, 深度学习, 立体匹配, 深度测量, 桌面交互