计算机应用》唯一官方网站››2024,第44卷››问题(5): 1570-1578.内政部:10.11772/j.issn.1001-9081.2023050651

多媒体计算与计算机仿真 • 上一篇   

基于时空注意力的空间关联三维形貌重建

盖彦辛1,2,闫涛1,2,,4(),张江峰1,2,郭小英,陈斌4,5  

  1. 1山西大学 计算机与信息技术学院, 太原 030006
    2山西大学 大数据科学与产业研究院, 太原 030006
    三。山西大学 自动化与软件学院, 太原 030006
    4哈尔滨工业大学重庆研究院, 重庆 401151
    5哈尔滨工业大学(深圳) 国际人工智能研究院, 深圳 518055
  • 收稿日期:2023-05-24 修回日期:2023-07-20 接受日期:2023-07-27 发布日期:2023-08-03 出版日期:2024-05-10
  • 通讯作者:闫涛
  • 作者简介:盖彦辛(1997—),女,山西临汾人,硕士研究生,主要研究方向:深度学习、三维形貌重建
    张江峰(1998—),男,山西晋城人,硕士研究生,共因失效会员,主要研究方向:三维形貌重建
    郭小英(1985—),女,山西原平人,副教授,博士,主要研究方向:计算机视觉
    陈斌(1970—),男,四川广汉人,教授,博士,主要研究方向:机器视觉。
    第一联系人:闫涛(1987—),男,山西定襄人,副教授,博士,共因失效会员,主要研究方向:三维形貌重建
  • 基金资助:
    国家自然科学基金资助项目(62006146);山西省基础研究计划自然科学研究面上项目(202203021221029);中央引导地方科技发展资金资助项目(YDZJSX20231C001)

基于时空注意的空间相关性三维形状重建

燕鑫通用电气1,2,陶燕1,2,,4(),张江峰1,2,郭晓英,陈斌(Bin CHEN)4,5  

  1. 1山西大学计算机与信息技术学院,山西太原030006
    2山西大学大数据科学与产业研究所,山西太原030006,中国
    三。山西大学自动化与软件工程学院,山西太原030006
    4哈尔滨工业大学重庆研究院,中国重庆401151
    5中国广东省深圳市哈尔滨工业大学人工智能国际研究所,邮编:518055
  • 收到:2023-05-24 修订过的:2023-07-20 认可的:2023-07-27 在线:2023-08-03 出版:2024-05-10
  • 联系人:陶燕
  • 关于作者:葛燕新,1997年生,硕士研究生。她的研究兴趣包括深度学习、3D形状重建。
    张江峰,1998年生,硕士研究生。他的研究兴趣包括3D形状重建。
    郭晓英,1985年生,博士,副教授。她的研究兴趣包括计算机视觉。
    陈斌,1970年出生,博士,教授。他的研究兴趣包括计算机视觉。
  • 支持单位:
    国家自然科学基金项目(62006146);山西省自然科学基金项目(202203021221029);中央政府引导地方科技发展专项资金(YDZJSX20231C001)

摘要:

聚焦形貌恢复通过对场景深度和散焦模糊之间的潜在关系进行建模实现三维形貌重建。但现有的三维形貌重建网络无法有效利用图像序列的时序关联进行表征学习,因此,提出一种基于多景深图像序列空间关联特征的深度网络框架——三维空间相关水平分析模型(3D SCHAM)进行三维形貌重建。该模型不仅可以精确捕获单帧图像中聚焦区域到离焦区域的边缘特征,而且可有效利用不同图像帧之间的空间依赖性特征。首先,通过构建深度、宽度和感受野复合扩展的网络构造三维形貌重建的时域连续模型,进而确定单点深度结果;其次,引入基于空间关联的注意力模块,充分学习帧与帧间的“邻接性”与“距离性”空间依赖关系;另外,利用残差反转瓶颈进行重采样,以保持跨尺度的语义丰富性。在DDFF 12场景真实场景数据集上的实验结果显示,相较于DfFintheWild,3D SCHAM在深度值准确度度量的3个阈值1.25,1.252,1.25上的精确度分别提升了15.34%、3.62%、0.86%,验证了该模型在真实场景的鲁棒性。

关键词: 三维形貌重建, 时空注意力, 深度学习, 空间依赖关系, 深度图

摘要:

聚焦形状恢复通过建模场景深度和离焦模糊之间的潜在关系来实现三维形状重建。然而,现有的三维形状重建网络不能有效地利用图像序列的序列相关性进行表征学习。因此,基于多深度图像序列的空间相关性特征的深度网络框架,即3D空间相关性地平线分析模型(3D SCHAM)提出了一种用于三维形状重建的方法,该方法不仅可以准确地捕获单个图像帧中从聚焦区域到散焦区域的边缘特征,而且可以有效地利用不同图像帧之间的空间相关性特征。首先,通过构建深度、宽度和感受野复合延伸的网络,建立三维形状重建的时间连续模型,以确定单点深度结果。其次,引入基于空间相关性的注意模块,充分学习帧间“邻接”和“距离”的空间依赖关系。此外,残差-覆盖瓶颈用于重采样,以保持跨尺度的语义丰富性。在DDFF 12场景真实场景数据集上的实验结果表明,与DfFintheWild模型相比,3D SCHAM模型在三个阈值下的准确性1.25,1.252,1.25分别提高了15.34%、3.62%和0.86%,验证了3D SCHAM在真实场景中的鲁棒性。

关键词: 三维形状重建, 时空关注, 深度学习, 空间依赖关系, 深度图

中图分类号: