《计算机应用》唯一官方网站››2024,第44卷››问题(5): 1570-1578.内政部:10.11772/j.issn.1001-9081.2023050651
• 多媒体计算与计算机仿真 • 上一篇
盖彦辛1,2,闫涛1,2,三,4(),张江峰1,2,郭小英三,陈斌4,5
收稿日期:
修回日期:
接受日期:
发布日期:
出版日期:
通讯作者:
作者简介:
基金资助:
燕鑫通用电气1,2,陶燕1,2,三,4(),张江峰1,2,郭晓英三,陈斌(Bin CHEN)4,5
收到:
修订过的:
认可的:
在线:
出版:
联系人:
关于作者:
支持单位:
摘要:
聚焦形貌恢复通过对场景深度和散焦模糊之间的潜在关系进行建模实现三维形貌重建。但现有的三维形貌重建网络无法有效利用图像序列的时序关联进行表征学习,因此,提出一种基于多景深图像序列空间关联特征的深度网络框架——三维空间相关水平分析模型(3D SCHAM)进行三维形貌重建。该模型不仅可以精确捕获单帧图像中聚焦区域到离焦区域的边缘特征,而且可有效利用不同图像帧之间的空间依赖性特征。首先,通过构建深度、宽度和感受野复合扩展的网络构造三维形貌重建的时域连续模型,进而确定单点深度结果;其次,引入基于空间关联的注意力模块,充分学习帧与帧间的“邻接性”与“距离性”空间依赖关系;另外,利用残差反转瓶颈进行重采样,以保持跨尺度的语义丰富性。在DDFF 12场景真实场景数据集上的实验结果显示,相较于DfFintheWild,3D SCHAM在深度值准确度度量的3个阈值1.25,1.252,1.25三上的精确度分别提升了15.34%、3.62%、0.86%,验证了该模型在真实场景的鲁棒性。
关键词: 三维形貌重建, 时空注意力, 深度学习, 空间依赖关系, 深度图
聚焦形状恢复通过建模场景深度和离焦模糊之间的潜在关系来实现三维形状重建。然而,现有的三维形状重建网络不能有效地利用图像序列的序列相关性进行表征学习。因此,基于多深度图像序列的空间相关性特征的深度网络框架,即3D空间相关性地平线分析模型(3D SCHAM)提出了一种用于三维形状重建的方法,该方法不仅可以准确地捕获单个图像帧中从聚焦区域到散焦区域的边缘特征,而且可以有效地利用不同图像帧之间的空间相关性特征。首先,通过构建深度、宽度和感受野复合延伸的网络,建立三维形状重建的时间连续模型,以确定单点深度结果。其次,引入基于空间相关性的注意模块,充分学习帧间“邻接”和“距离”的空间依赖关系。此外,残差-覆盖瓶颈用于重采样,以保持跨尺度的语义丰富性。在DDFF 12场景真实场景数据集上的实验结果表明,与DfFintheWild模型相比,3D SCHAM模型在三个阈值下的准确性1.25,1.252,1.25三分别提高了15.34%、3.62%和0.86%,验证了3D SCHAM在真实场景中的鲁棒性。
关键词: 三维形状重建, 时空关注, 深度学习, 空间依赖关系, 深度图
中图分类号:
TP391.41型
盖彦辛, 闫涛, 张江峰, 郭小英, 陈斌. 基于时空注意力的空间关联三维形貌重建[J] ●●●●。计算机应用, 2024, 44(5): 1570-1578.
葛彦欣、陶燕、张江峰、郭晓英、陈斌。基于时空注意的空间相关性三维形状重建[J]。计算机应用杂志,2024,44(5):1570-1578。
0 / 推荐
导出引用管理器 尾注|里斯|BibTeX公司
链接本文: http://www.joca.cn/cn/10.11772/j.issn.1001-9081.2023050651
http://www.joca.cn/cn/Y2024/V44/I5/1570
图1菜肴样本中图像序列间相关系数热力图
图1菜肴样品的相关系数热图
图23D扫描
图23D SCHAM的整体结构
图三供应链管理信息系统
图3供应链管理的结构
表1 编码器中的参数配置及其消融实验结果
表1编码器参数配置及相应烧蚀实验结果
表2 模型架构消融实验结果
表2模型结构烧蚀实验结果
表三DDFF 12场数据集的三维形貌重建性能对比
表3DDFF 12场景数据集上不同模型的三维形状重构性能比较
表4离焦网和4D光场数据集上的三维形貌重建性能对比
表4基于DiscusNet数据集和4D光场数据集的不同模型三维形状重构性能比较
图44D光场数据集上的深度预测结果对比
图4基于4D光场数据集的不同模型深度预测结果比较
图5AiF深度网和3D SCHAM离焦网数据集上的深度预测结果对比
图5AiFDepthNet和3D SCHAM在DiscusNet数据集上的深度预测结果比较