研究文章

DNN单目深度估计的运动不确定性

作者：
Soumya Sudhakar公司

麻省理工学院，美国马萨诸塞州剑桥，02139

麻省理工学院，美国马萨诸塞州剑桥，02139
查看个人资料

,
薇薇安·斯泽

麻省理工学院，美国马萨诸塞州剑桥，02139

麻省理工学院，美国马萨诸塞州剑桥，02139
查看个人资料

,
Sertac Karaman公司

麻省理工学院，美国马萨诸塞州剑桥，02139

麻省理工学院，美国马萨诸塞州剑桥，02139
查看个人资料

作者信息和声明

2022年机器人与自动化国际会议（ICRA）2022年5月第8673–8679页https://doi.org/10.109/ICRA46639.2022.9812222

出版：2022年5月23日出版历史

2022年机器人与自动化国际会议（ICRA）

第8673–8679页

摘要

在资源受限的平台上，部署深度神经网络（DNN）用于安全关键场景中的单目深度估计需要经过良好校准和有效的不确定性估计。然而，许多流行的不确定性估计技术，包括最先进的集成和流行的基于抽样的方法，需要对每个输入进行多个推论，这使得它们很难部署在潜在约束或能量约束的场景中。我们提出了一种新的算法，称为运动不确定性（UfM），每个输入只需要一个推理。UfM通过增量合并视频序列中多个视图中看到的点的像素深度预测和像素随机不确定性预测，利用视频输入中的时间冗余。当UfM应用于系综时，我们表明，UfM可以通过在每个帧只运行单个系综成员并融合帧序列的不确定性，在能量的一小部分上保持系综的不确定性。在使用FCDenseNet和八个不分布和分布外视频序列的一组代表性实验中，UfM提供了与大小为10的集合相当的不确定性质量，同时仅消耗11.3；合奏的&#x0027；s能量和跑步6.4&#x00D7；在单个Nvidia RTX 2080 Ti GPU上速度更快，为资源受限的实时场景提供接近整体的不确定性质量。

工具书类

[1].托西·F·。,阿列奥蒂·F·。,波吉·M。、和马托奇亚S。, “利用传统立体知识学习单目深度估计，“inIEEE/CVF计算机视觉和模式识别会议记录,2019，第页。9799–9809.谷歌学者
[2].沃夫克D。,马弗。,杨天杰。,卡拉曼S。、和Sze V.公司。, “Fastdepth：嵌入式系统上的快速单目深度估计，“in2019年机器人与自动化国际会议（ICRA）IEEE，2019年，pp。6101–6108.谷歌学者
[3].宋·M。,林斯（Lim S.）。、和金·W·。, “基于拉普拉斯金字塔深度残差的单目深度估计,”IEEE视频技术电路与系统汇刊,2021.谷歌学者
[4].肯德尔A。和加仑Y。, “在计算机视觉的贝叶斯深度学习中，我们需要哪些不确定性？”arXiv预印本arXiv:1703.04977,2017.谷歌学者
[5].斯图尔姆·J。,恩格哈德N。,恩德斯·F。,伯格·W·。、和Cremers D.公司。, “rgb-d slam系统评估的基准，“in程序。国际智能机器人系统大会2012年10月。谷歌学者
[6].西尔伯曼P.K.内森,霍伊姆·德里克和弗格斯·R。, “基于rgbd图像的室内分割与支持推理，“in电子对抗车辆,2012.谷歌学者数字图书馆
[7].加仑Y。和加赫拉马尼Z。, “辍学作为贝叶斯近似：在深度学习中表示模型不确定性，“in机器学习国际会议PMLR，2016，pp。1050–1059.谷歌学者
[8].布伦德尔C。,康奈比斯J。,Kavukcuoglu K。、和维尔斯特拉·D·。, “神经网络中的权重不确定性，“in机器学习国际会议PMLR，2015年，pp。1613–1622.谷歌学者
[9].拉克希米纳拉亚南B。,普里策A。、和布伦德尔C。, “使用深度集成进行简单且可扩展的预测不确定性估计,”arXiv预印本arXiv:1612.01474,2016.谷歌学者
[10].卵巢Y。,费蒂格E。,任杰（Ren J.）。,纳多·Z。,斯卡利·D·。,诺沃津S。,狄龙·J·V。,拉克希米纳拉亚南B。、和斯诺克·J·。, “你能相信你的模型的不确定性吗？数据集转移下的预测不确定性评估,”arXiv预印本arXiv:1906.02530,2019.谷歌学者
[11].尼克斯·D.A。和Weigend A.S.公司。, “估计目标概率分布的均值和方差，“in1994年IEEE神经网络国际会议论文集（ICNN'94），卷。1IEEE，1994年，pp。55–60.谷歌学者
[12].张瑞（Zhang R.）。,李C。,张杰。,陈C。、和威尔逊A.G。, “贝叶斯深度学习的循环随机梯度mcmc,”arXiv预印本arXiv:1902.03932,2019.谷歌学者
[13].海克·J。和Kalchbrenner N.公司。, “大规模图像分类的贝叶斯推理,”arXiv预印本arXiv:1908.03491,2019.谷歌学者
[14].加里波夫T。,伊兹迈洛夫·P。,波多里钦D。,维特罗·D·。、和威尔逊A.G。, “损失面、模式连通性和dnn的快速集成，“in第32届神经信息处理系统国际会议论文集,2018，第页。8803–8812.谷歌学者数字图书馆
[15].Longuet-Higgins H.C.公司。, “从两个投影重建场景的计算机算法,”自然，卷。293，没有。5828，第页。133–135,1981.谷歌学者交叉引用
[16].托马西C。和卡纳德T。, “正交下图像流的形状和运动：一种分解方法,”国际计算机视觉杂志，卷。9，没有。2，第页。137–154,1992.谷歌学者数字图书馆
[17].Schonberger J.L.公司。和弗拉姆J.-M。, “重新审视结构-动作，“inIEEE计算机视觉和模式识别会议记录,2016，第页。4104–4113.谷歌学者交叉引用
[18].周T。,布朗·M。,斯内维利·N。、和洛·D·G。, “无监督学习视频中的深度和自我意识，“inIEEE计算机视觉和模式识别会议记录,2017，第页。1851–1858.谷歌学者交叉引用
[19].马弗。,卡瓦莱罗G.V。、和卡拉曼S。, “自我监督稀疏感：激光雷达和单目相机的自我监督深度完成，“in2019年机器人与自动化国际会议（ICRA）IEEE，2019年，pp。3288–3295.谷歌学者
[20].卡瑟五世。,Pirk S.公司。,马霍里安R。、和安吉洛娃A。, “无传感器深度预测：利用结构从单目视频进行无监督学习，“inAAAI人工智能会议记录，卷。33，没有。01,2019，第页。8001–8008.谷歌学者数字图书馆
[21].卞建伟。,詹H。,王N。,李Z。,张磊（音）。,深圳市。,程M.-M。、和里德一世。, “基于视频的无监督尺度一致性深度学习,”国际计算机视觉杂志，卷。129，没有。9，第页。2548–2564,2021.谷歌学者数字图书馆
[22].罗X。,黄J.-B。,塞利斯基·R·。,Matzen K。、和Kopf J。, “一致的视频深度估计,”ACM图形事务处理（TOG），卷。39，没有。4，第页。71–1,2020.谷歌学者
[23].杜兹切克A。,加利亚尼S。,沃格尔C。,专业P。,杜斯曼努·M。、和Pollefeys M。, “Deepvideomvs：具有重复时空融合的多视点立体视频，“inIEEE/CFF计算机视觉与模式识别会议论文集,2021，第页。15324–15333.谷歌学者
[24].朱毅（音）。,萨普拉K。,雷达F.A。,Shih K.J.先生。,纽萨姆S。,陶A。、和卡坦扎罗B。, “通过视频传播和标签松弛改进语义分割，“inIEEE/CVF计算机视觉和模式识别会议记录,2019，第页。8856–8865.谷歌学者
[25].刘C。,顾杰（Gu J.）。,Kim K。,Narasimhan S.G.公司。、和考茨·J。, “神经rgb（r）d传感：摄像机的深度和不确定性，“inIEEE/CVF计算机视觉和模式识别会议记录,2019，第页。10986–10995.谷歌学者
[26].黄P.-Y。,徐世通。,邱春云（Chiu C.-Y.）。,吴天福。、和Sun M。, “视频语义分割的有效不确定性估计，“in欧洲计算机视觉会议记录,2018，第页。520–535.谷歌学者
[27].郭C。,普莱斯G。,孙毅（Sun Y.）。、和温伯格·K·Q。, “现代神经网络的校准，“in机器学习国际会议PMLR，2017年，pp。1321–1330.谷歌学者
[28].Naeini医学博士。,库珀G。、和Hauskrecht M。, “使用贝叶斯binning获得校准好的概率，“in第二十届AAAI人工智能会议,2015.谷歌学者数字图书馆
[29].阿米尼A。,施瓦廷·W·。,索莱曼尼A。、和罗斯·D。, “深度证据回归,”arXiv预印本arXiv:1910.02600,2019.谷歌学者
[30].杰古S。,德罗兹扎尔·M·。,巴斯克斯·D·。,罗梅罗A。、和本吉奥·Y。, “百层提拉米苏：用于语义分割的完全卷积密度，“inIEEE计算机视觉和模式识别研讨会会议记录,2017，第页。11–19.谷歌学者交叉引用
[31].莱纳一世。,鲁普雷希特C。,贝拉吉安尼斯五世。,汤巴里·F·。、和纳瓦布N。, “利用全卷积残差网络进行深度预测，“in2016年第四届国际3D视觉会议（3DV）IEEE，2016年，pp。239–248.谷歌学者
[32].穆尔·阿尔塔尔·R。,蒙蒂尔·J·M·M·。、和塔尔多斯J.D。, “Orb-slam：一种多功能、精确的单目slam系统,”IEEE机器人事务，卷。31，没有。5，第页。1147–1163,2015.谷歌学者数字图书馆
[33].穆尔·阿尔塔尔。和塔多斯·J·D。, “ORB-SLAM2：用于单目、立体和RGB-D相机的开源SLAM系统,”IEEE机器人汇刊，卷。33，没有。5，第页。1255–1262,2017.谷歌学者数字图书馆
[34].拉迪克L。,史杰（Shi J.）。、和Pollefeys M。, “把事情从观点中拉出来，“inIEEE计算机视觉和模式识别会议记录,2014，第页。89–96.谷歌学者数字图书馆
[35].Eigen D。,Puhrsch C.公司。、和弗格斯·R。, “基于多尺度深度网络的单幅图像深度图预测,”arXiv预印本arXiv:1406.2283,2014.谷歌学者
[36].马弗。和卡拉曼S。, “稀疏：从稀疏深度采样和单个图像进行深度预测，“in2018 IEEE机器人与自动化国际会议（ICRA）IEEE，2018年，pp。4796–4803.谷歌学者数字图书馆
[37].乌里格J。,施耐德N。,施耐德L。,Franke U。,布罗克斯T。、和盖革A。, “稀疏不变cnns，“in国际3D视觉会议（3DV）,2017.谷歌学者交叉引用

建议

变深度网络：不确定感知的单目自监督深度估计
计算机愿景–ECCV 2022研讨会
摘要
使用自监督学习，训练神经网络从单个图像预测深度，而不需要地面实况注释。然而，它们容易受到输入歧义的影响，因此表达。。。
阅读更多信息
用于单目深度估计的多尺度深度分类网络
集锦
- 通过将回归任务转化为分类任务，提出了一种用于单目深度估计的多尺度分类网络。
摘要
除了图像的RGB信息外，深度信息也是最关键的。单目深度估计是从RGB图像中预测深度的有效方法。首先，我们提出了一个多尺度分类网络。。。
图形摘要

忽略的显示
阅读更多信息
基于不确定性量化的自监督单目深度估计
摘要
基于设计良好的网络结构和目标函数，自监督单目深度估计取得了很大进展。然而，缺乏一种具体的机制，使网络能够更多地了解包含移动的区域。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

其他指标
查看文章指标

文章指标
- 0
  引文总数
  查看引文
- 0
  总下载次数
- 下载量（最近12个月）0
- 下载次数（最近6周）0
其他指标
查看作者指标
引用人
本出版物尚未被引用

DNN单目深度估计的运动不确定性

2022年机器人与自动化国际会议（ICRA）

摘要

工具书类

引用人

建议

变深度网络：不确定感知的单目自监督深度估计

用于单目深度估计的多尺度深度分类网络

基于不确定性量化的自监督单目深度估计

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

限定符

会议

资金来源

其他指标

文章指标

其他指标

引用人

数字版

解说词

DNN单目深度估计的运动不确定性

2022年机器人与自动化国际会议（ICRA）

摘要

工具书类

引用人

建议

变深度网络：不确定感知的单目自监督深度估计

用于单目深度估计的多尺度深度分类网络

基于不确定性量化的自监督单目深度估计

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

限定符

会议

资金来源

文章指标

其他指标

数字版

共享此出版物链接

在社交媒体上分享