跳到主要内容
10.1109/ICRA46639.2022.9812222指导程序文章/章节视图摘要出版物页面会议记录acm-pubtype公司
研究文章

DNN单目深度估计的运动不确定性

出版:2022年5月23日出版历史

摘要

在资源受限的平台上,部署深度神经网络(DNN)用于安全关键场景中的单目深度估计需要经过良好校准和有效的不确定性估计。然而,许多流行的不确定性估计技术,包括最先进的集成和流行的基于抽样的方法,需要对每个输入进行多个推论,这使得它们很难部署在潜在约束或能量约束的场景中。我们提出了一种新的算法,称为运动不确定性(UfM),每个输入只需要一个推理。UfM通过增量合并视频序列中多个视图中看到的点的像素深度预测和像素随机不确定性预测,利用视频输入中的时间冗余。当UfM应用于系综时,我们表明,UfM可以通过在每个帧只运行单个系综成员并融合帧序列的不确定性,在能量的一小部分上保持系综的不确定性。在使用FCDenseNet和八个不分布和分布外视频序列的一组代表性实验中,UfM提供了与大小为10的集合相当的不确定性质量,同时仅消耗11.3;合奏的's能量和跑步6.4×在单个Nvidia RTX 2080 Ti GPU上速度更快,为资源受限的实时场景提供接近整体的不确定性质量。

工具书类

  1. [1].托西·F·。,阿列奥蒂·F·。,波吉·M。、和马托奇亚S。, “利用传统立体知识学习单目深度估计,“inIEEE/CVF计算机视觉和模式识别会议记录,2019,第页。97999809.谷歌学者谷歌学者
  2. [2].沃夫克D。,马弗。,杨天杰。,卡拉曼S。、和Sze V.公司。, “Fastdepth:嵌入式系统上的快速单目深度估计,“in2019年机器人与自动化国际会议(ICRA)IEEE,2019年,pp。61016108.谷歌学者谷歌学者
  3. [3].宋·M。,林斯(Lim S.)。、和金·W·。, “基于拉普拉斯金字塔深度残差的单目深度估计,”IEEE视频技术电路与系统汇刊,2021.谷歌学者谷歌学者
  4. [4].肯德尔A。加仑Y。, “在计算机视觉的贝叶斯深度学习中,我们需要哪些不确定性?arXiv预印本arXiv:1703.04977,2017.谷歌学者谷歌学者
  5. [5].斯图尔姆·J。,恩格哈德N。,恩德斯·F。,伯格·W·。、和Cremers D.公司。, “rgb-d slam系统评估的基准,“in程序。国际智能机器人系统大会2012年10月。谷歌学者谷歌学者
  6. [6].西尔伯曼P.K.内森,霍伊姆·德里克弗格斯·R。, “基于rgbd图像的室内分割与支持推理,“in电子对抗车辆,2012.谷歌学者谷歌学者数字图书馆数字图书馆
  7. [7].加仑Y。加赫拉马尼Z。, “辍学作为贝叶斯近似:在深度学习中表示模型不确定性,“in机器学习国际会议PMLR,2016,pp。10501059.谷歌学者谷歌学者
  8. [8].布伦德尔C。,康奈比斯J。,Kavukcuoglu K。、和维尔斯特拉·D·。, “神经网络中的权重不确定性,“in机器学习国际会议PMLR,2015年,pp。16131622.谷歌学者谷歌学者
  9. [9].拉克希米纳拉亚南B。,普里策A。、和布伦德尔C。, “使用深度集成进行简单且可扩展的预测不确定性估计,”arXiv预印本arXiv:1612.01474,2016.谷歌学者谷歌学者
  10. [10].卵巢Y。,费蒂格E。,任杰(Ren J.)。,纳多·Z。,斯卡利·D·。,诺沃津S。,狄龙·J·V。,拉克希米纳拉亚南B。、和斯诺克·J·。, “你能相信你的模型的不确定性吗?数据集转移下的预测不确定性评估,”arXiv预印本arXiv:1906.02530,2019.谷歌学者谷歌学者
  11. [11].尼克斯·D.A。Weigend A.S.公司。, “估计目标概率分布的均值和方差,“in1994年IEEE神经网络国际会议论文集(ICNN'94),卷。1IEEE,1994年,pp。5560.谷歌学者谷歌学者
  12. [12].张瑞(Zhang R.)。,李C。,张杰。,陈C。、和威尔逊A.G。, “贝叶斯深度学习的循环随机梯度mcmc,”arXiv预印本arXiv:1902.03932,2019.谷歌学者谷歌学者
  13. [13].海克·J。Kalchbrenner N.公司。, “大规模图像分类的贝叶斯推理,”arXiv预印本arXiv:1908.03491,2019.谷歌学者谷歌学者
  14. [14].加里波夫T。,伊兹迈洛夫·P。,波多里钦D。,维特罗·D·。、和威尔逊A.G。, “损失面、模式连通性和dnn的快速集成,“in第32届神经信息处理系统国际会议论文集,2018,第页。88038812.谷歌学者谷歌学者数字图书馆数字图书馆
  15. [15].Longuet-Higgins H.C.公司。, “从两个投影重建场景的计算机算法,”自然,卷。293,没有。5828,第页。133135,1981.谷歌学者谷歌学者交叉引用交叉引用
  16. [16].托马西C。卡纳德T。, “正交下图像流的形状和运动:一种分解方法,”国际计算机视觉杂志,卷。9,没有。2,第页。137154,1992.谷歌学者谷歌学者数字图书馆数字图书馆
  17. [17].Schonberger J.L.公司。弗拉姆J.-M。, “重新审视结构-动作,“inIEEE计算机视觉和模式识别会议记录,2016,第页。41044113.谷歌学者谷歌学者交叉引用交叉引用
  18. [18].周T。,布朗·M。,斯内维利·N。、和洛·D·G。, “无监督学习视频中的深度和自我意识,“inIEEE计算机视觉和模式识别会议记录,2017,第页。18511858.谷歌学者谷歌学者交叉引用交叉引用
  19. [19].马弗。,卡瓦莱罗G.V。、和卡拉曼S。, “自我监督稀疏感:激光雷达和单目相机的自我监督深度完成,“in2019年机器人与自动化国际会议(ICRA)IEEE,2019年,pp。32883295.谷歌学者谷歌学者
  20. [20].卡瑟五世。,Pirk S.公司。,马霍里安R。、和安吉洛娃A。, “无传感器深度预测:利用结构从单目视频进行无监督学习,“inAAAI人工智能会议记录,卷。33,没有。01,2019,第页。80018008.谷歌学者谷歌学者数字图书馆数字图书馆
  21. [21].卞建伟。,詹H。,王N。,李Z。,张磊(音)。,深圳市。,程M.-M。、和里德一世。, “基于视频的无监督尺度一致性深度学习,”国际计算机视觉杂志,卷。129,没有。9,第页。25482564,2021.谷歌学者谷歌学者数字图书馆数字图书馆
  22. [22].罗X。,黄J.-B。,塞利斯基·R·。,Matzen K。、和Kopf J。, “一致的视频深度估计,”ACM图形事务处理(TOG),卷。39,没有。4,第页。711,2020.谷歌学者谷歌学者
  23. [23].杜兹切克A。,加利亚尼S。,沃格尔C。,专业P。,杜斯曼努·M。、和Pollefeys M。, “Deepvideomvs:具有重复时空融合的多视点立体视频,“inIEEE/CFF计算机视觉与模式识别会议论文集,2021,第页。1532415333.谷歌学者谷歌学者
  24. [24].朱毅(音)。,萨普拉K。,雷达F.A。,Shih K.J.先生。,纽萨姆S。,陶A。、和卡坦扎罗B。, “通过视频传播和标签松弛改进语义分割,“inIEEE/CVF计算机视觉和模式识别会议记录,2019,第页。88568865.谷歌学者谷歌学者
  25. [25].刘C。,顾杰(Gu J.)。,Kim K。,Narasimhan S.G.公司。、和考茨·J。, “神经rgb(r)d传感:摄像机的深度和不确定性,“inIEEE/CVF计算机视觉和模式识别会议记录,2019,第页。1098610995.谷歌学者谷歌学者
  26. [26].黄P.-Y。,徐世通。,邱春云(Chiu C.-Y.)。,吴天福。、和Sun M。, “视频语义分割的有效不确定性估计,“in欧洲计算机视觉会议记录,2018,第页。520535.谷歌学者谷歌学者
  27. [27].郭C。,普莱斯G。,孙毅(Sun Y.)。、和温伯格·K·Q。, “现代神经网络的校准,“in机器学习国际会议PMLR,2017年,pp。13211330.谷歌学者谷歌学者
  28. [28].Naeini医学博士。,库珀G。、和Hauskrecht M。, “使用贝叶斯binning获得校准好的概率,“in第二十届AAAI人工智能会议,2015.谷歌学者谷歌学者数字图书馆数字图书馆
  29. [29].阿米尼A。,施瓦廷·W·。,索莱曼尼A。、和罗斯·D。, “深度证据回归,”arXiv预印本arXiv:1910.02600,2019.谷歌学者谷歌学者
  30. [30].杰古S。,德罗兹扎尔·M·。,巴斯克斯·D·。,罗梅罗A。、和本吉奥·Y。, “百层提拉米苏:用于语义分割的完全卷积密度,“inIEEE计算机视觉和模式识别研讨会会议记录,2017,第页。1119.谷歌学者谷歌学者交叉引用交叉引用
  31. [31].莱纳一世。,鲁普雷希特C。,贝拉吉安尼斯五世。,汤巴里·F·。、和纳瓦布N。, “利用全卷积残差网络进行深度预测,“in2016年第四届国际3D视觉会议(3DV)IEEE,2016年,pp。239248.谷歌学者谷歌学者
  32. [32].穆尔·阿尔塔尔·R。,蒙蒂尔·J·M·M·。、和塔尔多斯J.D。, “Orb-slam:一种多功能、精确的单目slam系统,”IEEE机器人事务,卷。31,没有。5,第页。11471163,2015.谷歌学者谷歌学者数字图书馆数字图书馆
  33. [33].穆尔·阿尔塔尔。塔多斯·J·D。, “ORB-SLAM2:用于单目、立体和RGB-D相机的开源SLAM系统,”IEEE机器人汇刊,卷。33,没有。5,第页。12551262,2017.谷歌学者谷歌学者数字图书馆数字图书馆
  34. [34].拉迪克L。,史杰(Shi J.)。、和Pollefeys M。, “把事情从观点中拉出来,“inIEEE计算机视觉和模式识别会议记录,2014,第页。8996.谷歌学者谷歌学者数字图书馆数字图书馆
  35. [35].Eigen D。,Puhrsch C.公司。、和弗格斯·R。, “基于多尺度深度网络的单幅图像深度图预测,”arXiv预印本arXiv:1406.2283,2014.谷歌学者谷歌学者
  36. [36].马弗。卡拉曼S。, “稀疏:从稀疏深度采样和单个图像进行深度预测,“in2018 IEEE机器人与自动化国际会议(ICRA)IEEE,2018年,pp。47964803.谷歌学者谷歌学者数字图书馆数字图书馆
  37. [37].乌里格J。,施耐德N。,施耐德L。,Franke U。,布罗克斯T。、和盖革A。, “稀疏不变cnns,“in国际3D视觉会议(3DV),2017.谷歌学者谷歌学者交叉引用交叉引用

建议

评论

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

登录

完全访问权限

  • 发布于

    封面图片指南会议记录
    2022年机器人与自动化国际会议(ICRA)
    2022年5月
    6634页

    版权所有©2022

    出版商

    IEEE出版社

    出版历史

    • 出版:2022年5月23日

    限定符

    • 研究文章
  • 文章指标

    • 下载量(最近12个月)0
    • 下载次数(最近6周)0

    其他指标