×

多分辨率3D CNN,用于学习CAD模型中的多尺度空间特征。 (英语) Zbl 1480.65055号

摘要:从点云、3D CAD模型、曲面和RGB-D数据等对象的3D空间几何表示中学习多尺度空间特征可以潜在地提高对象识别精度。当前的深度学习方法使用结构化数据表示(如体积占用栅格(体素)和八叉树)或非结构化表示(如图形和点云)学习此类特征。结构化表示通常受到其固有分辨率限制,例如体素网格尺寸或最大八叉树深度。同时,由于样本之间的不一致性,直接从三维数据的非结构化表示中学习很有挑战性。层次化方法可以在较大的规模上维护结构,同时在特定空间位置以较小的规模解释细节,可以为从3D数据中学习提供最佳解决方案。在本文中,我们提出了一种多层次学习方法,以在粗略水平上捕获大规模特征(例如,使用粗略体素化),同时在不同空间位置在精细水平上捕获小规模特征的灵活稀疏信息(例如,局部精细水平体素网格)。为了证明所提出的多分辨率学习的实用性,我们使用CAD模型的多级体素表示来执行对象识别。多级体素表示由包含3D对象体积信息的粗体素网格和对应于包含部分对象边界的粗网格中每个体素的多个精细体素网格组成。此外,我们开发了一种基于可解释性的反馈方法,在分层端到端学习框架中将显著性信息从一个特征层次传递到另一个特征级别。最后,我们演示了我们的多分辨率学习算法在对象识别中的性能。在对象识别方面,我们的性能优于之前发布的几个基准测试,而在训练期间使用的内存明显更少。

MSC公司:

65D18天 计算机图形、图像分析和计算几何的数值方面
68T07型 人工神经网络与深度学习
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿卜杜勒·拉赫曼,A。;Pilouk,M.,《3D GIS的空间数据建模》(2007),Springer Science&Business Media
[2] Baydin,A.G。;Pearlmutter,B.A。;Radul,A.A。;Siskind,J.M.,《机器学习中的自动差异化:一项调查》,J.Mach。学习。第18号决议(2018年)·Zbl 06982909号
[3] Blelloch,G.E.,扫描作为基本并行操作,IEEE Trans。计算。,38, 1526-1538 (1989)
[4] 博斯卡尼,D。;Masci,J。;罗德亚,E。;Bronstein,M.,学习形状与各向异性卷积神经网络的对应,(第30届神经信息处理系统国际会议论文集。第30届国际神经信息处理会议论文集,美国(2016)),3197-3205
[5] Bronstein,M.M。;布鲁纳,J。;LeCun,Y。;Szlam,A。;Vandergheynst,P.,《几何深度学习:超越欧几里德数据》,IEEE信号处理。Mag.,34,18-42(2017)
[6] Cardone,A。;Gupta,S.K。;Karnik,M.,《产品设计和制造应用中形状相似性评估算法的调查》,J.Compute。信息科学。工程,3109-118(2003)
[7] 查尔斯·R·Q。;苏,H。;凯春,M。;Guibas,L.J.,PointNet:三维分类和分割的点集深度学习,(IEEE计算机视觉和模式识别会议论文集(2017)),77-85
[8] Choy,C。;Gwak,J。;Savarese,S.,4D时空卷积网络:Minkowski卷积神经网络,(IEEE/CFF计算机视觉和模式识别会议论文集(2019)),3075-3084
[9] 库普利,C。;Farabet,C。;纳杰曼,L。;LeCun,Y.,《使用深度信息的室内语义分割》,(国际学习表征会议(2013)),1-8
[10] Elinson,A。;Nau,D.S。;Regli,W.C.,实体模型的基于特征的相似性评估,(第四届ACM实体建模与应用研讨会论文集(1997),ACM),297-310
[11] 费伊,M。;Lenssen,J.E。;Weichert,F。;Müller,H.,SplineCNN:使用连续B样条核进行快速几何深度学习,(IEEE计算机视觉和模式识别会议论文集(2018)),869-877
[12] 加代,S。;A.巴鲁。;Sarkar,S。;Krishnamurthy,A.,学习用于钻孔可制造性分析的3D CAD模型中的本地化特征,计算。辅助Geom。设计。,62, 263-275 (2018) ·Zbl 1505.65060号
[13] Ghadai,S。;Yeow Lee,X。;巴鲁,A。;Sarkar,S。;Krishnamurthy,A.,学习多尺度空间特征的多层次3D CNN,(IEEE/CVF计算机视觉和模式识别(CVPR)研讨会论文集(2019)),1-5
[14] He,K。;张,X。;任,S。;Sun,J.,图像识别的深度剩余学习,(2016年IEEE计算机视觉和模式识别会议(CVPR)(2016)),770-778
[15] 黄,G。;刘,Z。;范德马滕,L。;Weinberger,K.Q.,密集连接卷积网络,(IEEE计算机视觉和模式识别会议论文集(2017)),2261-2269
[16] 艾奥安尼杜,A。;查齐拉里,E。;Nikolopoulos,S。;Kompatsiaris,I.,《利用3D数据进行计算机视觉的深度学习进展:一项调查》,ACM Comput。调查。,50,20(2017)
[17] Iyer,N。;Jayanti,S。;卢·K。;Kalyanaraman,Y。;Ramani,K.,《三维形状搜索:最新进展和未来趋势》,计算机。辅助设计。,37, 509-530 (2005)
[18] Jayanti,S。;Kalyanaraman,Y。;Iyer,N。;Ramani,K.,为CAD模型开发工程形状基准,计算。辅助设计。,38, 939-953 (2006)
[19] Joshi,S。;Chang,T.C.,基于图形的启发式算法,用于从三维实体模型中识别加工特征,计算。辅助设计。,20, 58-66 (1988) ·Zbl 0656.65014号
[20] Kanazaki,A。;松下,Y。;Nishida,Y.,RotationNet:使用无监督视角的多视图进行联合对象分类和姿势估计,(IEEE计算机视觉和模式识别会议论文集(2018)),5010-5019
[21] Keim,D.A.,3D空间数据库的高效基于几何的相似性搜索,SIGMOD Rec.,28419-430(1999)
[22] Klokov,R。;Lempitsky,V.,《逃离细胞:用于识别3D点云模型的深层Kd网络》(IEEE国际计算机视觉会议论文集(2017)),863-872
[23] 科夫纳茨基,A。;Bronstein,M.M。;Bronstein,A.M。;格拉绍夫,K。;Kimmel,R.,耦合准哈密顿基,计算。图表。论坛,32,439-448(2013)
[24] Kriegel,H.P。;Brecheisen,S。;科尔格,P。;Pfeifle,M。;Schubert,M.,使用特征向量集对体素化CAD对象进行相似性搜索,(2003年ACM SIGMOD国际数据管理会议论文集(2003),ACM:ACM纽约,纽约,美国),587-598
[25] Krizhevsky,A。;Sutskever,I。;Hinton,G.E.,用深度卷积神经网络进行ImageNet分类,Commun。ACM,60,84-90(2017)
[26] Kyprianou,L.K.,计算机辅助设计中的形状分类(1980),剑桥大学博士论文
[27] Lecun,Y。;博图,L。;Y.本吉奥。;Haffner,P.,《基于梯度的学习应用于文档识别》,Proc。IEEE,86,2278-2324(1998)
[28] 李,J。;陈,B.M。;Lee,G.H.,So-net:点云分析的自组织网络,(IEEE计算机视觉和模式识别会议论文集(2018)),9397-9406
[29] 刘,M。;Shi,Y。;郑,L。;Xu,K。;黄,H。;Manocha,D.,端到端主动物体识别的递归3D注意网络,计算。视觉。媒体,591-104(2019)
[30] Lowe,D.G.,《用于3D物体识别的局部特征视图聚类》(2001年IEEE计算机学会计算机视觉和模式识别会议论文集,2001年)。2001年IEEE计算机学会计算机视觉和模式识别会议记录,2001年,CVPR 2001(2001),IEEE),1
[31] 马,C。;郭毅。;雷,Y。;An,W.,用于三维物体识别的二进制体积卷积神经网络,IEEE Trans。仪器。测量。,1-11 (2018)
[32] Masci,J。;博斯卡尼,D。;Bronstein,M.M。;Vandergheynst,P.,黎曼流形上的测地卷积神经网络,(2015 IEEE计算机视觉国际会议研讨会(2015)),832-840
[33] Maturana,D。;Scherer,S.,VoxNet:用于实时对象识别的3D卷积神经网络,(2015 IEEE/RSJ智能机器人和系统国际会议(IROS)(2015)),922-928
[34] 奥拉,C。;Mordvintsev,A。;舒伯特,L.,特征可视化,蒸馏(2017)
[35] 齐,C.R。;苏,H。;Nießner先生。;戴,A。;Yan,M。;Guibas,L.J.,三维数据对象分类的体积和多视图CNN,(IEEE计算机视觉和模式识别会议论文集(2016)),5648-5656
[36] 齐,C.R。;Yi,L。;苏,H。;Guibas,L.J.,PointNet++:度量空间中点集的深度分层特征学习,(Guyon,I.;Luxburg,U.V.;Bengio,S.;Wallach,H.;Fergus,R.;Vishwanathan,S.,Garnett,R.,《神经信息处理系统进展》(2017),5099-5108
[37] 拉梅什,M。;Yip-Hai,D。;Dutta,D.,《机械零件检索中基于特征的形状相似性测量》,J.Compute。信息科学。工程,1245-256(2001)
[38] 里贝罗,M.T。;辛格,S。;Guestrin,C.,“我为什么要相信你?”:解释任何分类器的预测,(第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集(2016),ACM:ACM纽约,纽约,美国),1135-1144
[39] Riegler,G。;Ulusoys,A.O。;Geiger,A.,Octnet:学习高分辨率的深度3D表示,(IEEE计算机视觉和模式识别会议论文集(2017)),3577-3586
[40] Roveri,R。;拉赫曼,L。;Oztireli,C。;Gross,M.,通过自动深度图像生成进行点云分类的网络架构,(IEEE计算机视觉和模式识别会议论文集(2018)),4176-4184
[41] 施纳贝尔,R。;瓦尔·R。;Klein,R.,《点云形状检测的高效传输》(Computer Graphics Forum(2007),威利在线图书馆),214-226
[42] 塞德尔,T。;Kriegel,H.P.,最优多步k-最近邻搜索,(ACM Sigmod Record(1998),ACM),154-165
[43] Selvaraju,R.R。;Cogswell,M。;Das,A。;韦丹坦,R。;Parikh,D。;Batra,D.,Grad-cam:通过基于梯度的本地化从深层网络中进行可视化解释,(2017年IEEE国际计算机视觉会议(2017)),618-626
[44] Sfikas,K。;Pratikakis,I。;Theoharis,T.,基于PANORAMA的卷积神经网络集成,用于3D模型分类和检索,计算。图表。(2017)
[45] 索彻,R。;Huval,B。;Bhat,B。;曼宁,C.D。;Ng,A.Y.,《三维物体分类的卷积递归深度学习》(第25届神经信息处理系统国际会议论文集,第1卷)。第25届神经信息处理系统国际会议论文集,第1卷,美国(2012),656-664
[46] Song,S。;Xiao,J.,RGB-D图像中非对称3D物体检测的深滑动形状,(IEEE计算机视觉和模式识别会议论文集(2016)),808-816
[47] 苏,H。;马吉,S。;Kalogerakis,E。;Learnd-Miller,E.,用于3D形状识别的多视图卷积神经网络,(IEEE计算机视觉国际会议论文集(2015)),945-953
[48] Tangelder,J.W。;Veltkamp,R.C.,基于内容的3D形状检索方法综述,(形状建模应用,2004。论文集(2004),IEEE),145-156
[49] 塔塔琴科,M。;Dosovitskiy,A。;Brox,T.,《八叉树生成网络:高分辨率3D输出的高效卷积结构》(IEEE国际计算机视觉会议论文集(2017)),2088-2096
[50] 汤巴里,F。;Salti,S。;Di Stefano,L.,用于增强3D特征匹配的组合纹理形状描述符,(第18届IEEE图像处理国际会议,2011(2011),IEEE),809-812
[51] Veltkamp,R.C.,形状匹配:相似性度量和算法,(SMI 2001形状建模和应用国际会议(2001),IEEE),188-197
[52] 王,C。;Samari,B。;Siddiqi,K.,用于点集特征学习的局部谱图卷积,(欧洲计算机视觉会议论文集(ECCV)(2018)),52-66
[53] Wang,F。;Decker,J。;吴,X。;Essertel,G.公司。;Rompf,T.,《带回调的反向传播:高效表达的可微编程的基础》,高级神经信息处理。系统。,31, 10180-10191 (2018)
[54] 王,P.S。;刘,Y。;郭永新。;Sun,C.Y。;Tong,X.,O-CNN:用于3D形状分析的基于八叉树的卷积神经网络,ACM Trans。图表。,36(2017)
[55] 吴杰。;张,C。;薛,T。;弗里曼,W.T。;Tenenbaum,J.B.,《通过3D生成-逆向建模学习物体形状的概率潜在空间》,(第30届神经信息处理系统国际会议论文集。第30届国际神经信息处理会议论文集,美国(2016)),82-90
[56] Wu,Z。;Song,S。;科斯拉,A。;Yu,F。;张,L。;唐,X。;Xiao,J.,3D ShapeNets:立体形状的深度表示,(IEEE计算机视觉和模式识别会议论文集(2015)),1912-1920
[57] 肖永平。;Lai,Y.K。;Zhang,F.L。;Li,C。;Gao,L.,《深度几何学习综述:从表征的角度》,Comput。视觉。媒体,6113-133(2020)
[58] Xu,X。;Todorovic,S.,Beam search for learning a deep convolutional neural network of 3D shapes,(2016年第23届国际模式识别会议(ICPR)(2016)),3506-3511
[59] Young,G。;Krishnamurthy,A.,GPU加速生成和渲染实体模型的多级体素表示,计算。图表。,75、11-24(2018年10月)
[60] 医学博士泽勒。;Fergus,R.,《可视化和理解卷积网络》(Fleet,D.;Pajdla,T.;Schiele,B.;Tuytelaars,T.,《计算机视觉-ECCV 2014》(2014),Springer International Publishing:Springer国际出版公司Cham),818-833
[61] 张,Q。;曹,R。;Wu,Y.N。;Zhu,S.,通过主动问答从CNN中挖掘对象部分,(IEEE计算机视觉和模式识别会议论文集(2017)),3890-3899
[62] 张,Q。;Wang,W。;Zhu,S.C.,《检查CNN对数据集偏差的表述》(《AAAI人工智能会议论文集(2018)》),4464-4473
[63] 张,Q.s。;朱,S.c.,《深度学习的视觉可解释性:一项调查》,Front。技术信息。电子。工程师,19,27-39(2018)
[64] 志,S。;刘,Y。;李,X。;Guo,Y.,《朝向实时3D物体识别:使用多任务学习的轻量级体积CNN框架》,计算。图表。,71, 199-207 (2018)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。