×

室内环境中物体识别的镜像条件随机场模型。 (英语) Zbl 1483.68284号

摘要:传统的目标识别算法基于一个普遍采用的闭集假设,假设训练中给出的知识是完整的。然而,实际情况往往是开放的和非静态的,在这种情况下,模型只在训练阶段获得不完整的知识。本文提出了一种新的条件随机场(CRF)模型来解决一种特殊的不完全知识情况,在这种情况下,某些对象的视觉外观在训练和测试之间发生了显著变化,从而从红-绿-蓝深度(RGB-D)中提取了某些一元特征(单个对象的特征)图像不再可靠。在标准CRF模型的基础上,将镜像节点引入到体系结构中,构建了镜像条件随机场(Mirror-CRF)模型,该模型集成了两类对象节点:原始节点和镜像节点。镜像节点没有一元特征,只有成对特征,它们描述两个对象之间的关系,在外观变化的情况下,比一元特征更可靠。实验结果表明,Mirror-CRF模型减少了某些对象外观显著变化的影响,提高了在知识不完全的情况下的对象识别能力。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
68T45型 机器视觉和场景理解
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] I.Athanasiadis,P.Mousouliotis,L.Petrou,嵌入式系统对象检测中的迁移学习框架。CoRR,2018,abs/1811.04863。网址:http://arxiv.org/abs/1811.04863。arXiv:1811.04863。
[2] 博兹坎,I。;Oymak,Y。;Alemdar等。Z。;Kalkan,S.,场景中有什么(缺失或错误)?用于情境化场景建模的混合deep-boltzmann机器,(2018 IEEE机器人与自动化国际会议(ICRA)(2018)),1-6
[3] 陈,H。;郑毅。;Zhang,Y。;Sun,F。;黄毅,基于对象-对象支持语义关系的室内红-绿-蓝深度分割,控制理论应用。,36,579-588(2019),DOI:10.7641/CTA.2018.70825·Zbl 1438.68234号
[4] 陈,Y。;潘·D。;潘,Y。;刘,S。;顾,A。;Wang,M.,通过单目RGB-D图像了解室内场景,Inf.Sci。,320,361-371(2015),DOI:10.1016/j.ins.2015.03.023
[5] 丁·L。;李,H。;胡,C。;张伟。;Wang,S.,Alexnet面向对象分类的特征提取和多核学习,ISPRS-Int.Arch。照片。,遥感空间信息科学。,XLII-3,277-281(2018)
[6] 弗洛雷斯,C.F。;Gonzalez-Garcia,A。;van de Weijer,J。;Raducanu,B.,在训练数据稀少的领域中细粒度对象识别的显著性,模式识别。,94, 62-73 (2019)
[7] C.Geng,S.Huang,S.Chen,开放集识别的最新进展:一项调查。CoRR,2018年,abs/1811.08581。网址:http://arxiv.org/abs/1811.08581。arXiv:1811.08581。
[8] J.Hammersley,P.Clifford,有限图和格上的Markov域,1971。未发表的手稿
[9] He,K。;张,X。;Ren,S。;Sun,J.,图像识别的深度剩余学习,(IEEE计算机视觉和模式识别会议论文集(2016)),770-778
[10] Huynh,D。;Elhamifar,E.,通过密集的基于属性的注意力进行细粒度广义零快照学习,(IEEE/CVF计算机视觉和模式识别会议论文集(2020)),4483-4493
[11] Janoch,A。;卡拉耶夫,S。;贾毅。;Barron,J.T。;弗里茨,M。;Saenko,K。;Darrell,T.,《类别级三维对象数据集:使用kinect》,ICCV计算机视觉消费者深度相机研讨会(2011年)
[12] M.Kaboli,《迁移学习算法综述》。技术报告hal-01575126慕尼黑理工大学,2017年。网址:https://hal.archives-overtes.fr/hal-01575126。
[13] Kasaei,S.H.,《进一步认识:学习开放式3D对象识别的共享主题和特定类别词典》,(2019年IEEE/RSJ智能机器人和系统国际会议(2019)),5438-5443
[14] Khan,S.H。;本纳蒙,M。;Sohel,F。;托涅里,R。;Naseem,I.,《使用rgbd图像整合几何上下文以对室内场景进行语义标记》,国际计算机杂志。愿景,117,1-20(2016),网址:10.1007/s11263-015-0843-8·Zbl 1398.68584号
[15] J.D.Lafferty,A.McCallum,F.C.N.Pereira,条件随机场:分割和标记序列数据的概率模型,收录于:《第十八届机器学习国际会议论文集》,2001年,Morgan Kaufmann Publishers Inc.,美国加利福尼亚州旧金山,第282-289页。网址:http://dl.acm.org/citation.cfm?id=645530.655813。
[16] H.Ma,R.Xiong,Y.Wang,S.Kodagoda,L.Shi,《面向三维点云中的开放集语义标记:未知类的分析》,神经计算275(2018)1282-1294。网址:http://www.sciencedirect.com/science/article/pii/S0925231217315904。doi:10.1016/j.neucom.2017.09.071。
[17] P.R.Mendes-Junior,J.Wainer,A.Rocha,开放集识别的专用支持向量机。CoRR,2016年,abs/1606.03802。网址:http://arxiv.org/abs/1606.03802。arXiv:1606.03802。
[18] 欧,X。;Yan,P。;Zhang,Y。;Tu,B。;张,G。;吴杰。;Li,W.,复杂场景中通过resnet-18和编码器-解码器结构的运动目标检测方法,IEEE Access,7108152-108160(2019)
[19] Pham,T。;库马尔,V.B.G。;Do,T.-T。;卡内罗,G。;Reid,I.,开放集世界中的贝叶斯语义实例分割,(欧洲计算机视觉会议(ECCV)(2018)),3-18,URL:https://arxiv.org/abs/1806.00911。
[20] Pham,T.T。;Do,T。;Sünderhauf,N。;Reid,I.,Scenect:室内场景的联合几何和对象分割,(2018 IEEE机器人与自动化国际会议(ICRA)(2018)),1-9
[21] 卡西姆,H。;Verma,A。;Feinzimer,D.,大数据场所图像识别的压缩残差-vgg16 cnn模型,(2018年IEEE第八届计算与通信研讨会(CCWC)(2018年),IEEE),169-175
[22] 齐,X。;廖,R。;贾,J。;菲德勒,S。;Urtasun,R.,用于rgbd语义分割的三维图形神经网络,IEEE国际计算机视觉会议(ICCV)(2017)
[23] J.-R.Ruiz-Sarmiento,C.Galindo,J.Gonzalez-Jimenez,无向图形模型学习方法调查。应用于场景对象识别,国际期刊近似原因。83 (2017) 434-451. 网址:http://www.sciencedirect.com/science/article/pii/S0888613X16302043。doi:10.1016/j.ijar.2016.10.009·兹伯利1404.68116
[24] Ruiz-Sarmiento,J.R。;Günther,M。;加林多,C。;González-Jiménez,J。;Hertzberg,J.,移动机器人的在线基于上下文的对象识别,(2017 IEEE自主机器人系统和竞赛国际会议(ICARSC)(2017)),247-252
[25] N.Silberman,D.Hoiem,P.Kohli,R.Fergus,从rgbd图像中进行室内分割和支持推理,见:A.Fitzgibbon,S.Lazebnik,P.Perona,Y.Sato,C.Schmid(编辑),计算机视觉-ECCV 20122012,施普林格,柏林-海德堡,柏林,海德堡,第746-760页。DOI:10.1007/978-3-642-33715-4_54。
[26] K.Simonyan,A.Zisserman,《用于大规模图像识别的极深卷积网络》,2014年。arXiv预打印arXiv:1409.1556。
[27] Song,S。;Lichtenberg,S.P。;Xiao,J.,Sun rgb-d:一个rgb-d场景理解基准套件,IEEE计算机视觉和模式识别会议(CVPR)(2015)
[28] X.Song,S.Jiang,L.Herranz,C.Chen,学习场景识别的有效RGB-D表示,IEEE Trans。图像处理。28 (2019) 980-993. 网址:doi:10.1109/TIP.2018.2872629https://www.wikidata.org/entity/Q57066513。DOI:10.1109/TIP.2018.2872629·Zbl 1409.94557号
[29] Sünderhauf,N。;O.布鲁克。;谢尔,W。;哈德塞尔,R。;福克斯,D。;莱特纳,J。;Upcroft,B。;Abbeel,P。;伯加德,W。;米尔福德,M。;Corke,P.,《机器人深度学习的局限性和潜力》,国际机器人杂志。研究,37,405-420(2018),URL:10.1177/0278364918770733。arXiv:https://doi.org/10.1177/0278364918770733
[30] Wainwright,M.J。;Jordan,M.I.,《图形模型、指数族和变分推理》,Found。趋势马赫数。学习。,1,1-305(2008),URL:10.1561/220000001·Zbl 1193.62107号
[31] 魏毅。;潘,X。;秦,H。;欧阳,W。;Yan,J.,《量化模拟:朝向用于物体检测的极小cnn》,(欧洲计算机视觉会议(ECCV)(2018)论文集),267-283
[32] 吴振中,潘石屹,陈凤,龙国龙,张振中,俞敏洪,图神经网络综合综述。CoRR,2019年,abs/1901.00596。网址:http://arxiv.org/abs/1901.00596。arXiv:1901.00596。
[33] 西安,Y。;兰伯特,C.H。;Schiele,B。;Akata,Z.,《零次学习——对好的、坏的和丑陋的综合评估》,IEEE Trans。模式分析。机器。智力。,41, 2251-2265 (2018)
[34] 肖,J。;A.欧文斯。;Torralba,A.,Sun3d:使用sfm和对象标签重建的大空间数据库,IEEE国际计算机视觉会议(ICCV)(2013)
[35] 肖,L。;王,R。;戴,B。;方,Y。;刘,D。;Wu,T.,基于混合条件随机场的道路检测摄像融合,信息科学。,543-558 (2017)
[36] 张,H。;朗,Y。;杨伟(Yang,W.)。;Shao,L.,零快照学习的双重验证网络,信息科学。,470, 43-57 (2019)
[37] 张,L。;杨,J。;张,D.,用于跨域图像分类的基于域类一致性的转移学习,信息科学。,418, 242-257 (2017)
[38] 张,Z。;乔·S。;谢,C。;沈伟(Shen,W.)。;王,B。;Yuille,A.L.,《具有丰富语义的单快照对象检测》(IEEE计算机视觉和模式识别会议论文集(2018)),5813-5821
[39] 科尔特斯,C。;Vapnik,V.,Support-Vector Networks,(机器学习,20(1995),Kluwer/Springer:Kluwer-Springer USA),273-297·Zbl 0831.68098号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。