×

利用RGB图像学习耦合分类器进行RGB-D目标识别。 (英语) Zbl 1428.68311号

摘要:深度图像的出现为解决具有挑战性的目标识别任务开辟了一个新的维度。然而,当只有少量标记数据可用时,我们无法直接使用RGB-D图像学习有区别的分类器。为了解决这个问题,我们提出了一种新的RGB-D对象识别方法——学习RGB图像耦合分类器(LCCRRD)。我们使用源域RGB图像、目标域RGB和深度图像以及目标域RGG图像学习耦合分类器。两个目标分类器的预测结果相似,以使其更准确。我们还利用源和目标RGB图像之间的相关性来增强相关特征并消除不相关的特征。它还可以将流形结构纳入我们的模型。此外,还提出了一个统一的目标函数来学习分类器参数。为了评估我们的LCCRRD方法,我们将其应用于五个跨域数据集。实验结果表明,在目标识别任务中,我们的方法可以实现与现有方法相竞争的性能。

MSC公司:

68T45型 机器视觉和场景理解
68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[3] 乐村,Y。;Y.本吉奥。;Hinton,G.,《深度学习》,《自然》,521,7553,436-444(2015)
[5] 刘,A.-A。;聂文忠。;Su,Y.-T。;马,L。;郝,T。;Yang,Z.-X.,用于rgb-d人体动作识别的耦合隐条件随机场,信号处理。,112, 74-82 (2015)
[9] 雷东多·卡布雷拉,C。;López-Sastre,R.J。;Acevedo-Rodríguez,J。;Maldonado-Bascon,S.,在深度选择性三维空间金字塔匹配内核中识别物体和场景分类,图像视觉。计算。,32, 12, 965-978 (2014)
[12] 李,X。;方,M。;Wang,H。;张,J.-。图像分类的监督传输核稀疏编码,模式识别。莱特。,68, 27-33 (2015)
[15] 帕特尔,V.M。;戈帕兰,R。;Li,R。;Chellappa,R.,《可视域自适应最新进展概览》,IEEE信号处理。Mag.,32,3,53-69(2015)
[18] 潘,S.J。;Tsang,I.W。;郭敬通(Kwok,J.T.)。;Yang,Q.,通过传输组件分析进行域自适应,IEEE Trans。神经网络。,22, 2, 199-210 (2011)
[20] Cheng,L。;Pan,S.J.,流形上的半监督域自适应,IEEE Trans。神经网络。学习。系统。,25, 12, 2240-2249 (2014)
[27] Fung,G.M。;Mangasarian,O.L.,多类别近端支持向量机分类器,马赫。学习。,59, 1-2, 77-97 (2005) ·Zbl 1469.68083号
[32] 肖,M。;Guo,Y.,通过内核匹配的特征空间独立半监督域自适应,IEEE Trans。模式分析。马赫。智力。,37, 1, 54-66 (2015)
[37] 沃尔德,S。;埃斯本森,K。;Geladi,P.,主成分分析,化学。智力。实验室系统。,2, 1, 37-52 (1987)
[38] 风扇,R.-。E.公司。;Chang,K.-。W。;谢长廷。J。;王,X.-。R。;林,C.-。J.,Liblineara大型线性分类库,J.Mach。学习。1871-1874年第9号决议(2008年)·Zbl 1225.68175号
[39] 李伟(Li,W.)。;段,L。;徐,D。;Tsang,I.W.,《监督和半监督异构域自适应的增强特征学习》,模式IEEE Trans。分析。马赫。智力。,36, 6, 1134-1148 (2014)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。