×

关于通过张量多秩最小化来统一聚类的多视图自表示。 (英语) 兹比尔1458.68257

摘要:在本文中,我们解决了多视图子空间聚类问题。我们的方法利用张量的循环代数来捕获低秩张量子空间,从而实现对特定视图子空间的细化,以及可以探索多视图数据背后的高阶相关性。通过引入最近提出的张量分解,即张量奇异值分解(t-SVD)[M.E.基尔默等,SIAM J.矩阵分析。申请。34,第1期,148-172页(2013年;Zbl 1269.65044号)], 我们可以对旋转张量施加一种新型的低阶张量约束,以确保多个视图之间的一致性。与传统的基于展开的张量范数不同,这种低秩张量约束具有类似于SVD导出的矩阵秩的最优性,因此可以更深入有效地探索互补信息并在所有视图之间传播。所建立的模型称为基于t-SVD的多视子空间聚类(t-SVD-MSC),属于增广拉格朗日方法的适用范围,其最小化问题可以在理论收敛保证和相对较低的计算复杂度下得到有效解决。在八个具有挑战性的图像数据集上进行的大量实验测试表明,与几种最先进的多视图聚类方法相比,该方法取得了很好的客观性能。

MSC公司:

68T45型 机器视觉和场景理解
15A69号 多线性代数,张量演算
2015财年65 矩阵特征值和特征向量的数值计算
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bickel,S.和Scheffer,T.(2004)。多视图聚类。摘自IEEE数据挖掘国际会议论文集(第19-26页)。
[2] Blaschko,M.B.和Lampert,C.H.(2008)。相关光谱聚类。《IEEE计算机视觉和模式识别学报》(第1-8页)。
[3] Bosch,A.、Zisserman,A.和Munoz,X.(2007)使用随机森林和蕨类植物进行图像分类。IEEE计算机视觉国际会议论文集。
[4] Cai,J.、Candes,E.和Shen,Z.(2010年)。矩阵补全的奇异值阈值算法。SIAM优化期刊,20(4),1956-1982·Zbl 1201.90155号 ·doi:10.1137/080738970
[5] Cai,D.、He,X.和Han,J.(2005)。使用局部保持索引进行文档聚类。IEEE知识与数据工程汇刊,17(12),1624-1637·doi:10.1109/TKDE.2005.198
[6] Cao,X.、Zhang,C.、Fu,H.、Liu,S.和Zhang,H.(2015)。多样性诱导的多视图子空间聚类。在IEEE计算机视觉和模式识别论文集。
[7] Cao,X.、Zhang,C.、Zhou,C.、Fu,H.和Foroosh,H.(2015)。约束多视图视频人脸聚类。IEEE图像处理汇刊,24(11),4381-4393·Zbl 1408.94068号 ·doi:10.1109/TIP.2015.2463223
[8] Chaudhuri,K.、Kakade,S.M.、Livescu,K.和Sridharan,K.(2009年)。基于典型相关分析的多视图聚类。机器学习国际会议论文集(第129-136页)。
[9] Christopher,M.、Raghavan,D.P.和Schtze,H.(2008)。信息检索导论(第一卷)。剑桥:剑桥大学出版社·Zbl 1160.68008号
[10] de Sa,V.R.(2005)。具有两个视图的光谱聚类。机器学习国际会议论文集。
[11] Deng,J.,Dong,W.,Socher,R.,Li,L.J.,Li.,K.,&Fei-Fei,L.(2009)。ImageNet:大型分层图像数据库。《IEEE计算机视觉和模式识别学报》。
[12] Eckstein,J.和Bertsekas,D.(1992年)。关于最大单调算子的Douglas-Rachford分裂方法和最近点算法。数学规划,55293-318·兹比尔0765.90073 ·doi:10.1007/BF01581204
[13] Elhamifar,E.和Vidal,R.(2013)。稀疏子空间聚类:算法、理论和应用。IEEE模式分析和机器智能汇刊,35(11),2765-2781·doi:10.1109/TPAMI.2013.57
[14] Fei-Fei,L.和Perona,P.(2005)。用于学习自然场景类别的贝叶斯层次模型。《IEEE计算机视觉和模式识别学报》(第524-531页)。
[15] Fei-Fei,L.、Fergus,R.和Perona,P.(2007)。从很少的训练示例中学习生成性视觉模型:一种增量贝叶斯方法在101个对象类别上进行了测试。计算机视觉和图像理解,106(1),59-70·doi:10.1016/j.cviu.2005.09.012
[16] Gao,H.、Nie,F.、Li,X.和Huang,H.(2015)。多视点子空间聚类。IEEE计算机视觉国际会议论文集。
[17] Gui,L.和Morency,L.P.(2015)。使用群稀疏因子分解学习和转移深度ConvNet表示。IEEE计算机视觉研讨会国际会议论文集。
[18] Kernfeld,E.、Aeron,S.和Kilmer,M.(2014)。聚类多路数据:一种新的代数方法。arXiv预印本,arXiv:1412.7056。
[19] Kilmer,M.、Braman,K.、Hao,N.和Hoover,R.(2013)。三阶张量作为矩阵上的算子:一个在成像中应用的理论和计算框架。SIAM矩阵分析与应用杂志,34(1),148-172·Zbl 1269.65044号 ·数字对象标识代码:10.1137/10837711
[20] Kilmer,M.E.和Martin,C.D.(2011年)。三阶张量的因式分解策略。线性代数及其应用,435(3),641-658·Zbl 1228.15009号 ·doi:10.1016/j.laa.2010.09.020
[21] Kolda,T.和Bader,B.(2009年)。张量分解及其应用。SIAM评论,51(3),455-500·Zbl 1173.65029号 ·doi:10.1137/07070111X
[22] Kumar,A.和Daumé,H.(2011年)。多视图谱聚类的联合训练方法。机器学习国际会议论文集。
[23] Kumar,A.,Rai,P.,&Daumé,H.(2011)《神经信息处理系统学报》。
[24] Lades,M.、Vorbuggen,J.C.、Buhmann,J.、Lange,J.,von der Malsburg,C.、Wurtz,R.P.等人(1993年)。动态链路结构中的畸变不变目标识别。IEEE计算机汇刊,42(3),300-311·doi:10.1109/12.10173
[25] Lawrence,H.和Phipps,A.(1985)。比较分区。分类杂志,2(1),193-218·Zbl 0587.62128号 ·doi:10.1007/BF01908075
[26] Lazebnik,S.、Schmid,C.和Ponce,J.(2006)。除了一袋袋的特征:用于识别自然场景类别的空间金字塔匹配。IEEE计算机视觉和模式识别(第2169-2178页)。
[27] Lin,Z.、Chen,M.和Ma,Y.(2009)。精确恢复受损低秩矩阵的增广拉格朗日乘子方法。技术报告UILU-ENG-09-2215,UIUC。
[28] Lin,Z.,Liu,R.,&Su,Z..(2011年)。低阶表示的自适应惩罚线性化交替方向方法。《神经信息处理系统学报》(第612-620页)。
[29] Lin,T.、Ma,S.和Zhang,S.(2016)。无强凸性凸极小化族的多块ADMM迭代复杂性分析。科学计算杂志,69(1),52-81·Zbl 1348.90522号 ·doi:10.1007/s10915-016-0182-0
[30] Liu,G.、Lin,Z.、Yan,S.、Sun,J.、Yu,Y.和Ma,Y.(2013)。基于低秩表示的子空间结构鲁棒恢复。IEEE模式分析和机器智能汇刊,35(1),171-184·doi:10.1109/TPAMI.2012.88
[31] Liu,J.、Musialski,P.、Wonka,P.和Ye,J.(2013)。张量完成,用于估计视觉数据中的缺失值。IEEE模式分析和机器智能汇刊,35(1),208-220·doi:10.1109/TPAMI.2012.39
[32] Lu,C.,Feng,J.,Chen,Y.,Liu,W.,&Lin,Z.(2016)。张量稳健主成分分析:通过凸优化精确恢复损坏的低阶张量。《IEEE计算机视觉和模式识别学报》。
[33] Luo,Y.、Tao,D.、Ramamohanarao,K.、Xu,C.和Wen,Y.(2015)。多视图降维的张量典型相关分析。IEEE知识与数据工程汇刊,27(11),3111-3124·doi:10.1109/TKDE.2015.2445757
[34] Lu,C.,Yan,S.,&Lin,Z.(2016)。凸稀疏谱聚类:从单视图到多视图。IEEE图像处理汇刊,25(6),2833-2843·兹比尔1408.94438 ·doi:10.1109/TIP.2016.2553459
[35] Ng,A.、Jordan,M.和Weiss,Y.(2001年)。关于谱聚类:分析和算法。《神经信息处理系统学报》。
[36] Ojala,T.、Pietikainen,M.和Maenpaa,T.(2002)。具有局部二值模式的多分辨率灰度和旋转不变纹理分类。IEEE模式识别和机器智能汇刊,24(7),971-987·Zbl 0977.68853号 ·doi:10.1109/TPAMI.2002.1017623
[37] Oliva,A.和Torralba,A.(2001)。场景形状建模:空间包络线的整体表示。国际计算机视觉杂志,42,145-175·Zbl 0990.68601号 ·doi:10.1023/A:101139631724
[38] Piao,X.、Hu,Y.、Gao,J.、Sun,Y.,Lin,Z.和Yin,B.(2016)。基于张量稀疏和低秩的多径数据子模块聚类方法。arXiv预打印,arXiv:1601.00149。
[39] Qi,X.,Xiao,R.,Li,C.,Qiao,Y.,Guo,J.,&Tang,X.(2014)。两两旋转不变共生局部二进制模式。IEEE模式识别和机器智能汇刊,36(11),2199-2213·doi:10.1109/TPAMI.2014.2316826
[40] Quattoni,A.和Torralba,A.(2009年)。识别室内场景。《IEEE计算机视觉和模式识别学报》(第413-420页)。
[41] Semerci,O.、Hao,Ning、Kilmer,M.和Miller,E.(2014)。多能量CT的基于张量的公式和核范数正则化。IEEE图像处理汇刊,23(4),1678-1693·Zbl 1374.94335号 ·doi:10.1109/TIP.2014.2305840
[42] Shu,L.和Latecki,L.J.(2015)。单视图图与张量积图扩散的集成用于多视图谱聚类。亚洲机器学习会议论文集。
[43] Simonyan,K.和Zisserman,A.(2014)。用于大规模图像识别的深度卷积网络。在学习表征国际会议的会议记录中。
[44] Szegedy,C.、Vanhoucke,V.、Ioffe,S.、Shlens,J.和Wojna,Z.(2015)。重新思考计算机视觉的初始架构。arXiv预打印,arXiv:1512.00567。
[45] Tang,W.,Lu,Z.,&Dhillon,I.S.(2009)多图聚类。IEEE数据挖掘国际会议论文集。
[46] Tzortzis,G.,&Likas,A.(2012),基于内核的加权多视图聚类。《IEEE数据挖掘国际会议论文集》(第675-684页)。
[47] Vedaldi,A.和Fulkerson,B.(2008年)。VLFeat:一个开放的、可移植的计算机视觉算法库。http://www.vlfeat.org/。
[48] Vedaldi,A.和Lenc,K.(2015)。Matconvnet-卷积神经网络用于matlab。http://www.vlfeat.org/matconvnet/。
[49] Wang,W.、Arora,R.、Livescu,K.和Bilmes,J.(2015)。关于深度多视角表征学习。机器学习国际会议论文集。
[50] White,M.、Zhang,X.、Schuurmans,D.和Yu,Y.I.(2012年)。凸多视点子空间学习。《神经信息处理系统学报》。
[51] Wu,J.和Rehg,J.M.(2011)。Centrist:用于场景分类的视觉描述符。IEEE模式分析和机器智能汇刊,33(8),1489-1501。
[52] Xia,R.,Pan,Y.,Du,L.,&Yin,J.(2014)通过低秩和稀疏分解的稳健多视图光谱聚类。在人工智能AAAI会议记录中。
[53] Xu,C.、Tao,D.和Xu,C(2013)。多视角学习调查。arXiv预打印,arXiv:1304.5634。
[54] Xu,C.、Tao,D.和Xu,C(2014)。大容量多视图信息瓶颈。IEEE模式分析和机器智能汇刊,36(8),1559-1572·doi:10.1109/TPAMI.2013.2296528
[55] Xu,C.、Tao,D.和Xu,C(2015)。多视图完整空间学习。IEEE模式分析和机器智能汇刊,37(12),2531-2544·doi:10.10109/TPAMI.2015.2417578文件
[56] Zhang,Ely,G.,Aeron,S.,Hao,N.,&Kilmer,M.(2014)。基于张量SVD的多线性数据补全和去噪新方法。《IEEE计算机视觉和模式识别学报》。
[57] Zhang,C.,Fu,H.,Liu,S.,Liw,G.,&Cao,X.(2015)。低秩张量约束多视点子空间聚类。《IEEE计算机视觉国际会议论文集》(第2439-2446页)。
[58] Zhang,Y.,Xu,C.,Lu,H.,&Huang,Y.M.(2009)。使用全局人脸名称匹配的特征长度电影中的角色识别。IEEE多媒体汇刊,11(7),1276-1288·doi:10.1109/TMM.2009.2030629
[59] Zhou,D.,&Burges,C.(2007)多视角的谱聚类和转导学习。机器学习国际会议论文集。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。