×

动态张量聚类。 (英语) 兹比尔1428.62260

摘要:动态张量数据在许多应用中越来越普遍。现有的张量聚类方法要么不能考虑数据的动态性质,要么不适用于一般阶张量。现有张量聚类解的统计保证和计算效率之间也存在差距。在本文中,我们提出了一种新的动态张量聚类方法,该方法适用于一般阶动态张量,具有较强的统计保证和较高的计算效率。我们的建议基于一种新的结构张量因式分解,它鼓励沿着指定张量模式的参数具有稀疏性和平滑性。在计算上,我们开发了一种高效的优化算法,该算法得益于大量的降维。理论上,我们首先从结构张量因式分解中为估计量建立了一个非共振误差界。在此误差界的基础上,我们导出了估计簇中心的收敛速度,并证明了估计簇以很高的概率恢复了真实的簇结构。此外,我们提出的方法可以自然地扩展到张量数据的多模式联合聚类。通过一项自闭症谱系障碍研究的模拟和大脑动态功能连接分析,我们的方法的有效性得到了证明。对于本文,可以在线获取。

MSC公司:

62H25个 因子分析和主成分;对应分析
90C26型 非凸规划,全局优化
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 安,M。;沈,H。;Lin,W。;Zhu,H.,“功能神经成像数据分组分析的稀疏降秩框架”,《中国统计》,25,295-312(2015)·Zbl 1480.62120号 ·doi:10.5705/ss.2013.215w
[2] 艾伦,E.A。;Damaraju,E。;Plis,S.M。;Erhardt,E.B。;Eichele,T。;Calhoun,V.D.,“在静息状态下跟踪全脑连接动力学”,《大脑皮层》,24,663-676(2014)·doi:10.1093/cercor/bhs352
[3] Anandkumar,A。;Ge,R。;徐,D。;Kakade,S.M.,“学习混合成员社区模型的张量方法”,《机器学习研究杂志》,第15期,第2239-2312页(2014年)·Zbl 1318.68136号
[4] Anandkumar,A。;Ge,R。;Janzamin,M.,“通过交替秩1更新保证的非正交张量分解”,arXiv预印本arXiv:1402.5180(2014)
[5] Bi,X。;曲,A。;Shen,X.,“多层张量因子分解及其在推荐系统中的应用”,《统计年鉴》,46,3308-3333(2018)·兹比尔1454.62511 ·doi:10.1214/17-AOS1659
[6] 布鲁斯,N。;穆尔蒂,B。;Rao,R.C.,“数字广告的动态模型:创意形式、信息内容和目标对参与的影响”,《营销研究杂志》,54,202-218(2017)·doi:10.1509/jmr.14.0117
[7] 卡尔霍恩,V。;阿达利,T。;佩卡尔,J。;Pearlson,G.,“时间-频率域fMRI数据的潜伏期(in)敏感ICA组独立分量分析”,《神经影像》,第20期,1661-1669页(2003年)·doi:10.1016/S1053-8119(03)00411-7
[8] 曹,X。;魏,X。;韩,Y。;Yang,Y。;Lin,D.,带非自由最大化的稳健张量聚类(2013)
[9] Chi,E.C。;Allen,G.I.,“凸双聚类”,《生物统计学》,73,10-19(2017)·Zbl 1366.62208号 ·doi:10.1111/biom.12540
[10] Chi,E.C。;Lange,K.,“凸聚类的分裂方法”,《计算与图形统计杂志》,994-1013(2015)·doi:10.1080/10618600.2014.948181
[11] Di Martino,A。;Yan,C.-G。;李强。;Denio,E。;卡斯特拉诺斯,F.X。;Alaerts,K。;安德森,J.S。;阿萨夫,M。;布克海默,S.Y。;Dapretto,M。;迪恩,B。;德尔蒙特,S。;丁斯坦,I。;Ertl-Wagner,B。;费尔,D.A。;加拉赫,L。;肯尼迪,D.P。;Keown,C.L。;Keysers,C。;莱恩哈特,J.E。;Lord,C。;Luna,B。;梅农,V。;新泽西州明休。;Monk,C.S。;穆勒,S。;R.-A.穆勒。;Nebel,M.B。;Nigg,J.T。;O'Hearn,K。;Pelphrey,K.A。;帕尔蒂埃,S.J。;鲁迪,J.D。;Sunaert,S。;Thioux,M。;Tyszka,J.M。;乌丁·L·Q。;Verhoeven,J.S。;温德罗斯,N。;威金斯,J.L。;Mostofsky,S.H。;Milham,M.P.,“自闭症脑成像数据交换:自闭症内在脑结构的大规模评估”,《分子精神病学》,第19期,第659-667页(2014年)·doi:10.1038/mp.2013.78
[12] 丁·S。;库克,R.D.,“张量切片逆回归”,《多元分析杂志》,133216-231(2015)·Zbl 1302.62127号 ·doi:10.1016/j.jmva.2014.08.015
[13] 邓拉维,D。;科尔达,T。;Acar,E.,“使用矩阵和张量因子分解进行时间链接预测”,《ACM从数据中发现知识的汇刊》,5,1-27(2011)·数字对象标识代码:10.1145/1921632.1921636
[14] Fornito,A。;Zalesky,A。;Breakspear,M.,“人类连接体的图形分析:承诺、进展和陷阱”,《神经影像》,80,426-444(2013)·doi:10.1016/j.neuroimage.2013.04.087
[15] 哥茨,S。;西蒙斯,W。;Milbury,L。;华莱士,G。;考克斯·R。;Martin,A.,“自闭症谱系障碍中社交脑回路的分馏”,《大脑》,135,2711-2725(2012)·doi:10.1093/brain/aws160
[16] 郝,B。;Sun,W.W。;刘,Y。;Cheng,G.,“异构图形模型的同时聚类和估计”,《机器学习研究杂志》,18,1-58(2018)·Zbl 1473.62220号
[17] Hartigan,J.A。;Wong,M.A.,“算法作为136:k均值聚类算法”,《皇家统计学会杂志》,C辑,28,100-108(1979)·Zbl 0447.62062号 ·doi:10.2307/2346830
[18] 霍金,T。;垂直,J.-P。;巴赫,F。;Joulin,A.,Clusterpath:一种使用凸融合惩罚的聚类算法(2011)
[19] 黄,J。;沈,H。;Buja,A.,“使用双向正则奇异值分解分析双向函数数据”,《美国统计协会杂志》,1041609-1620(2009)·Zbl 1205.62072号 ·doi:10.198/jasa.2009.tm08024
[20] Hutchison,R.M。;沃梅尔斯多夫,T。;艾伦,E.A。;Bandettini,P.A。;卡尔霍恩,V.D。;科贝塔,M。;佩纳,S.D。;Duyn,J.H。;手套,G.H。;Gonzalez-Castillo,J。;Handwerker,D.A。;Keilholz,S。;Kiviniemi,V。;利奥波德,D.A。;de Pasquale,F。;孢子,O。;Walter,M。;Chang,C.,“动态功能连接:承诺、问题和解释”,《神经影像》(2013)·doi:10.1016/j.neuroimage.2013.05.079
[21] Jenatton,R。;Obozinski,G。;巴赫,F.,《结构化稀疏主成分分析》,国际人工智能与统计会议(2010年)
[22] 季S。;张伟。;Liu,J.,进化协同聚类的稀疏诱导公式,知识发现和数据挖掘国际会议(2012),中国北京
[23] 科尔达,T。;Bader,B.,“张量分解与应用”,SIAM Review,51455-500(2009)·Zbl 1173.65029号 ·doi:10.1137/07070111X
[24] 列别捷夫,V。;Ganin,Y。;拉库巴,M。;Oseledets,I。;Lempitsky,V.,使用微调cp-Decomposition加速卷积神经网络,国际学习代表大会(2015)
[25] 李,M。;沈,H。;黄J.Z。;Marron,J.S.,“通过稀疏奇异值分解进行双聚类”,《生物计量学》,661087-1095(2010)·Zbl 1233.62182号 ·文件编号:10.1111/j.1541-0420.2010.01392.x
[26] 李,R。;张伟。;Zhao,Y。;朱,Z。;Ji,S.,“挖掘时变数据的稀疏学习公式”,IEEE知识与数据工程汇刊,271411-1423(2015)·doi:10.1109/TKDE.2014.2373411
[27] 刘,J。;穆西亚尔斯基,P。;旺卡,P。;Ye,J.,“估计视觉数据中缺失值的张量补全”,IEEE模式分析和机器智能汇刊,35,208-220(2013)·doi:10.1109/TPAMI.2012.39
[28] 刘,T。;袁,M。;Zhao,H.,“通过低阶张量分解表征人脑时空转录组”,arXiv预印本arXiv:1702.07449(2017)
[29] 马,P。;Zhong,W.,“多协变量大规模函数数据的惩罚聚类”,美国统计协会杂志,103,625-636(2008)·Zbl 1469.62288号 ·doi:10.1198/0162145000000247
[30] Madrid-Padilla,O.-H。;Scott,J.G.,“广义拉索罚函数的张量分解”,《计算与图形统计杂志》,26,537-546(2017)·doi:10.1080/101816600.2016.1255638
[31] 罗梅拉·佩雷斯,B。;庞蒂尔,M。;伯吉斯,C.J.C。;博图,L。;威灵,M。;加赫拉马尼,Z。;Weinberger,K.Q.,《神经信息处理系统的进展》,“张量完成的新凸松弛(2013),内华达州塔霍湖:NIPS基金会,内华达州塔霍湖区
[32] Rudie,J。;Brown,J。;贝克-癌症博士。;埃尔南德斯,L。;丹尼斯,E。;汤普森,P。;布克海默,S。;Dapretto,M.,“自闭症患者功能和结构脑网络组织的改变”,《神经影像:临床》,279-94(2013)·doi:10.1016/j.nicl.2012.11.006
[33] Seigal,A。;Beguerisse-Diaz,M。;斯科贝尔,B。;尼佩尔,M。;Harrington,H.A.,“张量和代数为乳腺癌中的串扰机制提供了可解释的组”,arXiv预印本arXiv:1612.08116(2016)
[34] 沈,X。;黄,H。;Pan,W.,“图上的同时监督聚类和特征选择”,《生物特征》,99,899-914(2012)·Zbl 1452.62467号 ·doi:10.1093/biomet/ass038
[35] 沈,X。;潘·W。;Zhu,Y.,“基于似然的选择和尖锐参数估计”,《美国统计协会杂志》,107223-232(2012)·Zbl 1261.62020年 ·doi:10.1080/01621459.2011.645783
[36] 所罗门,M。;奥佐诺夫,S。;乌苏,S。;拉维扎,S。;卡明斯,N。;Ly,S。;Carter,C.,“自闭症谱系障碍中认知控制缺陷的神经基质”,《神经心理学》,472515-2526(2009)·doi:10.1016/j.neurophychologia.2009.04.019
[37] Sun,W。;卢,J。;刘,H。;Cheng,G.,“可证明稀疏张量分解”,《皇家统计学会杂志》,B辑,79,899-916(2017)·Zbl 1411.62158号 ·doi:10.1111/rssb.12190
[38] Sun,W。;Wang,J。;Fang,Y.,“高维数据的正则k-means聚类及其渐近一致性”,《电子统计杂志》,6,148-167(2012)·Zbl 1335.62109号 ·doi:10.1214/12-EJS668
[39] Tibshirani,R。;桑德斯,M。;Rosset,S。;朱,J。;K.奈特(K.K.Knight),“通过融合套索的稀疏与平滑”,《皇家统计学会杂志》,B辑,67,91-108(2005)·兹比尔1060.62049 ·doi:10.1111/j.1467-9868.2005.00490.x
[40] Tibshirani,R。;Walther,G。;Hastie,T.,“通过缺口统计估算数据集中的簇数”,《皇家统计学会期刊》,B辑,63,411-423(2001)·Zbl 0979.62046号 ·数字对象标识代码:10.1111/1467-9868.00293
[41] Tibshirani,R.J。;Taylor,J.,“广义拉索解的路径”,《统计学年鉴》,第39期,第1335-1371页(2011年)·Zbl 1234.62107号 ·doi:10.1214/11-AOS878
[42] Wang,J.,“通过交叉验证一致选择簇数”,《生物特征》,97893-904(2010)·Zbl 1204.62104号 ·doi:10.1093/biomet/asq061
[43] Wang,J.,“稀疏多元回归和条件图形模型的联合估计”,《统计学》,25831-851(2015)·Zbl 1415.62051号
[44] Wang,J。;Fang,Y.,“通过半监督学习方法分析仅存在数据”,计算统计与数据分析,59,134-143(2013)·Zbl 1400.62137号 ·doi:10.1016/j.csda.2012.10.007
[45] Wang,Y。;Xu,H。;冷,C。;Burges,C.J.C。;博图,L。;韦林,M。;加赫拉马尼,Z。;Weinberger,K.Q.,《神经信息处理系统的进展》,“可证明子空间聚类:当LRR满足SSC(2013),内华达州塔霍湖:NIPS基金会,内华达州塔霍湖区
[46] Wu,T。;A.R.本森。;Gleich,D.F。;Lee,D.D。;杉山,M。;乌克兰卢克斯堡。;盖恩,I。;Garnett,R.,《神经信息处理系统的进展》,“高阶数据的广义张量谱协同聚类(2016),西班牙巴塞罗那:NIPS基金会,西班牙巴塞罗那
[47] 袁,M。;Kendziorski,C.,“同步基因聚类和差异表达鉴定的统一方法”,《生物统计学》,621089-1098(2006)·Zbl 1114.62130号 ·文件编号:10.1111/j.1541-0420.2006.00611.x
[48] 袁,M。;Zhang,C.,“通过核范数最小化实现张量完备”,《计算数学基础》,16,1031-1068(2016)·Zbl 1378.90066号 ·doi:10.1007/s10208-015-9269-5
[49] 袁,M。;Zhang,C.,“非相干张量范数及其在高阶张量完备中的应用,IEEE信息理论汇刊,63,6753-6766(2017)·Zbl 1391.94469号
[50] Zhang,A.,“交叉:有效的低秩张量完成”,《统计年鉴》,47936-964(2018)·Zbl 1416.62298号 ·doi:10.1214/18-AOS1694
[51] 周,H。;李,L。;Zhu,H.,“张量回归在神经影像数据分析中的应用”,美国统计协会杂志,108,540-552(2013)·Zbl 06195959号 ·doi:10.1080/01621459.2013.776499
[52] 朱,H。;张,H。;易卜拉欣,J。;Peterson,B.,“扩散加权磁共振图像数据中扩散张量的统计分析”,《美国统计协会杂志》,1021081-1110(2007)
[53] Zhu,Y.,“应用于广义拉索问题的增强ADMM算法”,《计算与图形统计杂志》,26,195-204(2017)·doi:10.1080/106186002015.1144491
[54] Zhu,Y。;沈,X。;Pan,W.,“多无向图的结构追求”,美国统计协会杂志,1091683-1696(2014)·Zbl 1368.62181号 ·doi:10.1080/01621459.2014.921182
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。