×

基于正则多元分解和分层因式分解的张量数据多尺度联合聚类。 (英语) Zbl 1453.62555号

摘要:张量数据的分析在许多应用中都是必要的。与矩阵数据的双聚类类似,多尺度联合聚类可以同时提取沿张量的全部或部分模式的相干模式。然而,联合聚类的数值方法尚未达到双聚类的成熟程度。本文提出了一种基于张量和矩阵分解的多维数据联合聚类的理论框架。根据所提出的原理,我们首先开发了一种在分层分解(FRSF)上具有满秩约束的张量正则分解的替代算法。由于最小二乘原理和多维数据分辨率中固有的约束,FRSF提供了一种自然的方法来避免双因素简并,并使解析的轮廓相对于高维稳定。FRSF采用基于矩阵奇异值分解的压缩技术,保持了较高的收敛速度,大大降低了计算复杂度。此外,张量数据中共簇的代数表达式可以映射到FRSF因子空间中的一些线性结构。我们使用线性分组算法来识别因子空间中的这些几何模式。最后,沿每个模式的线性分组点的组合成功地支持了张量数据中的共簇检测。在该框架的基础上,开发了一种灵活快速的基于FRSF的联合聚类算法。大量仿真和实验数据分析证明了FRSF和所提出的联合聚类算法的有效性和效率。

MSC公司:

62小时30分 分类和区分;聚类分析(统计方面)

软件:

多群集;大卫
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Acar,E。;Yener,B.,《无监督的多路数据分析:文献调查》,IEEE Trans。知识。数据工程,21,1,6-20(2009)
[2] 巴塔利诺,C。;巴拉德·G。;Kolda,T.G.,一种实用的随机cp张量分解,SIAM J.矩阵分析。申请。,3876-901年(2018年)·兹比尔1444.65016
[3] Bhar,A。;Haubrock,M。;Mukhopadhyay,A。;Maulik,美国。;Bandyopadhyay,S。;Wingender,E.,\(δ\)-trimax:提取三聚类并分析时间序列基因表达数据中的协同调节,生物信息学算法国际研讨会,165-177(2012),Springer
[4] Bhar,A。;Haubrock,M。;Mukhopadhyay,A。;Wingender,E.,时间序列转录组数据的多目标三聚类揭示了生物过程的关键基因,BMC Bioninform。,16, 1, 200 (2015)
[5] Biswal,B.S。;Mohapatra,A。;Vipsita,S.,《基因表达微阵列数据双聚类综述:算法、有效措施和验证》,《国际期刊数据最小生物信息》。,21, 3, 230-268 (2018)
[6] Cheng,Y。;Church,G.M.,表达数据的双聚类。,ISMB,第893-103页(2000年)
[7] 周,S.-J。;王,C。;Sintupisut,N。;Niou,Z.-X。;林,C.-H。;李,K.-C。;Yeang,C.-H.,时空基因表达模式分析揭示了小鼠大脑发育的动态和区域化,Sci。代表,6,19274(2016)
[8] 科蒙,P。;卢西亚尼,X。;De Almeida,A.L.,《张量分解、交替最小二乘法和其他故事》,J.Chemom。,23, 7-8, 393-405 (2009)
[9] Henriques,R。;Madeira,S.C.,《三维数据分析的三聚类算法:综合调查》,ACM Compute。调查。,51, 5, 95:1-95:43 (2018)
[10] 洪,M。;Jung,J.J.,基于社会张量因子分解的多方面建议,《信息科学》。,447, 140-156 (2018)
[11] 霍尔,V。;维尼埃拉,A。;布尔,A。;奈特,J。;M.I.麦卡锡。;小K。;Marchini,J.,多组织基因表达实验的张量分解,自然遗传学。,第481094页(2016年)
[12] 黄,D.W。;谢尔曼,B.T。;Lempicki,R.A.,《利用戴维生物信息学资源对大型基因列表进行系统和综合分析》,《国家协议》。,4, 1, 44 (2008)
[13] Hundeshagen,A。;海克,M。;巴普,B.K。;Angerstein,C。;坎杜尔斯基,O。;Fatum,C。;哈特曼,C。;科赞,D。;Thiesen,H.-J。;英国Zettl,《多发性硬化症患者子集中i型干扰素样活性升高:分子基础和临床相关性》,《神经炎杂志》。,9, 1, 140 (2012)
[14] Jiang,J.-h。;Wu,H.-l。;李毅。;Yu,R.-q.,交替切片对角化(asd)方法的三向数据分辨率,J.Chemom。,14, 1, 15-36 (2000)
[15] 蒋,T.-X。;黄,T.-Z。;赵晓乐。;纪天勇。;邓,L.-J.,利用框架先验实现低阶张量完备的矩阵因式分解,信息科学。,436, 403-417 (2018) ·Zbl 1448.15015号
[16] Kannan,R。;巴拉德·G。;Park,H.,一种用于非负矩阵分解的高性能并行算法,SIGPLAN Not。,51, 8, 9 (2016)
[17] 科尔达·T·G。;Bader,B.W.,张量分解与应用,SIAM Rev.,51,3,455-500(2009)·Zbl 1173.65029号
[18] 拉哈特,D。;阿达利,T。;Jutten,C.,《多模数据融合:方法、挑战和前景概述》,Proc。IEEE,103,9,1449-1477(2015)
[19] 南卡罗来纳州马德拉。;Oliveira,A.L.,《生物数据分析的双聚类算法:一项调查》,IEEE/ACM Trans。计算。生物信息。,1,1,24-45(2004年)
[20] Ozdemir,A。;医学硕士Iwen。;Aviyente,S.,高阶张量的多尺度分析(2017),arXiv:1704.08578
[21] Papalexakis,E.E。;Faloutsos,C。;Sidiropoulos,N.D.,《数据挖掘和数据融合的张量:模型、应用程序和可伸缩算法》,ACM Trans。智力。系统。技术。,8, 2, 16 (2017)
[22] Papalexakis,E.E。;新墨西哥州西迪罗普洛斯。;Bro,R.,《从k均值到高维共聚类:具有稀疏潜在因子的多线性分解》,IEEE Trans。信号处理。,61, 2, 493-506 (2013)
[23] Pascual-Montano,A。;Carazo,J.M。;Kochi,K。;莱曼,D。;Pascual-Marqui,R.D.,非光滑非负矩阵分解(nsnmf),IEEE Trans。模式分析。马赫。智力。,28, 3, 403-415 (2006)
[24] Pontes,B。;Giráldez,R。;Aguilar-Ruiz,J.S.,《表达数据的双聚类:综述》,J.Biomed。通知。,57, 163-180 (2015)
[25] 齐,L。;徐,C。;Xu,Y.,非负张量因式分解,完全正张量,和层次消去算法,SIAM J.矩阵分析。申请。,35, 4, 1227-1241 (2014) ·Zbl 1317.65114号
[26] Seigal,A。;贝盖利斯-迪亚斯,M。;斯科贝尔,B。;尼佩尔,M。;Harrington,H.A.,带代数约束的张量聚类给出了乳腺癌中可解释的串扰机制组,J.R.Soc.Interface,16,151,20180661(2019)
[27] 新墨西哥州西迪罗普洛斯。;Lathauwer,L.D。;Fu,X。;黄,K。;Papalexakis,E.E。;Faloutsos,C.,信号处理和机器学习的张量分解,IEEE Trans。信号处理。,65, 13, 3551-3582 (2017) ·Zbl 1415.94232号
[28] 德田,T。;Yoshimoto,J。;Y.清水。;冈田,G。;高村,M。;冈本,Y。;山崎,S。;Doya,K.,基于异质边际分布非参数混合模型的多重联合聚类,PloS One,12,10,e0186566(2017)
[29] 德田,T。;Yoshimoto,J。;Y.清水。;冈田,G。;高村,M。;冈本,Y。;山崎,S。;Doya,K.,《使用数据驱动方法识别抑郁症亚型和相关脑区》,《科学》。代表,8,1,14082(2018)
[30] Van Aelst,S。;Wang,X.S。;Zamar,R.H。;Zhu,R.,使用正交回归进行线性分组,计算。统计数据分析。,50, 5, 1287-1312 (2006) ·Zbl 1431.62273号
[31] 王,M。;费舍尔,J。;Song,Y.S.,使用约束张量分解对多组织多个体基因表达数据进行三向聚类,bioRxiv,229245(2017)
[32] Yan,H.,多维大数据的聚类:基因组、金融和其他数据分析的有用工具,IEEE系统。人类网络。Mag.,3,2,23-30(2017)
[33] 杨伟华(Yang,W.-H.)。;戴德清。;Yan,H.,从基因表达数据中寻找相关的双聚类,IEEE Trans。知识。数据工程,23,4,568-584(2011)
[34] 赵,H。;Chan,K.L。;Cheng,L.-M。;Yan,H.,减少基因表达数据几何双聚类中噪声影响的概率松弛标记框架,模式识别。,42, 11, 2578-2588 (2009) ·Zbl 1175.68409号
[35] 赵,H。;Wee-Chang Liew,A。;Z Wang,D。;Yan,H.,《模式发现的双聚类分析:当前技术、比较研究和应用》,Curr。生物信息。,7, 1, 43-55 (2012)
[36] 周,J。;Wang,F。;胡,J。;Ye,J.,《从微观到宏观:通过纵向电子病历致密化实现数据驱动表型分析》,第20届ACM SIGKDD国际知识发现和数据挖掘会议论文集,135-144(2014),ACM
[37] Zong,L。;张,X。;赵,L。;Yu,H。;Zhao,Q.,通过多流形正则化非负矩阵分解的多视图聚类,神经网络。,88,74-89(2017)·Zbl 1434.68493号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。