×

通过稀疏奇异值分解进行双聚类。 (英语) Zbl 1233.62182号

摘要:稀疏奇异值分解(SSVD)是一种新的探索性分析工具,用于双聚类或识别高维数据矩阵中可解释的行-列关联。SSVD寻求数据矩阵的低秩棋盘结构矩阵近似。所需的棋盘结构是通过强制左侧和右侧的向量稀疏来实现的,即具有多个零项。通过将奇异向量解释为某些线性回归的回归系数向量,对最小二乘回归施加稀疏诱导正则化惩罚,以生成稀疏奇异向量。提出了一种计算稀疏奇异向量的高效迭代算法,并对惩罚参数的选择进行了讨论。使用肺癌微阵列和食物营养数据集说明SSVD是一种双聚类方法。利用模拟数据集,将SSVD与现有的一些双聚类方法进行了比较。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62H30型 分类和区分;聚类分析(统计方面)
65C60个 统计中的计算问题(MSC2010)
62J05型 线性回归;混合模型
92 C50 医疗应用(通用)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Asgarian,使用秩-1双聚类对微阵列数据进行分类(2008年)
[2] Bondell,同步回归收缩、变量选择和OSCAR预测因子的监督聚类,生物计量学64页115–(2008)·Zbl 1146.62051号 ·doi:10.1111/j.1541-0420.2007.00843.x
[3] Breiman,使用非负garote进行更好的子集回归,Technometrics 37 pp 373–(1995)·Zbl 0862.62059号 ·doi:10.2307/1269730
[4] Busygin,通过分数0-1编程实现一致双聚类的特征选择,《组合优化杂志》10 pp 7–(2005)·Zbl 1123.90073 ·doi:10.1007/s10878-005-1856-y
[5] Busygin,《数据挖掘中的分歧》,《计算机与运营研究》,35页,2964页–(2008)·Zbl 1144.68309号 ·doi:10.1016/j.cor.2007.01.005
[6] Dhillon,I.S.Mallela,S.Modha,D.S.2003第九届ACM SIGKDD知识发现和数据挖掘国际会议信息论联合聚类会议论文集89 98 Springer
[7] Eckart,《一个矩阵与另一个低阶矩阵的近似》,《心理测量学》1第211页–(1936)·JFM 62.1075.02标准 ·doi:10.1007/BF02288367
[8] Fan,通过非一致惩罚似然进行变量选择及其预言属性,《美国统计协会杂志》96页1348–(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[9] Jolliffe,主成分分析(2002)
[10] Jolliffe,基于套索的改进主成分技术,《计算与图形统计杂志》,12页,531–(2003)·doi:10.1198/1061860032148
[11] Kluger,微阵列数据的光谱双聚类:共聚类基因和条件,基因组研究13第703页–(2003)·doi:10.101克/克648603
[12] Lazzeroni,基因表达数据的格子模型,Statistica Sinica 12 pp 61–(2002)·Zbl 1004.62084号
[13] Leng,《关于一般自适应稀疏主成分分析》,《计算与图形统计杂志》,第18页,201–(2009)·doi:10.1198/jcgs.2009.0012
[14] Liu,高维低样本数据聚类的统计意义,《美国统计协会杂志》103 pp 1281–(2008)·Zbl 1205.62079号 ·doi:10.1198/0162145000000454
[15] Madeira,《生物数据分析的双聚类算法:调查》,IEEE计算生物学和生物信息学汇刊1,第24页–(2004)·Zbl 05103330号 ·doi:10.1109/TCBB.2004.2
[16] Schwarz,估算模型的维度,《统计年鉴》第6卷第461页–(1978年)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[17] Shabalin,《在高维数据中发现大平均子矩阵》,《应用统计年鉴》第3卷,第985页–(2009年)·Zbl 1196.62087号 ·doi:10.1214/09-AOAS239
[18] 沈,通过正则化低秩矩阵近似进行稀疏主成分分析,《多元分析杂志》99 pp 1015–(2008)·兹比尔1141.62049 ·doi:10.1016/j.jmva.2007.06.007
[19] Tibshirani,通过套索进行回归收缩和选择,《皇家统计学会杂志》,B辑58,第267页–(1996)·Zbl 0850.62538号
[20] Wang,回归系数和自回归阶数收缩与套索选择,英国皇家统计学会期刊,B辑69,第63页–(2007)·文件编号:10.1111/j.1467-9868.2007.00577.x
[21] Wang,基于模型的高维聚类变量选择及其在微阵列数据中的应用,《生物计量学》64,第440页–(2008)·Zbl 1137.62041号 ·文件编号:10.1111/j.1541-0420.2007.00922.x
[22] Yang,基于奇异值分解的微阵列数据双聚类,知识发现和数据挖掘中的新兴技术第194页–(2007)·Zbl 05269648号 ·doi:10.1007/978-3-540-77018-3_21
[23] Zhang,Adaptive-lasso for Cox比例风险模型,Biometrika 94 pp 691–(2007)·Zbl 1135.62083号 ·doi:10.1093/biomet/asm037
[24] 邹,《自适应套索及其预言属性》,《美国统计协会期刊》第101页第1418页–(2006)·Zbl 1171.62326号 ·doi:10.1198/016214500000735
[25] 邹,通过弹性网进行正则化和变量选择,《皇家统计学会杂志》,B辑67第301页–(2005)·Zbl 1069.62054号 ·doi:10.1111/j.1467-9868.2005.00503.x
[26] 邹,稀疏主成分分析,《计算与图形统计杂志》,15页,265–(2006)·doi:10.1198/106186006X113430
[27] 邹,《关于套索的“自由度”》,《统计年鉴》第35卷第2173页–(2007年)·Zbl 1126.62061号 ·doi:10.1214/009053600700000127
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。