×

聚类变量的最稀疏因子分析:矩阵分解方法。 (英语) Zbl 1416.62319号

摘要:我们提出了一种新的稀疏因子分析(FA)程序,使得每个变量只加载一个公共因子。因此,加载矩阵的每一行中都有一个非零元素,其他地方则为零。对于一定数量的变量和公共因子,这样的加载矩阵是最稀疏的。因此,该方法被称为稀疏FA(SSFA)。它也可以称为基于FA的变量聚类,因为加载相同公共因子的变量可以划分为一个簇。在SSFA中,FA的所有模型部分(公共因子、它们的相关性、载荷、唯一因子和唯一方差)都被视为固定的未知参数矩阵,并且通过特定的数据矩阵分解将其最小二乘函数最小化。该算法的一个有用特征是,使用QR分解对公共因子得分矩阵进行重新参数化,以便有效估计因子相关性。仿真研究表明,该方法能够准确识别真实稀疏模型。实际数据示例证明了SSFA执行的变量聚类的有用性。

MSC公司:

62H25个 因子分析和主成分;对应分析
62H30型 分类和区分;聚类分析(统计方面)
15年23日 矩阵的因式分解

软件:

稀疏的
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Adachi,K.,《数据拟合因子分析与协方差拟合因子分析实证比较的一些贡献》,J Jpn Soc Comput Stat,25,25-38,(2012)·Zbl 1326.62134号 ·doi:10.5183/jjscs.1106001_197
[2] Adachi,K.,《因子分析的矩阵密集型方法》,Jpn J Stat,44,363-382,(2014)
[3] 阿达奇,K。;Trendafilov,NT;Carpita,M.(编辑);布伦塔利,E.(编辑);Qannari,EM(编辑),稀疏正交因子分析,227-239,(2014),海德堡
[4] Aggarwal CC(2015)《数据挖掘:教科书》。纽约州施普林格·Zbl 1311.68001号 ·doi:10.1007/978-3-319-14142-8
[5] Costa PT,McCrae RR(1992)《近地天体PI-R专业手册:修订的近地天体个性清单(NEO PI-R)和近地天体五因子清单(NEO-FFI)》。心理评估资源,敖德萨
[6] Leeuw,J。;Montfort,K.(编辑);Oud,J.(编辑);Satorra,A.(编辑),部分观测线性系统的最小二乘最优定标,121-134,(2004),Dordrecht·Zbl 05196650号 ·doi:10.1007/978-14020-1958-67
[7] Eldén L(2007)数据挖掘和模式识别中的矩阵方法。费城SIAM·Zbl 1120.68092号 ·数字对象标识代码:10.1137/1.9780898718867
[8] Everitt BS(1993),聚类分析,第三版。爱德华·阿诺德,伦敦·Zbl 0507.62060号
[9] Gan G,Ma C,Wu J(2007)《数据聚类:理论、算法和应用》。费城工业和应用数学学会(SIAM)·Zbl 1185.68274号 ·数字对象标识代码:10.1137/1.9780898718348
[10] Goldberg,LR,五大因素结构标志物的发展,心理评估,4,26-42,(1992)·doi:10.1037/1040-3590.4.1.26
[11] Harman HH(1976)现代因素分析,第3版。芝加哥大学出版社,芝加哥·Zbl 0095.13403号
[12] Hirose,K。;Yamamoto,M.,通过惩罚似然因子分析估算斜向结构,计算统计数据分析,79,120-132,(2014)·Zbl 1506.62080号 ·doi:10.1016/j.csda.2014.05.011
[13] Hirose K,Yamamoto M(2014b)通过因子分析模型中的非冲突惩罚可能性进行稀疏估计。计算,统计。doi:10.1007/s11222-014-9475-z·Zbl 1332.62194号 ·doi:10.1007/s11222-014-9475-z
[14] Holzinger KJ,Swineford F(1939)因子分析研究:双因子解的稳定性。芝加哥大学,补充教育专著,第48期
[15] Izenman AJ(2008)《现代多元统计技术:回归、分类和流形学习》。纽约州施普林格·Zbl 1155.62040号 ·doi:10.1007/978-0-387-78189-1
[16] IT部Jolliffe;特伦达菲洛夫,NT;Uddin,M.,基于LASSO的改进主成分技术,《计算图形统计杂志》,12,531-547,(2003)·doi:10.1198/1061860032148
[17] Knowles,D。;Ghahramani,Z.,非参数贝叶斯稀疏因子模型及其在基因表达建模中的应用,Ann Appl Stat,51534-1552,(2011)·Zbl 1223.62013年 ·doi:10.1214/10-AOAS435
[18] Mazumder,R。;弗里德曼,J。;Hastie,T.,Sparsenet:协调下降与非凸惩罚,《美国统计协会杂志》,1061125-1138,(2011)·Zbl 1229.62091号 ·doi:10.1198/jasa.2011.tm09738
[19] Mulaik SA(2010)《因子分析基础》,第2版。博卡拉顿CRC出版社·Zbl 1188.62185号
[20] 托盘,M。;斯特格尔,O。;夏普,K。;Winn,J.,《贝叶斯稀疏因子分析的推理算法和学习理论》,J Phys Conf Ser,197,1-10,(2009)·doi:10.1088/1742-6596/197/1/012002
[21] Reyment R,Jöreskog KG(1996)《自然科学中的应用因子分析》。剑桥大学出版社·Zbl 0868.62051号
[22] Sampson RJ(1968)\R模式因子分析程序,FORTRAN II,用于IBM 1620计算机。堪萨斯州地质调查计算Contrib 20
[23] Seber GAF(2008)统计学家矩阵手册。霍博肯·威利·兹比尔1143.15001
[24] Sočan G(2003)最小秩因子分析的增量值。格罗宁根大学博士论文
[25] 斯皮尔曼,C.,“一般智力”的客观测定和测量,《美国心理学杂志》,第15卷,201-293页,(1904年)·doi:10.2307/1412107
[26] Stegeman,A.,《同时估计因子模型参数、因子得分和独特部分的新方法》,《计算统计数据分析》,99,189-203,(2016)·Zbl 1468.62181号 ·doi:10.1016/j.csda.2016.01.012
[27] Berge,JMF,关于某些矩阵乘积迹的kristof定理的推广,《心理测量学》,48,519-523,(1983)·兹伯利0536.62093 ·doi:10.1007/BF02293876
[28] 10 Berge JMF(1993)多元分析中的最小二乘优化。莱顿DSWO出版社
[29] Trendafilov,NT,《从简单结构到稀疏组件:综述》,《计算统计》,29,431-454,(2014)·Zbl 1306.65143号 ·doi:10.1007/s00180-013-0434-5
[30] Trendafilov,NT;Unkel,S.,《变量多于观测值的数据矩阵探索性因子分析》,《计算图形统计杂志》,20874-891,(2011)·文件编号:10.1198/jcgs.2011.09211
[31] 特伦达菲洛夫(Nickolay T.Trendafilov)。;斯蒂芬·昂克尔(Steffen Unkel);Krzanowski,Wojtek,探索性因素和主成分分析:一些新的方面,统计与计算,23209-220,(2011)·Zbl 1322.62043号 ·doi:10.1007/s11222-011-9303-7
[32] Unkel,S。;Trendafilov,NT,探索性因子分析中的同步参数估计:一项解释性评论,《国际统计评论》,78,363-382,(2010)·doi:10.1111/j.1751-5823.2010.00120.x
[33] 维希,M。;Saporta,G.,聚类和不相交主成分分析,《计算统计数据分析》,533194-3208,(2009)·Zbl 1453.62230号 ·doi:10.1016/j.csda.2008.05.028
[34] Zaki MJ,Meira W(2014)《数据挖掘和分析:基本概念和算法》。剑桥大学出版社·Zbl 1331.68005号 ·doi:10.1017/CBO9780511810114
[35] 邹,DM;哈斯蒂,T。;Tibshirani,R.,稀疏主成分分析,计算机图形统计杂志,15,265-286,(2006)·doi:10.1198/106186006X113430
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。