×

使用受限斜交(t)分布的稳健因子分析模型。 (英语) Zbl 1327.62344号

摘要:因子分析是一种经典的数据还原技术,它寻找数量可能较少的未观察变量,以解释观测变量之间的相关性。本文提出了因子分析模型的一个扩展,称为斜因子分析模型,该模型是通过假设潜在因子的多元斜(t)分布的限制版本和不可观测误差的对称(t)分配共同构建的。该模型对潜在因素的正态性假设的违反具有鲁棒性,并在捕获观测数据的额外偏度和较重尾部方面具有灵活性。提出了一种计算可行的期望条件最大化算法,用于计算模型参数的最大似然估计。使用模拟数据和实际数据说明了该方法的有效性。

MSC公司:

62甲12 多元分析中的估计
62H25个 因子分析和主成分;对应分析

软件:

PGMM公司EMMIX倾斜
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aas K,Haff IH(2006)广义双曲偏态学生的t分布。金融经济学杂志4:275-309
[2] Aitken AC(1926)关于伯努利代数方程的数值解。爱丁堡R Soc程序46:289-305·JFM 52.0098.05号 ·doi:10.1017/S0370164600022070
[3] Akaike H(1973)信息理论和最大似然原理的扩展。作者:Petrov BN,Csaki F(Eds.),第二届信息理论国际研讨会。布达佩斯Akademiai Kiado,第267-281页·Zbl 0283.62006号
[4] Anderson TW(2003)《多元统计分析导论》,第3版。纽约威利·Zbl 1039.62044号
[5] Azzalini A(1985)包含正态分布的一类分布。扫描J统计12:171-178·Zbl 0581.62014号
[6] Azzalini A(2005)偏正态分布和相关多变量家族。扫描J统计32:159-188·兹比尔1091.62046 ·数字对象标识代码:10.1111/j.1467-9469.2005.00426.x
[7] Azzalini A,Capitanio A(1999)多元正态分布的统计应用。J R Stat Soc系列B 61:579-602·Zbl 0924.62050号 ·doi:10.111/1467-9868.00194
[8] Azzalini A,Capitanio A(2003)对称扰动产生的分布,强调多元斜t分布。J R Stat Soc序列B 65:367-389·Zbl 1065.62094号 ·数字对象标识代码:10.1111/1467-9868.00391
[9] Azzalini A,Dalla Valle A(1996)多元偏态正态分布。生物特征83:715-726·Zbl 0885.62062号 ·doi:10.1093/biomet/83.4.715
[10] Azzalini A,Genton MG(2008)基于斜交和相关分布的稳健似然方法。国际统计版次76:106-129·Zbl 1206.62102号 ·文件编号:10.1111/j.1751-5823.2007.0016.x
[11] Barndorff-Nielsen O,Shephard N(2001)非高斯-奥恩斯坦-乌伦贝克模型及其在金融经济学中的一些应用。J R Stat Soc系列B 63:167-241·Zbl 0983.60028号 ·doi:10.1111/1467-9868.00282
[12] Basilevsky A(2008)统计因素分析及相关方法:理论与应用。纽约威利·Zbl 1130.62341号
[13] Böhning D,Dietz E,Schaub R,Schlattmann P,Lindsay B(1994)单参数指数族密度混合物的似然比分布。Ann Inst统计数学46:373-388·Zbl 0802.62017年 ·doi:10.1007/BF01720593
[14] Bozdogan H(1987)模型选择和Akaike信息准则(AIC):一般理论及其分析扩展。心理测量学52:345-370·Zbl 0627.62005号 ·doi:10.1007/BF02294361
[15] Branco MD,Dey DK(2001)多元偏椭圆分布的一般类。多变量分析杂志79:99-113·Zbl 0992.62047号 ·doi:10.1006/jmva.2000.1960
[16] Cook RD,Weisberg S(1994)回归图形介绍。纽约威利·Zbl 0925.62287号 ·数字对象标识代码:10.1002/9780470316863
[17] Dempster AP、Laird NM、Rubin DB(1977)通过EM算法从不完整数据中获得最大似然(带讨论)。J R Stat Soc系列B 39:1-38·Zbl 0364.62022号
[18] Efron B,Hinkley DV(1978)评估最大似然估计器的准确性:观察到的与预期的fisher信息(带讨论)。生物特征65:457-487·Zbl 0401.62002号 ·doi:10.1093/biomet/65.3.457
[19] Efron B,Tibshirani R(1986)标准误差、置信区间和其他统计准确性度量的Bootstrap方法。统计科学1:54-77·Zbl 0587.62082号 ·doi:10.1214/ss/1177013815
[20] FokouéE,Titterington DM(2003)因子分析仪的混合物。通过随机模拟进行贝叶斯估计和推断。马赫学习50:73-94·Zbl 1033.68085号 ·doi:10.1023/A:1020297828025
[21] Hannan EJ,Quinn BG(1979)《自回归阶数的确定》。J R Stat Soc Ser B期刊41:190-195·Zbl 0408.62076号
[22] Healy MJR(1968)多变量正态图。应用统计17:157-161·doi:10.2307/2985678
[23] Ho HJ,Lin TI,Chang HH,Haase HB,Huang S,Pyne S(2012)用流式细胞术测量不同组织的细胞状态转变的参数建模。BMC Bioninform 13(补充5):S5·doi:10.1186/1471-2105-13-S5-S5
[24] Jamshidian,M。;Berkane,M.(编辑),缺失数据的ML因子分析的EM算法,247-258(1997),纽约·Zbl 0893.62060号 ·doi:10.1007/978-1-4612-1842-5_13
[25] Johnson RA,Wichern DW(2007)《应用多元统计分析》,第6版。Pearson Prentice-Hall,上鞍河·Zbl 1269.62044号
[26] Jones MC,Faddy MJ(2003)t分布的斜扩展及其应用。J R Stat Soc Ser B期刊65:159-174·Zbl 1063.62013年 ·doi:10.111/1467-9868.00378
[27] Kotz S,Nadarajah S(2004)多元分布及其应用。剑桥大学出版社·Zbl 1100.62059号
[28] Lachos VH,Ghosh P,Arellano-Valle RB(2010),基于似然的偏正态独立线性混合模型推断。统计Sin 20:303-322·Zbl 1186.62071号
[29] Lange KL、Little RJA、Taylor JMG(1989)《使用t分布的稳健统计建模》。美国统计协会杂志84:881-896
[30] Lawley DN,Maxwell AE(1971),作为统计方法的因子分析,第2版。巴特沃斯,伦敦·Zbl 0251.62042号
[31] Lee S,McLachlan GJ(2013)关于斜正态分布和斜t分布的混合。高级数据分析类7:241-266·Zbl 1273.62115号 ·doi:10.1007/s11634-013-0132-8
[32] Lee S,McLachlan GJ(2014)多元斜交t分布的有限混合:一些最新结果。统计成分24:181-202·Zbl 1325.62107号 ·doi:10.1007/s11222-012-9362-4
[33] Lee YW,Poon SH(2011)贷款组合损失分布的系统和系统因素。曼彻斯特大学社会科学学院计量经济学和应用经济学研讨会,第1-61页·Zbl 1033.68085号
[34] Lin TI,Ho HJ,Chen CL(2009)《不完全数据下的多元偏正态模型分析》。多变量分析杂志100:2337-2351·Zbl 1175.62054号
[35] Lin TI,Lee JC,Ho HJ(2006)关于具有缺失信息的正态混合模型的快速监督学习。图案记录39:1177-1187·Zbl 1096.68723号 ·doi:10.1016/j.patcog.2005.12.014
[36] Lin TI,Lee JC,Hsieh WJ(2007a)使用斜交分布的稳健混合建模。统计报表17:81-92·doi:10.1007/s11222-006-9005-8
[37] Lin TI,Lee JC,Yen SY(2007b)使用斜正态分布的有限混合建模。统计Sin 17:909-927·Zbl 1133.62012年
[38] Lin TI,Lin TC(2011)使用具有完整和不完整数据的多元斜交分布进行稳健统计建模。统计模型11:253-277·Zbl 1218.62050号 ·doi:10.1177/1471082X1001100305
[39] Lin TI,McLachlan GJ,Lee SX(2013)使用受限多元偏态分布扩展因子模型的混合。预印arXiv:1307.1748·Zbl 1328.62378号
[40] Lindsay B(1995)混合模型:理论。几何和应用。海沃德数理统计研究所·兹比尔1163.62326
[41] Liu M,Lin TI(2014)不完全数据的偏正态因子分析模型。应用统计杂志。doi:10.1080/0226677633.2014.986437·Zbl 1206.62102号
[42] Lopes HF,West M(2004),因子分析中的贝叶斯模型评估。统计Sin 14:41-67·Zbl 1035.62060号
[43] Louis TA(1982)使用EM算法时发现观测信息。J R Stat Soc Ser B期刊44:226-232·Zbl 0488.62018号
[44] McLachlan GJ,Peel D(2000)有限混合模型。纽约威利·Zbl 0963.62061号 ·doi:10.1002/0471721182
[45] McLachlan GJ,Bean RW,Jones LBT(2007)混合因子分析模型的扩展,以纳入多元\[t\]t分布。计算统计数据分析51:5327-5338·Zbl 1445.62053号 ·doi:10.1016/j.csda.2006.09.015
[46] McNicholas PD、Murphy TB、McDaid AF、Frost D(2010)通过简约高斯混合模型实现基于模型的聚类的串行和并行实现。计算统计数据分析54:711-723·Zbl 1464.62131号 ·doi:10.1016/j.csda.2009.02.011
[47] Meng XL,Rubin DB(1993)通过ECM算法的最大似然估计:一般框架。生物特征80:267-278·Zbl 0778.62022号 ·doi:10.1093/biomet/80.2.267
[48] Montanari A,Viroli C(2010)异方差因子混合分析。统计模型10:441-460·Zbl 07256833号 ·doi:10.1177/1471082X0901000405
[49] Murray PM、Browne RP、McNicholas PD(2013)“无限制”斜交因子分析仪的混合物。预打印arXiv:1310.6224v1·Zbl 1506.62132号
[50] Murray PM、Browne RP、McNicholas PD(2014a)《斜交因子分析仪的混合物》。计算机统计数据分析77:326-335·Zbl 1506.62132号 ·doi:10.1016/j.csda.2014.03.012
[51] Murray PM、McNicholas PD、Browne RP(2014b)常见偏差因子分析仪的混合物。统计3:68-82·doi:10.1002/sta4.43
[52] Pyne S,Hu X,Wang K,Rossin E,Lin TI,Maier LM,Baecher-Allan C,McLachlan GJ,Tamayo P,Hafler DA,De Jager PL,Mesirov JP(2009)自动化高维流式细胞术数据分析。美国国家科学院院刊106:8519-8524·doi:10.1073/pnas.0903028106
[53] Rossin E,Lin TI,Ho HJ,Mentzer SJ,Pyne S(2011)基于不同组织中反应性特征的单克隆抗体分析特征框架。生物信息学27:2746-2753·doi:10.1093/bioinformatics/btr468
[54] Sahu SK,Dey DK,Branco MD(2003)一类新的多元偏态分布及其在贝叶斯回归模型中的应用。加拿大统计局31:129-150·Zbl 1039.62047号 ·doi:10.2307/3316064
[55] Schwarz G(1978)估算模型的维数。安统计6:461-464·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[56] Sclove LS(1987)模型选择标准在多变量分析中的应用。心理测量52:333-343·Zbl 0885.62062号
[57] 斯皮尔曼C(1904)客观确定和测量的一般智力。美国心理学杂志15:201-292·doi:10.2307/1412107
[58] Tortora C、McNicholas PD、Browne R(2013)广义双曲因子分析仪的混合物。预印arXiv:1311.6530v1·Zbl 1414.62278号
[59] Wall MM,Guo J,Amemiya Y(2012)用连续和二分观测变量近似非正态分布连续潜在因子的混合因子分析。Multivar Behav研究47:276-313·doi:10.1080/00273171.2012.658339
[60] Wang K,McLachlan GJ,Ng SK,Peel D(2009)EMMIX偏斜:多元偏斜正态/\[t\]t分布混合的EM算法。R软件包版本1.0-12
[61] Wang WL,Lin TI(2013)混合t因子分析仪中最大似然估计的有效ECM算法。计算统计28:751-769·Zbl 1305.65082号 ·文件编号:10.1007/s00180-012-0327-z
[62] Zacks S(1971)统计推断理论。纽约威利
[63] Zhang J,Li J,Liu C(2013)使用多元t分布的稳健因子分析。未发表的手稿·Zbl 1285.62068号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。