×

具有因子分析协方差矩阵结构的通用选址模型及其应用。 (英文) Zbl 1414.62205号

概述:通用位置模型(GLOM)是分析混合数据的著名模型。在GLOM中,将变量的联合分布分解为给定分类结果的连续变量的条件分布和分类变量的边际分布。GLOM的第一个版本假设通过分类变量的不同组合获得的跨细胞连续多元分布的协方差矩阵相等。本文考虑了这些协方差矩阵相等和不相等的情况下的GLOM。跨单元格使用三种协方差结构:相同的因子分析器、具有不相等特定方差矩阵(一般形式和简约形式)的因子分析器和具有公共因子载荷的因子分析器。这些结构用于建模协方差结构和减少参数数量。通过EM算法计算参数的最大似然估计。作为这些模型的应用,我们研究了细胞内连续变量的分类。基于这些模型,对普通数据集和高维数据集进行了分类。最后,为了证明所提出的分类模型的适用性,给出了三个实际数据集的分析结果。

MSC公司:

62H25个 因子分析和主成分;对应分析
62H30型 分类和区分;聚类分析(统计方面)

软件:

Flury公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Airoldi JP,Hoffmann RS(1984)田鼠(Microtus californicus,M.ochrogaster)的年龄变化及其对系统研究的意义。堪萨斯大学自然历史博物馆的偶然论文,劳伦斯KS 111:1-45
[2] Anderson JA,Pemberton JD(1985)多元有序分类变量和协变量调整的分组连续模型。生物识别41:875-885·兹比尔0615.62065 ·doi:10.2307/2530960
[3] Baek J,McLachlan GJ(2008)因子分析仪与共因子载荷的混合,用于高维数据的聚类和可视化。技术报告NI08018-SCH。剑桥大学艾萨克·牛顿数学科学研究所预印本系列
[4] Baek J、McLachlan GJ、Flack LK(2010)《因子分析仪与普通因子载荷的混合:高维数据聚类和可视化的应用》。IEEE Trans-Pattern Ana Mach Intell 32:1298-1309标准·doi:10.1109/TPAMI.2009.149
[5] Barnard J、McCulloch RE、Meng XL(2000),根据标准偏差和相关性建模协方差矩阵,并应用于收缩。统计Sin 10:1281-1311·Zbl 0980.62045号
[6] Bartholomew DJ、Knott M、Moustaki I(2011)《潜在变量模型和因子分析:统一方法》,第3版。纽约威利·Zbl 1266.62040号 ·数字对象标识代码:10.1002/9781119970583
[7] Belin TR,Hu MY,Young AS,Grusky O(1999)多元心理健康服务研究中具有可忽略缺失数据假设的一般位置模型的性能。统计医学18:3123-3135·doi:10.1002/(SICI)1097-0258(19991130)18:22<3123::AID-SIM277>3.0.CO;2-2号
[8] Bishop YMM、Fienberg SE、Holland PW(1975)《离散多元分析:理论与实践》。麻省理工学院出版社,剑桥·Zbl 0332.62039号
[9] Browne RP,McNicholas PD(2012)混合类型数据的基于模型的聚类、分类和判别分析。J Stat Plann推断142:2976-2984·Zbl 1335.62093号 ·doi:10.1016/j.jspi.2012.05.001
[10] Cai JH,Song XY,Lam KH,Ip HS(2011)混合模式和异质数据的广义潜在变量模型的混合。计算统计数据分析55:2889-2907·Zbl 1218.62012号 ·doi:10.1016/j.csda.2011.05.011
[11] de Leon AR,Carrière KC(2007)通用混合数据模型:通用位置和分组连续模型的扩展。加拿大统计局35:533-548·Zbl 1143.62323号 ·doi:10.1002/cjs.5550350405
[12] de Leon AR,Carrière KC(2013)混合数据分析:方法和应用。查普曼和霍尔/CRC,伦敦·Zbl 1318.62006号 ·doi:10.1201/b14571
[13] de Leon AR,Soo A,Williamson T(2011)通过通用混合数据模型对离散变量和连续变量进行分类。J应用统计38:1021-1032·Zbl 1511.62135号 ·doi:10.1080/02664761003758976
[14] Dempster AP,Laird NM,Rubin DB(1977)通过EM算法从不完整数据中获得最大似然。《社会统计杂志》系列B 39:1-38·Zbl 0364.62022号
[15] Fisher RA(1936)分类问题中多重测量的使用。安·尤根7:179-188·文件编号:10.1111/j.1469-1809.1936.tb02137.x
[16] Flury B(2012)Flury:来自Flury的数据集,1997年。R包版本0.1-3(2012)
[17] Fonseca JRS(2010)关于潜在细分模型中信息标准的表现。世界科学技术院63:330-337
[18] Gershenfeld N(1997)非线性推理和聚类加权建模。Ann N Y科学院808:18-24·doi:10.1111/j.1749-6632.1997.tb51651.x
[19] Ingrassia S,Punzo A,Vittadini G,Minotti SC(2015)广义线性混合聚类加权模型。J类32:85-113·Zbl 1331.62310号 ·doi:10.1007/s00357-015-9175-1
[20] Krzanowski WJ(1982)判别分析中连续变量和分类变量的混合:一种假设检验方法。生物统计学38:991-1002·Zbl 0539.62069号 ·doi:10.2307/2529879
[21] Little RJA,Rubin DB(1987),缺失数据的统计分析。纽约威利·Zbl 0665.62004号
[22] Little RJA,Schluchter MD(1985),具有缺失值的混合连续和分类数据的最大似然估计。生物特征72:492-512·Zbl 0609.62082号 ·doi:10.1093/biomet/72.3.497
[23] Little RJ,Rubin DB(2002),缺失数据的统计分析,第2版。纽约威利·Zbl 1011.62004号
[24] Liu C,Rubin DB(1998)混合类别和连续数据的一般位置模型的椭圆对称扩展。生物特征85:673-688·Zbl 0954.62071号 ·doi:10.1093/biomet/85.3.673
[25] Lopes HF,West M(2004),因子分析中的贝叶斯模型评估。统计Sin 14:41-67·兹比尔1035.62060
[26] Nguyen HT,Coomans D,Leermakers M,Boman J(1997)《越南人体接触煤中微量元素的多元统计分析》。in:SPRUCE IV,健康与环境统计方面国际会议,荷兰恩舍德(1997)
[27] Olkin I,Tate RF(1961)混合离散变量和连续变量的多元相关模型。数学统计年鉴32:448-465·Zbl 0113.35101号 ·doi:10.1214/aoms/1177705052
[28] Peng Y,Little RJA,Raghunathan TE(2004):从不符合和缺失值的数据中进行因果推断的扩展通用位置模型。生物计量学60:598-607·兹比尔1274.62046 ·doi:10.1111/j.0006-341X.2004.00208.x
[29] Poon WY,Lee SY(1987)多元多列和多列相关系数的最大似然估计。心理测量52:409-430·兹比尔062762060 ·doi:10.1007/BF02294364
[30] Punzo A,Ingrassia S(2013)关于使用广义线性指数聚类加权模型评估二元数据中的局部线性独立性。QdS J Methodol应用统计15:131-144
[31] Punzo A,Ingrassia S(2015)通过聚类加权模型对双变量混合型数据进行聚类。计算统计doi:10.1007/s00180-015-0600-z·Zbl 1347.65030号
[32] Rencher AC(1998)多元统计推断和应用。纽约威利·Zbl 0932.62065号
[33] Schafer JL(1997)不完全多元数据分析。纽约CRC出版社·兹比尔0997.62510 ·doi:10.1201/9781439821862
[34] Schwarz G(1978)估计模型的维数。Ann统计6:461-464·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[35] Smyth C,Coomans D,Everingham Y(2006)通过多元回归树在降维空间中聚类噪声数据。模式识别39:424-431·Zbl 1122.68563号 ·doi:10.1016/j.patcog.2005.09.003
[36] Subedi S、Punzo A、Ingrassia S、McNicholas PD(2013),通过聚类加权因子分析仪进行聚类和分类。高级数据分析类7:5-40·Zbl 1271.62137号 ·doi:10.1007/s11634-013-0124-8
[37] Subedi S、Punzo A、Ingrassia S、McNicholas PD(2015)基于稳健模型的聚类和降维的聚类加权t因子分析仪。统计方法应用24:623-649·Zbl 1416.62362号 ·doi:10.1007/s10260-015-0298-7
[38] Wu CFJ(1983)关于EM算法的收敛性。安统计11:95-103·Zbl 0517.62035号 ·doi:10.1214/aos/1176346060
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。