×

混合潜在特征分析器用于基于模型的分类数据聚类。 (英语) Zbl 1325.62122号

摘要:基于模型的连续数据聚类方法已被广泛应用。然而,基于模型的分类数据聚类方法不太规范。潜在类分析是基于模型的二元数据和/或分类数据聚类的常用方法,但由于假设的局部独立结构,在感兴趣的总体中估计的潜在类和组之间可能没有对应关系。混合潜在特征分析模型通过假设一个既依赖于一个分类潜在类又依赖于一个连续的潜在特征变量的分类反应变量模型,扩展了潜在类分析;离散潜在类适应群体结构,连续潜在特质适应群体内的依赖性。由于似然函数包含了一个不能用解析方法计算的积分,因此拟合潜在性状分析混合模型是一个潜在的困难。我们发展了一种用于拟合混合潜在性状模型的变分方法,这提供了一种有效的模型拟合策略。通过对美国国家长期护理调查(NLTCS)和美国国会投票数据的分析,证明了混合潜在特征分析模型。结果表明,该模型能产生直观的聚类结果,与单独的潜在类分析和潜在特征分析相比,该模型具有更好的拟合度。

理学硕士:

H3620小时 分类和区分;聚类分析(统计方面)
PDF格式 BibTeX公司 XML 引用

参考文献:

[1] Abramowitz,M.,Stegun,I.A.:带公式、图表和数学表格的数学函数手册,第9版。纽约多佛(1964)·Zbl 0171.38503
[2] 奥尔曼,E.S。;马蒂亚斯,C。;Rhodes,J.,具有多个观测变量的潜在结构模型中参数的可识别性,Ann.Stat.,373099-3132,(2009)·Zbl 1191.62003
[3] 安德鲁斯,J.L。;McNicholas,P.D.,基于模型的聚类、分类和多元分布混合判别分析:本征族统计计算。,1021-1029年(2012年)·Zbl 1252.62062
[4] 贝克,J。;麦克拉克伦,G。;Flack,L.,《因子分析与公共因子加载的混合:高维数据聚类和可视化的应用》,IEEE Trans。肛门模式。机器。内尔。,322298-1309,(2010年)
[5] Bartholomew,D.J.,分类数据的因子分析,J.R.Stat.Soc.B,42293-321,(1980)·Zbl 0471.62054
[6] Bartholomew,D.J.,Steele,F.,Moustaki,I.,Galbraith,J.:社会科学家多元数据的分析和解释。查普曼和霍尔,伦敦(2002)·Zbl 1033.62108号
[7] Bartholomew,D.J.,Knot,M.,Moustaki,I.:潜在变量模型和因子分析:统一方法,第3版。纽约威利(2011)·Zbl 1266.62040
[8] 比尔纳基,C。;塞勒克斯,G。;政府,G。;Langrognet,F.,基于模型的聚类和判别分析,MIXMOD软件,计算机。统计数据分析。,51587-600,(2006年)·Zbl 1157.62431
[9] 模式识别与机器学习。信息科学与统计学。斯普林格,纽约(2006)·Zbl 1107.68072
[10] 博克,R.D。;最大似然法,第46页,第4页,第4页
[11] 布林,S。;莫特瓦尼,R。;尤尔曼,J.D。;Tsur,S.,市场篮子数据的动态项集计数和隐含规则,SIGMOD Rec.,2655-264,(1997)
[12] 塞勒克斯,G。;Govaert,G.,高斯简约聚类模型,模式识别。,28781-793,(1995年)
[13] 国会季刊:第98届国会,第二届会议,第四卷编辑(1984年)·Zbl 1067.62550
[14] 迪安,N。;《潜在类分析变量选择》,安尼斯特统计数学。,第62期,第11-35页,(2010年)·Zbl 1422.62085
[15] 邓普斯特,A.P。;莱尔德,新墨西哥州。;Rubin,D.B.,《通过EM算法实现不完全数据的最大似然性》(与讨论),J.R.Stat.Soc.B.39,1-38,(1977)·Zbl 0364.62022
[16] Efron,B.,《标准误差的非参数估计:刀削法、自举法和其他方法》,生物计量学,68589-599,(1981)·Zbl 0487.62031
[17] Erosheva,E.A.:成员等级和潜在结构模型及其在残疾调查数据中的应用。卡内基梅隆大学统计系博士论文(2002)
[18] 埃罗舍瓦。;伯纳多,J.M.(编辑);Bayarri,M.J.(编辑);伯杰,J.O.(编辑);达维德,A.P.(编辑);赫克曼,D.(编辑);史密斯,A.F.M.(编辑);West,M.(ed.),《隶属度等级模型的贝叶斯估计》,牛津大学·Zbl 1044.62002
[19] 埃罗舍瓦。;Bozdogan,H.(ed.),部分成员模型及其在残疾调查数据中的应用,117-134,(2004),博卡拉顿
[20] 埃罗舍瓦。;费恩伯格,S.E。;Joutard,C.,《通过多元二元数据的个体水平混合模型描述残疾》,Ann.Appl。Stat.,1502-537,(2007年)·Zbl 1126.62101
[21] 费恩伯格,S.E。;赫尔什,P。;里纳尔多,A。;周,Y。;Gibilisco,P.(编辑);里科马格诺,E.(编辑);罗甘丁,M.(编辑);Wynn,H.(ed.),列联表潜在类模型中的最大似然估计,31-66,(2009),剑桥
[22] 弗雷利,C。;Raftery,A.E.,基于模型的聚类、判别分析和密度估计,J.Am。统计协会,97611-612,(2002年)·Zbl 1073.62545
[23] Frank,A.,Asuncion,A.:UCI机器学习知识库。加州大学信息与计算机科学学院,欧文(2010)。http://archive.ics.uci.edu/ml
[24] Ghahramani,Z.,Hinton,G.E.:因子分析混合的EM算法。技术代表CRG-TR-96-1,多伦多大学(1997年)·Zbl 0913.62105
[25] Goodman,L.A.,利用可识别和不可识别模型进行探索性潜在结构分析,生物计量学,61215-231,(1974)·Zbl 0281.62057
[26] 哈古,A。;Qu,Y.随机效应潜在类模型的生物医学应用,应用。Stat.,47603-616,(1998年)·Zbl 0913.62105
[27] 贾科拉,T.S。;Jordan,M.I.,贝叶斯逻辑回归模型的变分方法及其扩展,(1996)
[28] 卡里斯,D。;Santourian,A.,基于模型的非椭圆等高分布聚类,统计计算。,19,73-83,(2008年)
[29] Lin,T.I.,使用多元偏态分布的稳健混合模型,统计计算。,20343-356,(2010年)
[30] 林,T.I。;李,J.C。;Yen,S.Y.,使用偏正态分布的有限混合模型,Stat.Sin。,17909-927,(2007年)·Zbl 1133.62012
[31] 麦克拉克伦,G。;软剥离算法。,4,1-14,(1999年)
[32] 麦克拉克兰,G.,皮尔,D.:有限混合模型。威利级数在概率与统计:应用概率与统计学。Wiley Interscience,纽约(2000)·Zbl 0963.62061
[33] 麦克拉克伦,G。;皮尔,D。;Bean,R.,《利用因子分析仪的混合建模高维数据》,计算机。统计数据分析。,41379-388,(2003年)·Zbl 1256.62036
[34] 麦克尼古拉斯,P.D。;墨菲,T.B.,简约高斯混合模型,统计计算。,18285-296,(2008年)
[35] 麦克尼古拉斯,P.D。;Murphy,T.B.,通过潜在高斯混合模型对微阵列表达数据进行基于模型的聚类,生物信息学,262705-2712,(2010)·Zbl 1203.82150号
[36] 穆森,B。;马库利德斯,G.A.(编辑);Schumaker,R.E.(编辑),《潜在变量混合模型》,1-33,(2001),Mahwah
[37] Pauler,D.K.,正态线性模型的Schwarz准则和相关方法,生物计量学,85,13-27,(1998)·Zbl 1067.62550
[38] Qu,Y。;谭,M。;Kutner,M.H.,用于评估诊断测试准确性的潜在类分析中的随机效应模型,生物特征学,52797-810,(1996)·Zbl 0875.62551
[39] 拉夫特瑞,A.E。;牛顿,文学硕士。;萨塔戈潘,J.M。;Krivitsky,P.N.,《使用调和平均同一性通过后验模拟估计综合可能性》,第8期,1-45期,(2007),牛津大学·Zbl 1252.62038
[40] Rasch,G.:数学心理学研究:I.一些智力和成就测试的概率模型。尼尔森和莱迪希,牛津(1960)
[41] Rost,J.,潜在类中的Rasch模型:两种项目分析方法的整合,应用。心理学。措施。,14271-282,(1990年)
[42] 罗斯特,J。;戴维斯,M;费舍尔,G.H.(编辑);Molenaar,I.W.(编辑),《混合分布拉什模型》,257-268,(1995年),纽约·Zbl 0825.62926
[43] 医学博士萨梅尔。;莱恩,L.M。;Legler,J.M.,混合离散和连续结果的潜在变量模型,J.R.Stat.Soc.B,59667-678,(1997)·Zbl 0889.62043
[44] Schlimmer,J.C.:通过表征调整获得概念。加州大学欧文分校信息与计算机科学系博士论文(1987)·Zbl 0471.62054
[45] Schwarz,G.,估计模型的维数,Ann.Stat.,6461-464,(1978)·Zbl 0379.62005
[46] Steele,R.J.:有限混合模型和多重插补的实用重要抽样方法。华盛顿大学博士论文(2002年)
[47] Tipping,M.E.,高维二进制数据的概率可视化,592-598,(1999),剑桥
[48] Uebersax,J.S.,用二分法或有序范畴测度进行潜在类分析:条件独立/依赖模型,应用。心理学。措施。,23283-297,(1999年)
[49] Vermunt,J.,多级混合项目反应理论模型:在教育测试中的应用,荷兰沃尔堡
[50] 弗蒙特,J。;马格森,J。;Ark,A.V.(编辑版);克罗恩,文学硕士(编辑版);Sijtsma,K.(编辑),《分类指标的因子分析:传统和潜在类方法的比较》,41-62,(2005),Mahwah
[51] Vermunt,J.,Magidson,J.:LG语法用户指南:潜在黄金4.5语法模块手册。贝尔蒙特统计创新公司(2008)
[52] 戴维斯,M。;山本,K。;戴维斯,M.(编辑);Carstensen,C.H.(编辑),《混合分布和混合拉什模型》,99-115,(2007),纽约
[53] 戴维斯,M。;罗斯特,J。;卡斯滕森,C.H。;戴维斯,M.(编辑);Carstensen,C.H.(编辑),《导论:扩展拉什模型》,1-12,(2007),纽约
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。