×

聚类数据中变量选择的惩罚因子混合分析。 (英语) Zbl 1453.62094号

摘要:提出了一种基于模型的聚类方法,该方法在上下文中执行降维和变量选择。通过假设数据由线性因子模型生成,潜在变量建模为高斯混合,从而实现降维。变量选择是通过使用惩罚似然法和L1惩罚收缩因子载荷来执行的。提出了一种基于EM算法的最大似然估计方法,并给出了选择惩罚参数的改进BIC准则。通过蒙特卡罗模拟研究和一个实际例子,探讨了该模型的有效性。

MSC公司:

62-08 统计问题的计算方法
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Baek,J.,McLachlan,G.J.,2008年。因子分析器与公共因子加载的混合,用于高维数据的聚类和可视化。技术报告NI08018-SCH。剑桥大学艾萨克·牛顿数学科学研究所预印本系列;Baek,J.,McLachlan,G.J.,2008年。因子分析器与公共因子加载的混合,用于高维数据的聚类和可视化。技术报告NI08018-SCH。剑桥大学艾萨克·牛顿数学科学研究所预印本系列
[2] Banfield,J.D。;Raftery,A.E.,基于模型的高斯和非高斯聚类,生物统计学,49,803-821(1993)·Zbl 0794.62034号
[3] Celeux,G。;Govaert,G.,高斯简约聚类模型,模式识别,28781-793(1995)
[4] 库曼斯,D。;Jonckheer,M。;马萨特,D.L。;布罗卡特,I。;Block,P.,线性判别分析在甲状腺疾病诊断中的应用,分析。奇米卡。Acta,103409-415(1978年)
[5] 新墨西哥州登普斯特。;Laird,A.P。;Rubin,D.B.,《通过EM算法从不完整数据中获得最大似然(带讨论)》,英国皇家统计学会杂志B,39,1-38(1977)·Zbl 0364.62022号
[6] 范,J。;Li,R.,《基于非一致惩罚似然的变量选择及其预言性质》,美国统计协会杂志,961348-1360(2001)·Zbl 1073.62547号
[7] 弗雷利,C。;Raftery,A.E.,多少簇?哪些聚类方法?基于模型的聚类分析的答案,《计算机杂志》,41,578-588(1998)·Zbl 0920.68038号
[8] 弗雷利,C。;Raftery,A.E.,MCLUST:基于模型的聚类分析软件,分类杂志,16(1999),297-206·Zbl 0951.91500号
[9] 弗雷利,C。;Raftery,A.E.,基于模型的聚类、判别分析和密度估计,美国统计协会杂志,97,611-631(2002)·Zbl 1073.62545号
[10] Fraley,C.,Raftery,A.E.,2002年。MCLUST:基于模型的聚类、判别分析和密度估计软件。华盛顿大学统计系第415号技术报告;Fraley,C.,Raftery,A.E.,2002年。MCLUST:用于基于模型的聚类、判别分析和密度估计的软件。华盛顿大学统计系第415号技术报告·Zbl 1073.62545号
[11] 弗雷利,C。;Raftery,A.E.,用于基于模型的聚类、判别分析和密度估计的增强软件:MCLUST,分类杂志,20,263-286(2003)·Zbl 1055.62071号
[12] Z.Ghahramani,G.E.希尔顿,1997年。混合因子分析仪的EM算法,加拿大多伦多大学计算机科学系技术报告CRG-TR-96-1;Z.Ghahramani,G.E.希尔顿,1997年。混合因子分析仪的EM算法,技术报告CRG-TR-96-1,加拿大多伦多大学计算机科学系
[13] Hoff,P.D.,二元序列的子集聚类,及其在基因组异常数据中的应用,生物统计学,611027-1036(2005)·兹比尔1087.62125
[14] 休伯特,L。;Arabie,P.,比较分区,分类杂志,2193-218(1985)
[15] 亨特·D·R。;Li,R.,使用MM算法的变量选择,《统计年鉴》,331617-1642(2005)·Zbl 1078.62028号
[16] Khalili,A。;Chen,J.,回归模型有限混合中的变量选择,美国统计协会杂志,1021025-1038(2007)·Zbl 1469.62306号
[17] Liu,J.S。;张建林。;Palumbo,M.J。;Lawrence,C.E.,带变量和转换选择的贝叶斯聚类(带讨论),贝叶斯统计,7,249-275(2003)
[18] 麦克拉克伦,G.J。;Peel,D.,有限混合模型(2000),John Wiley&Sons INC.:John Willey&Sons INC.纽约·Zbl 0963.62061号
[19] 麦克拉克伦,G.J。;皮,D。;Bean,R.W.,《利用因子分析仪混合建模高维数据》,计算统计与数据分析,41,379-388(2003)·Zbl 1256.62036号
[20] 医学博士麦克尼古拉斯。;Murphy,T.B.,简约高斯混合模型,统计与计算,18,285-296(2008)
[21] Montanari,A.,Viroli,C.,2006年。回归模型的降维混合。KNEMO电子会议记录,知识提取和建模,2006年,Anacapri;Montanari,A.,Viroli,C.,2006年。回归模型的降维混合。KNEMO电子会议记录,知识提取和建模,2006年,阿纳卡普里·Zbl 1207.62145号
[22] Montanari,A.,Viroli,C.,2009年。异方差因子混合分析。《统计建模:国际期刊》(即将出版);Montanari,A.,Viroli,C.,2009年。异方差因子混合分析。《统计建模:国际期刊》(即将出版)
[23] 潘·W。;Shen,X.,基于惩罚模型的聚类及其在变量选择中的应用,机器学习研究杂志,81145-1164(2007)·Zbl 1222.68279号
[24] R开发核心团队2008。R: 统计计算语言与环境,R统计计算基金会,奥地利维也纳。网址:网址:http://www.R-project.org; R开发核心团队2008。R: 统计计算语言与环境,R统计计算基金会,奥地利维也纳。网址:网址:http://www.R-project.org
[25] Raftery,A.E。;Dean,N.,基于模型聚类的变量选择,《美国统计协会杂志》,101,168-178(2006)·Zbl 1118.62339号
[26] Schwarz,G.,估算模型的维度,《统计年鉴》,第6461-464页(1978年)·Zbl 0379.62005年
[27] Tibshirani,R.,《通过拉索进行回归收缩和选择》,《皇家统计学会期刊》B,58267-288(1996)·Zbl 0850.62538号
[28] 倾翻,T.E。;Bishop,C.M.,概率主成分分析仪的混合,神经计算,11,443-482(1999)
[29] Yoshida,R.,Higuchi,T.,Imoto,S.,2004年。基因表达数据中用于降维和组结构提取的混合因子模型。2004年IEEE计算系统生物信息学会议论文集,第161-172页;Yoshida,R.,Higuchi,T.,Imoto,S.,2004年。基因表达数据中用于降维和组结构提取的混合因子模型。摘自:2004年IEEE计算系统生物信息学会议记录,第161-172页
[30] 吉田,R。;Higuchi,T。;Imoto,S。;Miyano,S.,ArrayCluster:基因表达谱聚类、数据可视化和模型发现的分析工具,生物信息学,221538-1539(2006)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。