×

兹马思-数学第一资源

基于模型的copula聚类及其应用。(英语) Zbl 06652996
摘要:大多数基于模型的聚类技术是基于多元正态模型及其变体的。本文将copula用于构造灵活的聚类模型族。与现有方法相比,在基于模型的聚类中使用copula有两个直接的优势:(i)适当选择copula可以为聚类获得一系列奇异的形状,并且(ii)明确选择聚类的边际分布允许以自然的方式对各种模式(离散或连续)的多元数据进行建模。本文介绍并研究了基于copula的有限混合模型在聚类应用中的框架。一般情况下的估计可以使用标准EM来执行,并且,根据数据的模式,可以提供更有效的程序来充分利用copula结构。讨论了边缘化条件下混合模型的闭包性质讨论了连续参数空间中参数的可辨识性,并讨论了参数在连续空间中的选择。方法论的阐述伴随着对真实数据和人工数据的分析。

理学硕士:
62-XX号 统计
PDF格式 BibTeX公司 引用
全文: 内政部
参考文献:
[1] 阿尔福,M;马鲁蒂,A;Trovato,G,内生选择性下多元计数的有限混合模型,统计计算,21,185-202,(2011)
[2] 安德鲁斯,伊利诺伊州;张建华,张建中,基于模型的聚类、分类和判别分析的混合t因子分析,J。统计计划。推论,1411479-1486,(2011年)·Zbl 1204.62098
[3] 班菲尔德,JD;Raftery,AE,基于模型的高斯和非高斯聚类,生物特征学,49803-821,(1993)·Zbl 0794.62034
[4] 贝德福德,T;Cooke,RM,Vines-一种新的相依随机变量图形模型,Ann。Stat.,301031-1068,(2002年)·Zbl 1101.62339
[5] Brechmann,E.C.,Schepsmeier,U.:用C-和d-维恩连接词建模相关性:r包cdvine。J。统计软件。52(3) ,1-27(2013年)·Zbl 1204.62098
[6] 布朗,R;李建民,张建中,基于模型的混合型数据聚类、分类与判别分析,J。统计计划。推断,1422976-2984,(2012年)·Zbl 1335.62093
[7] 塞勒克斯,G;高斯简约聚类模型,模式识别,28781-793,(1995)
[8] 迪安,N;Nugent,R,使用多元betas的混合物在单位超立方体中聚类学生技能集档案,高级数据分析。Classif.,7339-357,(2013年)·Zbl 1416.62334
[9] 拉西奥,FML;詹尼里尼,S,一种基于copula的发现相依观测模式的算法,J。第29、50-75页(2012年)·Zbl 1360.62250
[10] 方,H-B;方,K-T;Kotz,S,具有给定边缘的亚椭圆分布,J。多变量。《分析》,82,1-16,(2002年)·Zbl 1002.62016
[11] 福布斯,F;Wraith,D,一个新的具有可变尾重量边际量的多元重尾分布族:应用于稳健聚类,Stat.Comput.,24971-984,(2014)·Zbl 1332.62204号
[12] Fraley,C.,Raftery,A.E.,Murphy,T.B.,Scruca,L.:mclust版本4 for R:基于模型的聚类、分类和密度估计的正常混合建模。技术报告597,华盛顿大学统计系,西雅图(2012)·Zbl 1061.62198
[13] 弗赖斯施纳特,S;Pyne,S,单变量和多变量偏正态分布和偏态t分布有限混合的贝叶斯推断,生物统计学,11317-336,(2010)
[14] 基因,C;NešlehováJ.,《计数数据用连接词入门》,ASTIN Bull.,37475-515,(2007)·兹布1274.62398
[15] Genz,A.,Bretz,F.,Miwa,T.,Mi,X.,Leisch,F.,Scheipl,F.,Hothorn,T.:mvtnorm:多元正态分布和T分布。R程序包版本0.9-9996。http://cran.r-project.org/package=mvtnorm(2013年)·Zbl 0843.62016
[16] Hanson,A.J.:三维图形的旋转。在帕斯,A。W.W(编辑),图形宝石V,第二章,第55-64页,第二章,第2.4号,圣地亚哥学术出版社(1995年)
[17] 亨尼格,C,合并高斯混合成分的方法,高级数据分析。分类,4,3-34,(2010年)·Zbl 1306.62141
[18] 亨宁森,A;最大似然估计。Stat.,26443-458,(2011年)·Zbl 1304.65039
[19] Hofert,M.,Kojadinovic,I.,Maechler,M.,Yan,J.:copula:与copula的多元相关性。R包版本0.999-13(2015)
[20] 霍弗特,M;Mächler,M;张建明,高维阿基米德copulas在已知边界下的似然推断,J。多变量。《分析》,110133-150,(2012年)·Zbl 1244.62073
[21] 贾朱加,K;Pappla,D.基于模型的聚类中的Copula函数,第15期,606-613,(2006),柏林
[22] Joe,H,基于条件期望的多元正态矩形概率的逼近,J。是。统计协会,90957-964,(1995)·Zbl 0843.62016
[23] 多变量模型依赖于概念。查普曼霍尔有限公司,伦敦(1997年)·Zbl 0990.62517
[24] Johnson,N.,Kotz,S.,Balakrishnan,N.:多元离散分布。威利,纽约(1997年)·Zbl 0868.62048
[25] Jorgensen,M.使用多项式混合模型对互联网流量进行聚类,Aust。N。Z。J。Stat.,46205-218,(2004年)·Zbl 1061.62198
[26] 卡里斯,D;李建民,李建民,有限多元泊松混合物及其应用,J。统计计划。推论,1371942-1960,(2007)·Zbl 1116.60006
[27] 卡里斯,D;Santourian,A,基于模型的非椭圆等高线分布聚类,统计计算,19,73-83,(2009)
[28] 李,S;McLachlan,G,多元偏斜t-分布的有限混合:一些最新结果,Stat.Comput.,24181-202,(2014)·Zbl 1325.62107
[29] Lin,T.-I.,Ho,H.,Lee,C.-R.:使用多元偏态T正态分布的弹性混合模型。统计计算。24(4) ,531-546(2014年)·Zbl 1325.62113
[30] Marbac,M.,Biernacki,C.,Vandewalle,V.:混合数据的基于模型的高斯copula聚类。ArXiv电子印刷品(2014年)。arXiv:1405.1299·Zbl 1384.62198
[31] 麦克拉克兰,G.,皮尔,D.:有限混合模型。威利,纽约(2000年)·Zbl 0963.62061
[32] 麦克尼古拉斯,警局;墨菲,TB,简约高斯混合模型,统计计算,18285-296,(2008)
[33] 孟,X-L;鲁宾,DB,通过ECM算法的最大似然估计:一般框架,生物计量学,80267-278,(1993)·Zbl 0778.62022
[34] 莫里斯,K;McNicholas,P,基于模型的聚类中基于移动非对称拉普拉斯分布的降维,Stat.Probab。利特,832088-2093,(2013年)·Zbl 1282.62153
[35] Nelsen,R.:copulas简介,Springer系列统计,第2版,柏林,Springer(2006)·Zbl 1304.65039
[36] Panagiotelis,甲;查多,C;张建中,张国强,多元离散数据对copula的构造,J。是。统计协会,1071063-1072,(2012年)·Zbl 1395.62114
[37] R核心团队:R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳(2015年)·Zbl 1244.62073
[38] Robitsch,A.,Kiefer,T.,George,A.C.,Unlue,A.:CDM:认知诊断模型。R程序包版本2.6-13。http://cran.r-project.org/package=CDM(2014年)
[39] Vrac,M;比拉德,L;迪迪,E;蔡丁,A,混合模型的Copula分析,计算机。Stat.,27427-457,(2012年)·Zbl 1304.65087
[40] 齐默,D;崔维迪,P,用三变量copulas来模拟样本选择和治疗效果:应用于家庭卫生保健需求,J。公共汽车。经济。Stat.,24,63-72,(2006年)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。