×

基于有限非参数ICA混合模型的聚类。 (英语) Zbl 1474.62264号

摘要:我们提出了一种新的非参数多元有限混合模型的扩展,去掉了标准的条件独立性假设,而引入了独立成分分析(ICA)结构。这一创新将非参数混合模型估计方法扩展到了明显违反条件独立性(此类模型中参数唯一可识别性的必要假设)的情况。我们根据惩罚平滑Kullback-Leibler距离构造了一个目标函数,并引入非线性平滑优化最小独立分量分析算法来优化该函数和估计模型参数。我们的算法不需要任何先验的标记观测;它可以用于多元环境中的完全无监督聚类问题。我们在R包icamix中实现了该算法的一个实用版本,该版本使用了FastICA算法。我们通过在无监督学习和图像处理中的几个应用来说明这种新方法。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62G07年 密度估算
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aeberhard S,Coomans D,De Vel O(1992)高维环境中分类器的比较。澳大利亚昆士兰北部詹姆斯·库克大学数学与统计系。技术报告92(02)
[2] Allman ES,Matias C,Rhodes JA(2009),具有许多观测变量的潜在结构模型中参数的可识别性。Ann Stat 37(6A):3099-3132·Zbl 1191.62003号
[3] Anandkumar A,Hsu D,Kakade SM(2012)混合模型和隐马尔可夫模型的矩方法。Mannor S,Srebro N,Williamson RC(eds)《第25届学习理论年会论文集》,第23卷,第33.1-33.34页。苏格兰爱丁堡PMLR
[4] Azzalini A,Torelli N(2007)通过非参数密度估计进行聚类。统计计算17(1):71-80
[5] Bajari P,Hahn J,Hong H,Ridder G(2011)离散选择模型有限混合的半参数估计及其在博弈论模型中的应用。国际经济评论52(3):807-824
[6] Banfield JD,Raftery AE(1993),基于模型的高斯和非高斯聚类。生物统计学803-821·Zbl 0794.62034号
[7] Benaglia T,Chauveau D,Hunter DR(2009)多元混合物中半参数和非参数估计的类EM算法。J计算图统计18(2):505-526
[8] Benaglia,T。;乔沃,D。;亨特博士;Hunter,DR(编辑);理查兹,DSP(编辑);Rosenberger,JL(ed.),非参数多变量混合的类EM算法中的带宽选择,15-27(2011),新加坡·Zbl 1414.62119号
[9] Bonhome S、Jochmans K、Robin J-M(2016a)《多元潜在结构模型的估计》。Ann Stat 44(2):540-563·Zbl 1381.62055号
[10] Bonhomme S,Jochmans K,Robin J-M(2016b)重复测量有限混合物的非参数估计。J R Stat Soc Ser B(统计方法)78(1):211-229·Zbl 1411.62079号
[11] Butucea C,Vandekerkhove P(2014)对称分布的半参数混合。扫描J统计41(1):227-239·Zbl 1349.62094号
[12] Chauveau D,Hunter DR,Levine M(2015)条件独立多元有限混合模型的半参数估计。统计调查9:1-31·Zbl 1307.62090号
[13] Cohen EA(1984)不和谐偏音对区间知觉的一些影响。音乐感知交叉J 1(3):323-349
[14] De Castro Y,Gassiat E,Lacour C(2016)非参数隐马尔可夫模型的最小极大自适应估计。J Mach学习研究17(1):3842-3884·Zbl 1419.62209号
[15] De Veaux RD(1989)线性回归混合。计算统计数据分析8(3):227-245·Zbl 0726.62109号
[16] Dempster AP,Laird NM,Rubin DB(1977)通过EM算法从不完整数据中获得最大似然。J R Stat Soc Ser B(Methodol)39(1):1-38·Zbl 0364.62022号
[17] Eddelbuettel D(2013)与Rcpp的无缝R和C++集成。纽约州施普林格·Zbl 1283.62001号
[18] Eddelbuettel D,François R(2011)Rcpp:无缝R和C++集成。J Stat Softw杂志40(8):1-18
[19] Eddelbuettel D,Sanderson C(2014)RcppArmadillo:使用高性能C++线性代数加速R。计算统计数据分析71:1054-1063·Zbl 1471.62055号
[20] Forina M、Leardi R、Armanino C、Lanteri S、Conti P、Princi P(1988)《Parvus:数据探索、分类和关联的可扩展程序包》。化学计量学杂志4(2):191-193
[21] Fraley C,Raftery AE(1998),多少簇?哪种聚类方法?通过基于模型的聚类分析回答。计算J 41(8):578-588·兹伯利0920.68038
[22] Fraley C、Raftery AE(2002),基于模型的聚类、判别分析和密度估计。美国统计学会杂志97(458):611-631·Zbl 1073.62545号
[23] Frühwirth-Schnatter S(2006)有限混合和马尔可夫切换模型。施普林格科学与商业媒体有限责任公司,纽约·兹比尔1108.62002
[24] Gassiat E,Cleynen A,Robin S(2016)有限状态空间非参数隐马尔可夫模型和应用中的推断。统计计算26(1):61-71·Zbl 1342.62141号
[25] Gassiat E,Rousseau J(2016)非参数有限平移隐马尔可夫模型和扩展。伯努利22(1):193-212·Zbl 1388.62243号
[26] Guglielmi A,Ieva F,Paganoni AM,Ruggeri F,Soriano J(2014)《医院内生存率不平衡情况下聚类和分类的半参数贝叶斯模型》。J R Stat Soc Ser C(应用统计)63(1):25-46
[27] Hall P,Zhou X-H(2003)多元混合物中成分分布的非参数估计。附录统计31(1):201-224·Zbl 1018.62021号
[28] Han B,Davis LS(2006),DNA微阵列数据的基于半参数模型的聚类。In:第18届模式识别国际会议(ICPR'06),第3卷,第324-327页
[29] Huang M,Li R,Wang S(2013)非参数混合回归模型。美国统计协会杂志108(503):929-941·Zbl 06224977号
[30] Hunter DR,Lange K(2004)MM算法教程。美国统计58(1):30-37
[31] Hunter DR,Young DS(2012),回归的半参数混合。非参数统计杂志24(1):19-38·Zbl 1241.62055号
[32] Hyvarinen A、Karhunen J、Oja E(2002)《独立成分分析》。螺柱通知控制11(2):205-207
[33] Lee T-W,Lewicki MS,Sejnowski TJ(1999a)图像处理的ICA混合模型。摘自:第六届神经计算程序联合研讨会,第79-86页
[34] Lee,T-W;勒维基,理学硕士;Sejnowski,TJ;MJ卡恩斯(编辑);Solla,SA(编辑);Cohn,DA(编辑),使用ICA的非高斯混合模型的无监督分类,第11期,508-514(1999),剑桥
[35] Lee T-W,Lewicki MS,Sejnowski TJ(2000)非高斯类无监督分类和盲信号分离中自动上下文切换的ICA混合模型。IEEE跨模式分析-马赫积分22(10):1078-1089
[36] Levine M,Hunter DR,Chauveau D(2011)多元混合物的最大平滑似然。生物特征98(2):403-416·Zbl 1215.62055号
[37] Li J,Ray S,Lindsay BG(2007)通过模式识别进行聚类的非参数统计方法。马赫学习研究杂志8(8):1687-1723·Zbl 1222.62076号
[38] Mallapragada PK,Jin R,Jain A(2010)聚类的非参数混合模型。In:结构、句法和统计模式识别。柏林施普林格,第334-343页
[39] McLachlan G,Peel D(2000)有限混合模型。纽约威利·兹比尔0963.62061
[40] Meng X-L,Rubin DB(1993)通过ECM算法的最大似然估计:一般框架。生物特征80(2):267-278·Zbl 0778.62022号
[41] Miettinen J、Taskinen S、Nordhausen K、Oja H(2015)第四矩和独立成分分析。统计科学30(3):372-390·兹比尔1332.62196
[42] Palmer JA、Makeig S、Kreutz-Delgado K、Rao BD(2008)ICA混合模型的牛顿法。摘自:2008年IEEE声学、语音和信号处理国际会议记录,第1805-1808页
[43] Peña D,Prieto FJ,Viladomat J(2010)峰度矩阵的特征向量是揭示集群结构的有趣方向。多变量分析杂志101(9):1995-2007·Zbl 1203.62114号
[44] R核心团队(2015)R:统计计算的语言和环境。奥地利维也纳R统计计算基金会
[45] Raykar VC,Yang C,Duraiswami R,Gumerov N(2005)高维高斯和的快速计算。马里兰大学技术报告
[46] Salazar A、Igual J、Safant G、Vergara L、Vidal A(2015)使用非高斯分布混合物的凝聚聚类的图像应用。摘自:2015年计算科学和计算智能国际会议论文集,第459-463页
[47] Salazar A、Vergara L、Serrano A、Igual J(2010)《学习独立成分分析仪混合物的一般程序》。图案识别43(1):69-85·Zbl 1191.68601号
[48] Shah CA、Arora MK、Varshney PK(2004)《高光谱数据的非监督分类:基于ICA混合模型的方法》。国际J遥感器25(2):481-487
[49] Tyler DE,Critchley F,Dümbgen L,Oja H(2009)不变量坐标选择(带讨论)。J R Stat Soc Ser B(统计方法)71(3):549-592·Zbl 1250.62032号
[50] Vandekerkhove P(2013)半参数混合回归模型的估计。非参数统计杂志25(1):181-208·Zbl 1297.62076号
[51] Vichi M(2008)将半参数聚类模型拟合到不同数据。高级数据分析分类2(2):121-161·兹比尔1306.62147
[52] Viele K,Tong B(2002)混合线性回归建模。统计计算12(4):315-330
[53] Wolfe JH(1963)《社会领域的对象聚类分析》。加利福尼亚大学博士论文
[54] Zhang W,Fan J,Sun Y(2009)聚类数据的半参数模型。Ann Stat 37(5A):2377-2408·Zbl 1173.62030号
[55] Zhu X,Hunter DR(2016)条件独立多元有限混合模型估计的理论基础。非参数统计杂志28(1):683-701·Zbl 1407.62245号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。