×

一种简单的基于模型的分类和聚类变量选择方法。 (英语。法语摘要) Zbl 1328.62388号

摘要:复制数据的聚类和分类通常使用经典技术来执行,这些技术不恰当地将数据视为未复制的,或者使用复杂的现代技术来执行计算要求很高。在本文中,我们介绍了一种基于“尖峰-停滞”混合模型的简单方法,该模型快速、自动,允许在单个框架中进行分类、聚类和变量选择,并且可以处理重复或不重复的数据。仿真结果表明,我们的方法与其他最近提出的方法相比,效果良好。这些想法通过应用于微阵列和代谢组数据来说明。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Bergé,HDclassif:A R package for model-based clustering and discriminant analysis of high dimensional data,Journal of Statistical Software 42 pp 1–(2012),HDclasif:基于模型的聚类和高维数据判别分析的R包
[2] Bhowmick,用于识别微阵列实验中差异表达的拉普拉斯混合模型,生物统计学7第630页–(2006)·Zbl 1170.62369号 ·doi:10.1093/biostatistics/kxj032
[3] Bickel,Fisher判别函数的一些理论,朴素贝叶斯,以及变量多于观测值时的一些替代方法,Bernoulli 10 pp 989–(2004)·Zbl 1064.62073号 ·doi:10.3150/bj/1106314847
[4] Booth,《使用目标函数和随机搜索进行聚类》,《皇家统计学会杂志》,B辑70,第119页–(2008)·Zbl 1400.62128号 ·文件编号:10.1111/j.1467-9868.2007.00629.x
[5] Chang,《在分离两个多元正态分布的混合物之前使用主成分》,《应用统计学》32,第267页–(1983)·Zbl 0538.62050号 ·doi:10.2307/2347949
[6] Claeskens,模型选择和模型平均(2008)·Zbl 1166.62001号 ·doi:10.1017/CBO9780511790485
[7] Dudoit,《使用基因表达数据进行肿瘤分类的鉴别方法比较》,《美国统计协会杂志》97 pp 77–(2002)·Zbl 1073.62576号 ·doi:10.1198/016214502753479248
[8] Everitt,聚类分析(2011)·兹比尔1274.62003 ·doi:10.1002/9780470977811
[9] 弗雷利,基于模型的聚类、判别分析和密度估计,《美国统计协会杂志》97 pp 611–(2002)·兹比尔1073.62545 ·doi:10.1198/016214502760047131
[10] 弗里德曼,探索性投影追求,《美国统计协会杂志》82页249–(1987)·Zbl 0664.62060号 ·doi:10.1080/01621459.1987.10478427
[11] George,《贝叶斯变量选择方法》,《中国统计》第7卷第339页–(1997)·Zbl 0884.62031号
[12] Ghahramani,因子分析仪贝叶斯混合变量推断。神经信息处理系统进展第449页–(2000)
[13] Gohlke,《早期气相色谱/质谱》,《美国质谱学会杂志》4第367页–(1993)·doi:10.1016/1044-0305(93)85001-E
[14] Golub,《癌症的分子分类:通过基因表达监测进行分类发现和分类预测》,《科学》286,第531页–(1999)·doi:10.1126/science.286.5439.531
[15] 绿色,可逆跳跃延迟拒绝Metropolis-Hastings,Biometrika 88 pp 1035–(2001)·Zbl 1099.60508号 ·doi:10.1093/biomet/88.4.1035
[16] Guo,基于高维模型聚类的成对变量选择,《生物统计学》66 pp 793–(2010)·Zbl 1203.62190号 ·doi:10.1111/j.1541-0420.2009.01341.x
[17] 霍尔,高维低样本数据的几何表示,《皇家统计学会杂志》,B辑67第427页–(2005)·兹比尔1069.62097 ·doi:10.1111/j.1467-9868.2005.00510.x
[18] Hand,《分类器技术与进步幻觉》,《统计科学》第21页第1页–(2006年)·兹比尔1426.62188 ·doi:10.1214/08834230600000060
[19] 汉德,白痴的贝叶斯——毕竟不是那么愚蠢吗?,《国际统计评论》69第385页–(2001年)·Zbl 1213.62010年
[20] Hastie,《统计学习的要素:数据挖掘、推断和预测》(2009年)·Zbl 1273.62005年 ·doi:10.1007/978-0-387-84858-7
[21] Heard,《与按蚊免疫反应有关的基因调控的定量研究:贝叶斯曲线层次聚类的应用》,《美国统计协会期刊》101第18页–(2006)·Zbl 1118.62368号 ·doi:10.1198/01621450050000187
[22] 海勒,《第22届国际机器学习会议论文集》,ACM(计算机协会)第297页–(2005)
[23] 考夫曼,《在数据中发现群体:聚类分析导论》(1990年)·Zbl 1345.62009号 ·doi:10.1002/9780470316801
[24] Kim,Dirichlet过程混合模型聚类中的变量选择,Biometrika 93 pp 877–(2006)·兹比尔1436.62266 ·doi:10.1093/biomet/93.4.877
[25] Lance,分类排序策略的一般理论。1:层次系统,《计算机杂志》第9卷第373页–(1967年)·doi:10.1093/comjnl/9.4.373
[26] Lau,基于贝叶斯模型的聚类程序,《计算统计与数据分析》,第16页,第526页–(2007年)
[27] McCulloch,广义、线性和混合模型(2001)
[28] McLachlan,基于混合模型的微阵列表达数据聚类方法,生物信息学18 pp 413–(2002)·doi:10.1093/bioinformatics/18.3.413
[29] McLachlan,有限混合模型(2000)·Zbl 0963.62061号 ·doi:10.1002/0471721182
[30] McNicholas,通过潜在高斯混合模型对微阵列表达数据进行基于模型的聚类,生物信息学26页2705–(2010)·doi:10.1093/bioinformatics/btq498
[31] Messerli,通过代谢物指纹快速分类拟南芥表型突变体,《植物生理学》143第1481页–(2007)·数字对象标识代码:10.1104/pp.106.090795
[32] 米切尔,线性回归中的贝叶斯变量选择(含讨论),《美国统计协会杂志》83页1023–(1988)·Zbl 0673.62051号 ·doi:10.1080/01621459.1988.10478694
[33] Pan,基于惩罚模型的聚类及其在变量选择中的应用,《机器学习研究杂志》,第8页,1145页–(2007年)·Zbl 1222.68279号
[34] Partovi Nia,带变量选择的高维贝叶斯聚类:R包bclust,《统计软件杂志》第47页第1页–(2012)
[35] Raftery,基于模型聚类的变量选择,《美国统计协会期刊》101第168页–(2006)·Zbl 1118.62339号 ·doi:10.1198/016214500000113
[36] 兰德,聚类方法评估的客观标准,《美国统计协会杂志》66页846–(1971)·doi:10.1080/01621459.1971.10482356
[37] Scholz,《代谢物指纹:通过独立成分分析检测生物特征》,《生物信息学》20页2447–(2004)·doi:10.1093/bioinformatics/bth270
[38] Tadesse,高维数据聚类中的贝叶斯变量选择,《美国统计协会杂志》100页602–(2005)·Zbl 1117.62433号 ·doi:10.1198/0162145000001565
[39] Wang,基于模型的高维聚类变量选择及其在微阵列数据中的应用,《生物计量学》64,第440页–(2008)·Zbl 1137.62041号 ·文件编号:10.1111/j.1541-0420.2007.00922.x
[40] Witten,聚类中特征选择的框架,《美国统计协会杂志》105 pp 713–(2010)·Zbl 1392.62194号 ·doi:10.1198/jasa.2010.tm09415
[41] 杨,聚类基因表达数据的主成分分析,生物信息学17 pp 763–(2001)·doi:10.1093/bioinformatics/17.9.763
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。