×

聚类微阵列数据之前筛选变量的简单方法。 (英语) Zbl 1453.62127号

总结:提出了一种简单且计算速度快的程序,用于在聚类分析之前筛选大量变量。依次考虑每个变量,将样本分为两组,使该变量的组间平方和与组内平方和的比值最大化,并测试该比值的实现值,以查看其是否显著大于从单一同质总体中划分样本时的预期值。然后在聚类分析中使用那些达到显著性的变量。建议使用蒙特卡罗计算程序评估显著性水平;通过假定群内正态性,导出了一个解析近似,但提倡谨慎使用。为分区和测试提供了计算细节。该程序应用于多个微阵列数据集,表明它通常可以快速简单地获得良好的结果。

MSC公司:

62-08 统计问题的计算方法
62H30型 分类和区分;聚类分析(统计方面)
62页第10页 统计学在生物学和医学中的应用;元分析

软件:

SigClust公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 布鲁斯科,M.J。;Cradit,J.D.,《(k)均值聚类的变量选择启发式》,《心理测量学》,66,249-270(2001)·Zbl 1293.62237号
[2] 德沃斯,J。;Thykjær,T。;塔特,K。;Ensslen,M。;雷诺德,P。;要求,G。;颗粒,F。;潘特斯科,V。;雷姆,T。;Jourdan,M。;罗西,J.-F。;Ørntoft,T。;Klein,B.,用寡核苷酸阵列比较恶性和正常血浆细胞的基因表达谱,癌基因,216848-6857(2002)
[3] 多诺霍,D。;Jin,J.,《更高批评阈值:有用特征稀少且较弱时的最佳特征选择》,《美国国家科学院学报》,105,14790-14795(2008)·兹比尔1357.62212
[4] Engleman,L。;Hartigan,J.A.,集群测试的百分点,美国统计协会杂志,64,1647-1648(1969)
[5] Everitt,B.S。;兰道,S。;Leese,M.,聚类分析(2001),阿诺德:阿诺德伦敦·Zbl 1205.62076号
[6] Fowlkes,E.B。;Gnanadesikan,R。;Kettering,J.R.,聚类中的变量选择,分类杂志,5205-228(1988)
[7] Golub,T.R。;Slonim,D.K。;Tamayo,P。;华德,C。;加森贝克,M。;梅西洛夫,J.P。;科勒,H。;Loh,M.L。;唐宁,J.R。;Caligiuri,医学硕士。;哥伦比亚特区布隆菲尔德。;Lander,E.S.,《癌症的分子分类:通过基因表达监测进行分类发现和分类预测》,《科学》,286531-537(1999)
[8] 休伯特,L。;Arabie,P.,比较分区,分类杂志,2193-218(1985)
[9] Kim,S。;Tadesse,M.G。;Vannucci,M.,通过Dirichlet过程混合模型进行聚类的变量选择,Biometrika,93,877-893(2006)·Zbl 1436.62266号
[10] 刘,Y。;海斯,D.N。;诺贝尔,A。;Marron,J.S.,高维低样本数据聚类的统计意义,美国统计协会杂志,103,1281-1293(2008)·Zbl 1205.62079号
[11] McLachlan,G.J。;比恩,R.W。;Peel,D.,基于混合模型的微阵列表达数据聚类方法,生物信息学,18413-422(2002)
[12] 斯坦利,D。;Brusco,M.J.,《初始化(k)-意味着批量聚类:几种技术的关键评估》,《分类杂志》,24,99-121(2007)·Zbl 1144.62331号
[13] Tadesse,M.G。;易卜拉欣,J.G。;Mutter,G.L.,《识别高密度寡核苷酸阵列中差异表达的基因以说明技术的量化限制》,《生物计量学》,59,542-554(2003)·Zbl 1210.62209号
[14] Tadesse,M.G。;Sha,北。;Vannucci,M.,高维数据聚类中的贝叶斯变量选择,美国统计协会杂志,100602-617(2005)·Zbl 1117.62433号
[15] Virtaneva,K。;Wright,F.A。;Tanner,S.M。;袁,B。;莱蒙·W·J。;Caligiuri,医学硕士。;哥伦比亚特区布隆菲尔德。;de la Chapelle,A。;Krahe,R.,表达谱分析揭示了具有孤立三体8和正常细胞遗传学的急性髓细胞白血病的基本生物学差异,美国国家科学院学报,98,1124-1129(2001)
[16] 威廉姆斯,W.T。;Lance,G.N.,(Enslein,K.;Ralston,A.;Wilf,H.S.,《分级分类方法》,《数字计算机统计方法》,第3卷(1977年),Wiley:Wiley New York),269-295·Zbl 0398.62050号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。