×

聚类微阵列数据中聚类数的确定。 (英语) Zbl 1074.62043号

摘要:微阵列数据聚类分析的一般目的是根据数据的接近程度将数据组织成有意义的组。尽管针对微阵列数据的聚类提出了各种算法,但主要困难仍然是确定最佳聚类数。为了使问题进一步复杂化,由于数据的模糊性,无法很好地定义有意义的组或亲密度。
本文提出了一个动态有效性指标来克服这一问题。除了动态方面之外,所建议的索引还考虑了集群的内部和相互关系。基于所提出的动态有效性指标和传统的K均值方法,提出了一种算法。为了使所提出的动态有效性指标更加灵活,引入了一个调制参数。此参数可用于处理噪声数据,并平衡簇中紧凑性和分离性之间的重要性。为了说明该方法的有效性,利用文献中的人类血清数据对一个数值算例进行了求解,并检验了该方法的敏感性和鲁棒性。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] M.Halkidi,Y.Batistakis,M.Vazirgiannis,聚类算法和有效性度量,收录于:SSDBM会议论文集,美国弗吉尼亚州,2001年7月。;M.Halkidi,Y.Batistakis,M.Vazirgiannis,《聚类算法和有效性度量》,载于《SSDBM会议论文集》,美国弗吉尼亚州,2001年7月·Zbl 0998.68154号
[2] S.Ray,R.H.Turi,《(K)均值聚类中聚类数的确定及其在彩色图像分割中的应用》,载于《第四届模式识别与数字技术进步国际会议论文集》(ICAPRDT’99),印度加尔各答,1999年12月27日至29日。;S.Ray,R.H.Turi,《(K)中聚类数的确定及其在彩色图像分割中的应用》,载于《第四届模式识别与数字技术进步国际会议论文集》(ICAPRDT’99),印度加尔各答,1999年12月27日至29日。
[3] Boudraa,A.-O.,《数据集中簇数的动态估计》,《电子快报》,35,19,1606-1608(1999)
[4] H.Sun,S.Wang,Q.Jiang,确定数据集中簇数的新验证指数,IJCNN’01,载于:国际神经网络联合会议,第3卷,2001年7月15日至19日,第1852-1857页。;H.Sun,S.Wang,Q.Jiang,确定数据集中簇数的新验证指数,IJCNN’01,收录于:国际神经网络联合会议,第3卷,2001年7月15日至19日,第1852-1857页。
[5] Dembele,D。;Kastner,P.,《微阵列数据聚类的模糊(C)均值法》,生物信息学,19,8,973-980(2003)
[6] Kwon,S.H.,模糊聚类的聚类有效性指数,《电子快报》,34,22,2176-2177(1998)
[7] 沈J.D.,张S.,李E.S.,大型数据库中模糊关联规则挖掘的模糊集生成,ANNIE 2002,美国圣路易斯,2002年11月。;沈J.D.,张S.,李E.S.,大型数据库中模糊关联规则挖掘的模糊集生成,ANNIE 2002,美国圣路易斯,2002年11月。
[8] Han,J。;Kamber,M.,《数据挖掘:概念和技术》(2000),摩根考夫曼出版社
[9] 黄忠,用混合数值和分类值聚类大数据集,载:《第一届亚太知识发现和数据挖掘会议论文集》,1997年,第21-34页。;黄忠,用混合数值和分类值对大型数据集进行聚类,载《第一届亚太知识发现和数据挖掘会议论文集》,1997年,第21-34页。
[10] 艾耶,V。;艾森,M。;罗斯博士。;舒勒,G。;摩尔,T。;Lee,J。;特伦特,J。;斯塔特,L。;哈德森,J。;博古斯基,M。;拉什卡里,D。;沙龙,D。;博茨坦,D。;Brown,P.,《人类成纤维细胞对血清反应的转录程序》,《科学》,283(1999)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。