×

K-means聚类中加权变量的D-最优性准则。 (英语) Zbl 1293.62136号

总结:本研究的目的是如何通过给(m)聚类变量(Z{1},dots,Z{m})赋权,获得最佳的K-means聚类结构,从而使所发现的(K)组在组内一致性方面显示出更有意义。我们建议将Wilks的lambda作为可变权重(w{1},dots,w{m})最小化的准则。这个准则,即平方和叉积矩阵簇内和的行列式与平方和叉乘矩阵簇间和的行列式之比,等效于优化设计理论中的D-最优性准则,并与簇平均值同时置信区体积的最小化有关。我们将给出此类K-means聚类的计算算法和数值示例,其中一个是模拟的,两个是真实的,另一个是添加了额外模拟噪声变量的真实数据集。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62K20型 响应面设计

软件:

LBFGS-B型
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 伯德·R·H。;卢,P。;Nocedal,J。;Zhu,C.,边界约束优化的有限内存算法,SIAM科学计算杂志,16,1190-1208(2005)·Zbl 0836.65080号
[2] Desarbo,W.S。;卡罗尔·J·D。;洛杉矶克拉克。;Green,P.E.,《综合聚类:一种将聚类基础与微分加权变量合并的方法》,《心理测量学》,49,57-78(1984)·Zbl 0594.62067号
[3] 黄,J,Z。;Ng,M.K。;荣,H。;Li,Z.,K-means类型聚类中的自动变量加权,IEEE模式分析和机器智能汇刊,27657-667(2005)
[4] 嗯,M。;Lim,Y.B.,《K均值聚类中的加权变量》,《应用统计学杂志》,36,67-78(2009)·Zbl 1473.62221号
[5] 马卡伦科夫,V。;Legendre,P.,《超度量树和加法树的最优变量加权和K-均值划分:方法和软件》,《分类杂志》,18,245-271(2001)·Zbl 1040.91087号
[6] Modha,D.S。;Spangler,W.S.,K-means聚类中的特征权重,机器学习,52,217-237(2003)·Zbl 1039.68111号
[7] Myers,R.H。;Montgomery,D.C.,响应面方法(2002),John Wiley&Sons:John Willey&Sons New York·Zbl 1161.62393号
[8] Steinley,D.,《K-means聚类:半个世纪的综合》,《英国数学与统计心理学杂志》,59,1-34(2006)
[9] 斯坦利,D。;Brusco,M.J.,《K均值聚类分析的新变量加权和选择程序》,《多元行为研究》,43,77-108(2008)
[10] 斯坦利,D。;Brusco,M.J.,《聚类分析中变量的选择:八种程序的实证比较》,《心理测量学》,73125-144(2008)·Zbl 1143.62327号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。