×

利用全多维标度研究相异矩阵的K均值聚类行为。 (英语) Zbl 1477.62355号

摘要:在本文中,我们分析了当对象的维数未知时,多维缩放与在不同矩阵上执行(K)-均值聚类的有用性。在这种情况下,无法使用传统算法,因此直接根据观察到的差异矩阵执行K均值聚类过程,最初为双模数据集制定的用于确定簇数的标准的应用取决于它们在单模情况下可能的重新制定。研究了平方相异性的(K)均值聚类的线性不变性,以及多维标度的使用,以确定观测值的聚类隶属度,并解决了相异矩阵(K)中值聚类数的选择问题,我们分析了全维标度配置和与平方差异的适当转换相关的等效分区配置上的K均值聚类性能。进行了蒙特卡罗实验,将所研究的方法与直接适用于相异矩阵的程序获得的结果进行了比较。

MSC公司:

第62页,共15页 统计学在心理学中的应用
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 贝利,RA;Gower,JC,《近似对称矩阵》,《心理测量学》,55665-675(1990)·Zbl 0721.65018号 ·doi:10.1007/BF02294615
[2] Borg,I.&Groenen,P.J.F.(2005)。现代多维缩放。理论与应用,斯普林格统计学系列,第二版·Zbl 1085.62079号
[3] 布鲁斯科,MJ;Steinley,D.,最小组内平方和划分的启发式程序比较,《心理测量学》,72583-600(2007)·兹比尔1291.62196 ·文件编号:10.1007/s11336-007-9013-4
[4] Cailliez,F.,加法常数问题的解析解,《心理测量学》,48,2,305-308(1983)·Zbl 0534.62079号 ·doi:10.1007/BF02294026
[5] 卡林斯基,RB;Harabasz,J.,《聚类分析的枝晶方法》,《统计学通讯》,3,1-27(1974)·Zbl 0273.62010
[6] Chae,SS;杜宾,JL;Warde,WD,《使用rand统计预测集群数量的方法》,计算统计与数据分析,50,12,3531-3546(2006)·Zbl 1446.62176号 ·doi:10.1016/j.csda.2005.08.006
[7] 蒋,MM;Mirkin,B.,《K-means聚类中聚类数的智能选择:不同聚类扩散的实验研究》,《分类杂志》,27,3-40(2010)·Zbl 1337.62127号 ·doi:10.1007/s00357-010-9049-5
[8] Cilibrasi,R.和Vitanyi,P.(2004)。使用谷歌自动发现意思。技术报告(第1-31页)。阿姆斯特丹大学,澳大利亚国家信息通信技术学院。
[9] De Leeuw,J。;Groenen,PJF,逆多维标度,分类杂志,14,3-21(1997)·Zbl 0892.92028号 ·数字标识代码:10.1007/s003579900001
[10] De Leeuw J.和Heiser W.J.(1980)。具有配置限制的多维缩放。P.R.Krishnaiah(编辑),多元分析(第五卷,第501-522页)。霍兰德北部·Zbl 0468.62054号
[11] 德萨博,W。;JD卡罗尔;克拉克,L。;Green,P.,Synthesized clustering:一种将替代聚类基础与变量微分加权相结合的方法,《心理测量学》,49,57-78(1984)·Zbl 0594.62067号 ·doi:10.1007/BF02294206
[12] Duin R.P.(2012)。PR工具。http://www.prtools.org。
[13] Everitt,B.S.、Landau,S.、Leese,M.和Stahl,D.(2011年)。聚类分析。概率统计中的威利级数(第5版)。威利·Zbl 1274.62003年
[14] Feigenbaum,J。;Kannan,S。;McGregor,A。;苏里,S。;Zhang,J.,流模型中的图形距离,SIAM计算杂志,38,5,1709-1727(2008)·Zbl 1181.68153号 ·doi:10.1137/070683155
[15] 哈蒂根,J.A.(1975)。聚类算法。威利·Zbl 0372.62040号
[16] 哈蒂根,JA;Wong,MA,Algorithm AS 136:A\(K\)-均值聚类算法,应用统计学,28,100-108(1979)·Zbl 0447.62062号 ·doi:10.2307/2346830
[17] Hastie,T.、Tibshirani,R.和Friedman,J.(2009年)。统计学习的要素:数据挖掘、推理和预测。斯普林格·Zbl 1273.62005年
[18] WJ Heiser;Groenen,PJF,用簇内损失分量和模糊连续近似策略来避免局部极小值的簇差异缩放,《心理测量学》,62,1,63-83(1997)·Zbl 0889.92037号 ·doi:10.1007/BF02294781
[19] 休伯特,L。;Arabie,P.,比较分区,分类杂志,2193-218(1985)·doi:10.1007/BF01908075
[20] Jain,AK,《数据聚类:超越K-means 50年》,《模式识别字母》,31,8,651-666(2010)·doi:10.1016/j.patrec.2009.09.011
[21] Kak,S.,一类瞬时训练的神经网络,《信息科学》,14897-102(2002)·Zbl 1025.68069号 ·doi:10.1016/S0020-0255(02)00281-5
[22] Kaufman,L.和Rousseeuw,P.J.(1990)。在数据中寻找群体:聚类分析简介。威利·Zbl 1345.62009号
[23] WJ Krzanowski;Lai,YT,使用平方和聚类确定数据集中组数的标准,生物统计学,44,23-34(1985)·Zbl 0707.62122号 ·doi:10.2307/2531893
[24] 利希特诺尔,JF;EA亨德里克斯;Reinders,MJT,通过结合统计DTW和独立分类进行手语识别,IEEE模式分析和机器智能汇刊,30,112040-2046(2008)·doi:10.1109/TPAMI.2008.123
[25] Lingoes,JC,对称矩阵单调分析的一些边界条件,《心理测量学》,36195-203(1971)·Zbl 0222.15011号 ·doi:10.1007/BF02291398
[26] Lloyd,SP,PCM中的最小二乘量化,IEEE信息理论汇刊,281982,129-137(1982)·Zbl 0504.94015号 ·doi:10.1109/TIT.1982.1056489
[27] Mardia,KV,经典多维尺度的一些性质,统计学中的通信——理论和方法,7,13,1233-1241(1978)·兹比尔0403.62033 ·网址:10.1080/03610927808827707
[28] 马卡伦科夫,V。;Legendre,P.,《超度量树和加法树的最优变量加权和K-均值划分:方法和软件》,《分类杂志》,18,245-271(2001)·Zbl 1040.91087号 ·文件编号:10.1007/s00357-001-0018-x
[29] McQueen,J.(1967)。多元观测值分类和分析的一些方法。在第五届伯克利数理统计与概率研讨会上(第二卷,第281-297页)·Zbl 0214.46201号
[30] 梅利尼科夫,V。;陈,W-C;Maitra,R.,MixSim:用于模拟数据以研究聚类算法性能的R包,《统计软件杂志》,51,12,1-25(2012)·doi:10.18637/jss.v051.i12
[31] 米利根,GW;Cooper,MC,《确定数据集中簇数的程序检查》,《心理测量学》,50,159-179(1985)·doi:10.1007/BF02294245
[32] Pekalska,E。;帕克利克,P。;Duin,RP,《基于差异的分类的广义核方法》,《机器学习研究杂志》,2001年12月2日,第175-211页·Zbl 1037.68127号
[33] JO Ramsay,《多维标度数据的一些统计方法》,《皇家统计学会杂志》,A,145,285-312(1982)·Zbl 0487.62003号 ·doi:10.2307/2981865
[34] Schleif,FM,基于通用概率原型的矢量和邻近数据分类,神经计算,154208-216(2015)·doi:10.1016/j.neucom.2014.12.002
[35] Schleif,F.M.,Chen,H.&Tino,P.(2015)。具有线性代价的增量概率分类向量机。《IJCNN会议录》(2015年第卷)。
[36] AJ Schwarz,估算模型的维数,《统计年鉴》,第6461-464页(1978年)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[37] Sebastian,T.B.、Klein,P.N.和Kimia,B.B.(2001)。基于对齐的形状轮廓识别。在视觉形式国际研讨会上(第606-618页)。斯普林格·Zbl 0985.68538号
[38] Steinley,D.,(K)-意思是集群:半个世纪的综合,英国数学与统计心理学杂志,59,1-34(2006)·doi:10.1348/000711005X48266
[39] Steinley,D.,《(K)均值聚类中的稳定性分析》,英国数学与统计心理学杂志,61255-273(2008)·doi:10.1348/000711007X184849
[40] 斯坦利,D。;Brusco,MJ,Initializing\(K\)-表示批量聚类:几种技术的关键评估,《分类杂志》,24,99-121(2007)·Zbl 1144.62331号 ·doi:10.1007/s00357-007-0003-0
[41] 斯坦利,D。;Brusco,MJ,《在K-means聚类中选择聚类数》,《心理学方法》,16,3,285-297(2011)·doi:10.1037/a0023346
[42] 斯坦利,D。;Hubert,L.,《K-means聚类中的顺序约束解:甚至比全局最优更好》,《心理测量学》,73,4,647-664(2008)·Zbl 1284.62749号 ·doi:10.1007/s11336-008-9058-z网址
[43] 糖,加州;GM James,《发现数据集中的簇数:信息理论方法》,《美国统计协会杂志》,98,750-762(2003)·Zbl 1046.62064号 ·doi:10.1198/0162145000000666
[44] Takane,Y。;杨,F。;de Leeuw,J.,《非测量个体差异多维标度:具有最佳标度特征的交替最小二乘法》,《心理测量学》,42,7-67(1976)·Zbl 0354.92048号 ·doi:10.1007/BF02293745
[45] Tibshirani,R。;沃尔瑟,G。;Hastie,T.,通过缺口统计估算数据集中的簇数,英国皇家统计学会期刊B,63,411-423(2001)·Zbl 0979.62046号 ·数字对象标识代码:10.1111/1467-9868.00293
[46] Vera,JF,使用折刀法进行多维标度中的距离稳定性分析,英国数学与统计心理学杂志,70,25-41(2017)·兹比尔1410.62045 ·doi:10.1111/bmsp.12079
[47] 维拉,JF;Macías,R.,《单模差异数据的(K)均值框架中基于方差的聚类选择标准》,《心理测量学》,82,2,275-294(2017)·Zbl 1402.62144号 ·doi:10.1007/s11336-017-9561-1
[48] 维拉,JF;马西亚斯,R。;Angulo,JM,《基于空间约束的聚类差异缩放的过采样域非静态空间协方差结构估计》,《随机环境研究与风险评估》,22,95-106(2008)·Zbl 1169.62095号 ·doi:10.1007/s00477-006-0100-3
[49] 维拉,JF;马西亚斯,R。;Angulo,JM,非平稳空间协方差估计的具有空间约束的潜在类MDS模型,随机环境研究和风险评估,23,6,769-779(2009)·Zbl 1416.62294号 ·doi:10.1007/s00477-008-0257-z
[50] 维拉,JF;马西亚斯,R。;Heiser,WJ,《双向单模连续评分差异数据的潜在类多维标度模型》,《心理测量学》,74,2297-315(2009)·Zbl 1243.62146号 ·数字对象标识代码:10.1007/s11336-008-9104-x
[51] 维拉,JF;马西亚斯,R。;Heiser,WJ,双向双模偏好评级数据的双重潜在类展开模型,计算统计与数据分析,53,8,3231-3244(2009)·Zbl 1453.62228号 ·doi:10.1016/j.csda.2008.07.019
[52] 维拉,JF;马西亚斯,R。;Heiser,WJ,双向双模偏好评级数据的聚类差异展开,分类杂志,30,370-396(2013)·Zbl 1360.62358号 ·doi:10.1007/s00357-013-9144-5
[53] 维滕,DM;Tibshirani,R.,《聚类中特征选择的框架》,《美国统计协会杂志》,105,490,713-726(2010)·Zbl 1392.62194号 ·doi:10.1198/jasa.2010.tm09415
[54] Zhang,Y。;Mandziuk,J。;中国魁克;Goh,BW,基于曲率的集群数量确定方法,信息科学,415,414-428(2017)·doi:10.1016/j.ins.2017.05.024
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。