×

用于拟合INDCLUS模型的块松弛方法。 (英语) Zbl 1360.62363号

摘要:INDCLUS模型是一个著名的聚类模型,用于表示(I次I次J次)数据块,其中(J次)前片由逐对象相似矩阵组成。该模型意味着将(I)对象分组为预先指定数量的重叠簇,每个簇具有特定于切片的正权重。通过最小化最小二乘损失函数,将INDCLUS模型拟合到给定的数据集。这个损失函数的最小化似乎是一个难题,为此提出了几种算法策略。目前,可用的最佳选择似乎是SYMPRES算法,该算法通过块释放算法将损失函数最小化。然而,据推测,SYMPRES存在严重的局部最优问题。作为一种出路,基于优化设计块释放算法的理论结果,提出了五种可选的块释放算法。在模拟研究中,具有重叠参数子集的替代算法表现最佳,在优化性能和集群恢复方面明显优于SYMPRES。

MSC公司:

62H30型 分类和歧视;聚类分析(统计方面)
2015年1月62日 贝叶斯推断
62J05型 线性回归;混合模型
第62页,共15页 统计学在心理学中的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] ARABIE,P.和CARROLL,J.D.(1980),“MAPCLUS:拟合ADCLUS模型的数学规划方法”,《心理测量学》,45,211–235·Zbl 0437.62059号 ·doi:10.1007/BF02294077
[2] BAKEMAN,R.(2005),“重复措施设计的推荐效应大小统计”,行为研究方法,37,379-384·doi:10.3758/BF03192707
[3] BRO,R.和DE JONG,S.(1997),“快速非负约束最小二乘算法”,《化学计量学杂志》,第11393–401页·doi:10.1002/(SICI)1099-128X(199709/10)11:5<393::AID-CEM483>3.0.CO;2升
[4] CARROLL,J.D.和ARABIE,P.(1983),“INDCLUS:ADCLUS模型和MAPCLUS算法的个体差异概括”,《心理测量学》,48,157-169·doi:10.1007/BF02294012
[5] CEULEMANS,E.、VAN MECHELEN,I.和LEENEN,I(2007),“层次类分析中的局部极小问题:模拟退火算法和各种多重启动程序的评估”,《心理测量学》,72,377–391·兹比尔1286.62102 ·doi:10.1007/s11336-007-9000-9
[6] CHATURVEDI,A.和CARROLL,J.D.(1994年),“拟合INDCLUS和广义INDCULS模型的交替组合优化方法”,《分类杂志》,11,155-170·Zbl 0825.62539号 ·doi:10.1007/BF01195676
[7] COHEN,J.(1960),“名义量表的一致系数”,《教育与心理测量》,第20、37–46页·doi:10.1177/001316446002000104
[8] DE LEEUW,J.(1994),“统计中的块松弛算法”,载于《信息系统与数据分析》,H.H.Bock,W.Lenski和M.M.Richter编辑,柏林:Springer-Verlag,第308-325页·Zbl 0829.65144号
[9] DEPRIL,D.、VAN MECHELEN,I.和MIRKIN,B.G.(2008),“矩形数据表的加性聚类算法”,计算统计与数据分析,52,4923–4938·Zbl 1452.62439号 ·doi:10.1016/j.csda.2008.04.014
[10] DHILLON,I.S.、GUAN,Y.和KOGAN,J.(2002),“在高维文本数据中细化聚类”,摘自:第二届SIAM国际数据挖掘会议上聚类高维数据及其应用研讨会论文集,I.S.DHILLON编辑,J.KOGAN,SIAM 2002,第71–82页。
[11] GELMAN,A.、CARLIN,J.B.、STERN,H.S.和RUBIN,D.B.(1995),贝叶斯数据分析,伦敦:查普曼和霍尔出版社。
[12] GOODMAN,J.和SOKAL,A.D.(1989),“多重网格蒙特卡罗方法:概念基础”,《物理评论》D,40,2035–2071·doi:10.1103/PhysRevD.40.2035
[13] HARSHMAN,R.A.和LUNDY,M.E.(1984),《PARAFAC模型》,载于《多模数据分析的研究方法》,H.G.Law、C.W.Snyder,Jr.、J.A.Hattie和R.P.McDonald编辑,纽约:Praeger,第122–215页。
[14] KIERS,H.A.L.(1997),“用于拟合ADCLUS和INDCLUS模型的SINDCLUS算法的修改”,《分类杂志》,第14期,第297–310页·Zbl 0900.92187号 ·数字标识代码:10.1007/s003579900014
[15] LARSEN,B.和AONE,C.(1999),“使用线性时间文档聚类进行快速有效的文本挖掘”,载于:第五届ACM SIGKDD会议记录,加利福尼亚州圣地亚哥,第16-22页。
[16] LAWSON,C.L.和HANSON,R.J.(1974),《解决最小二乘问题》,新泽西州恩格尔伍德克利夫斯:普伦蒂斯·霍尔公司·Zbl 0860.65028号
[17] MILLIGAN,G.W.(1980),“六种类型的误差扰动对十五种聚类算法的影响的检验”,Psycholometrika,45325-342·doi:10.1007/BF02293907
[18] MIRKIN,B.G.(1987),“主要集群的方法”,《自动化和远程控制》,第10期,第131-143页·兹比尔0643.62047
[19] MIRKIN,B.G.(1990),“线性数据分析模型的顺序拟合程序”,《分类杂志》,第7期,第167-195页·Zbl 0727.62065号 ·doi:10.1007/BF01908715
[20] MIRKIN,B.G.(1996),《数学分类和聚类(非凸优化及其应用)》,波士顿-多德勒支:克鲁沃学术出版社·Zbl 0874.90198号
[21] ROBERTS,G.O.和SAHU,S.K.(1997),“吉布斯采样器的更新方案、相关结构、阻塞和参数化”,《皇家统计学会期刊:B辑》,59,291–317·Zbl 0886.62083号 ·数字对象标识代码:10.1111/1467-9868.00070
[22] SCHEPERS,J.、VAN MECHELEN,I.和CEULEMANS,E.(2006),“三模式划分”,计算统计与数据分析,511623-1642·Zbl 1157.62447号 ·doi:10.1016/j.csda.2006.06.002
[23] SEEWALD,W.(1992),“贝叶斯推断中参数化问题的讨论(S.E.Hills和A.F.M.Smith)”,载于:贝叶斯统计学4,编辑J.M.Bernardo、J.O.Berger、A.P.Dawid和A.F.M.Smish,牛津:牛津大学出版社,第241-243页。
[24] SHEPARD,R.N.和ARABIE,P.(1979),“加性聚类:相似性作为离散重叠特性组合的表示”,《心理学评论》,86,87–123·doi:10.1037/0033-295X.86.2.87
[25] SMITH,A.F.M.和ROBERTS,G.O.(1993),《通过吉布斯采样器和相关马尔可夫链蒙特卡罗方法进行贝叶斯计算》,《皇家统计学会杂志:B辑,55,3–23》·Zbl 0779.62030号
[26] STEINBACH,M.、KARYPIS,G.和KUMAR,V.(2000),“文档聚类技术的比较”,摘自:第六届ACM SIGKDD会议论文集,世界文本挖掘会议,马萨诸塞州波士顿。
[27] TEN BERGE,J.M.F.和KIERS,H.A.L.(2005),“两种方法拟合INDCLUS模型的比较”,《分类杂志》,22,273–286·Zbl 1336.62202号 ·doi:10.1007/s00357-005-0017-4
[28] TUKEY,J.W.(1953),“多重比较问题”,Mimeographed专著。
[29] TVERSKY,A.(1977),“相似性特征”,《心理学评论》,第84、327–352页·doi:10.1037/0033-295X.84.4.327
[30] WILDERJANS,T.F.、CEULEMANS,E.、VAN MECHELEN,I.和VAN DEN BERG,R.A.(2011),“不同噪声量下耦合数据矩阵的同步分析”,英国数学与统计心理学杂志,64,277–290·doi:10.1348/000711010X513263
[31] WILDERJANS,T.F.、CEULEMANS,E.和VAN MECHELEN,I.(2009),“大小不同的耦合数据块的同时分析:两种加权方案的比较”,计算统计与数据分析,53,1086–1098·Zbl 1452.62870号 ·doi:10.1016/j.csda.2008.09.031
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。