×

三元差异数据的结构分类分析。 (英语) Zbl 1337.62140号

摘要:本文提出了一种对三元相异数据进行分类的方法,这些数据是通过对由两阶约束距离矩阵之和定义的对象进行少量一致分类来重建的,以识别划分和索引层次。具体地说,相异矩阵被划分为同构类,并且在每个类中,一个分区和一个索引层次被同时拟合。该模型被数学形式化为一个约束混合整数二次型问题,以最小二乘法进行拟合,并提出了一种计算效率高的交替最小二乘算法。本文还描述了该方法的两个应用,并进行了广泛的仿真,以研究该算法的性能。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] ASUNCION,A.和NEWMAN,D.J.(2007),UCI机器学习库,网址:http://www.ics.uci.edu/\(\sim\)mlearn/MLRepository.html,加利福尼亚州欧文:加利福尼亚大学信息与计算机科学学院。
[2] CARROLL,J.D.和ARABIE,P.(1983),“ADCLUS模型和MAPCLUS算法的个体差异概括”,《心理测量学》,48,157-169·doi:10.1007/BF02294012
[3] DE SOETE,G.(1984),“将超长树拟合到相异矩阵的最小二乘算法”,模式识别快报,2133–137·doi:10.1016/0167-8655(84)90020-5
[4] FERN,X.Z.和BRODLEY,C.E.(2003),“高维数据聚类的随机投影:集群集成方法”,载于第20届国际机器学习会议论文集,ICML,华盛顿特区,第186–193页。
[5] FRED,A.L.和JAIN,A.K.(2003),“稳健数据聚类”,《IEEE计算机学会计算机视觉和模式识别会议论文集》,美国CVPR。
[6] GORDON,A.D.(1999),《分类》(第二版),佛罗里达州博卡拉顿:查普曼;霍尔/CRC。
[7] GORDON,A.D.和VICHI,M.(1998),“分区的划分”,《分类杂志》,第15期,第265–285页·Zbl 0912.62072号 ·doi:10.1007/s003579900034
[8] GORDON,A.D.和VICHI,M.(2001),“拟合一组分割的模糊分割模型”,《心理测量学》,66(2),229-248·Zbl 1293.62243号 ·doi:10.1007/BF02294837
[9] HUBERT,L.和ARABIE,P.(1985年),“比较划分”,《分类杂志》,第2期,193–218页·Zbl 0587.62128号 ·doi:10.1007/BF01908075
[10] HUBERT,L.和ARABIE,P.(1994),“通过具有(反)Robinson形式的矩阵和分析邻近矩阵”,英国数学与统计心理学杂志,47,1-40·Zbl 0825.92156号 ·doi:10.1111/j.2044-8317.1994.tb01023.x
[11] HUBERT,L.、ARABIE,P.和MEULMAN,J.(1998),“通过强反游标矩阵或循环强反游说矩阵对邻近矩阵的图论表示”,《心理测量学》,63(4),341-358·Zbl 1291.62215号 ·doi:10.1007/BF02294859
[12] KAUFMAN,L.和ROUSSEEUW,P.J.(2005),《在数据中寻找群体》。《聚类分析导论》,纽约:John Wiley&儿子们·Zbl 1345.62009号
[13] KOIVISTO,M.和SOOD,K.(2004),“贝叶斯网络中的精确贝叶斯结构发现”,《机器学习研究杂志》,第5549–573页·Zbl 1222.68234号
[14] MACQUEEN,J.B.(1967),“多元观测分类和分析的一些方法”,《第五届伯克利数理统计与概率研讨会论文集》,第1卷,统计学,L.M.Le Cam和J.Neyman编辑,伯克利:加州大学出版社,第281-297页·Zbl 0214.46201号
[15] MCKENZIE,D.P.和FORSYTH,R.S.(1995),“相似性分类:基于案例推理的统计方法综述”,人类行为中的计算机,11(2),273–288·doi:10.1016/0747-5632(94)00036-H
[16] MEULMAN,J.J.和HEISER,W.J.(2004),SPSS Categories 13.0,芝加哥:SPSS Inc。
[17] MILLIGAN,G.W.和COOPER,M.C.(1985),“确定数据集中簇数的程序检查”,《心理测量学》,50,159-179·doi:10.1007/BF02294245
[18] POWELL,M.J.D.(1983),“约束优化的可变度量方法”,摘自:数学规划:最新进展,编辑A.Bachem,M.Grotschel,B.Korte,纽约:Springer-Verlag,第288-311页。
[19] ROSENBERG,S.和KIM,M.P.(1975),“多元研究中作为数据收集程序的排序方法”,多元行为研究,10489–502·doi:10.1207/s15327906mbr1004_7
[20] SOKAL,R.R.和ROHLF,F.J.(1962),“用客观方法比较树状图”,Taxon,11,33–40·doi:10.2307/1217208
[21] STREHL,A.和GHOSH,J.(2002),“集群集成——用于组合多个分区的知识重用框架”,《机器学习研究杂志》,第3583–618页·Zbl 1084.68759号
[22] VICARI,D.和VICHI,M.(2000),“非层次分类结构”,摘自《数据分析》,编辑W.Gaul、O.Opitz和M.Schader,海德堡-柏林:斯普林格-Verlag,第51-65页。
[23] VICHI,M.(1999),“三向数据矩阵的单模式分类”,分类杂志,16,27-44·Zbl 0940.91066号 ·doi:10.1007/s003579900041
[24] WANG,D.、CHAUDHARI,N.S.和PATRA,J.C.(2004),“聚类二进制模式的构造性无监督学习算法”,《国际神经网络联合会议论文集》,IJCNN-04,2,匈牙利布达佩斯(IEEE分类号04CH37541C),(ISBN:0-7803-8360-5),第1381–1386页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。