×

数据集群和应用程序中的随机行走距离。 (英语) Zbl 1261.62059号

摘要:我们开发了一系列数据聚类算法,这些算法结合了现有谱聚类方法的优点和模糊方法的各种理想特性。特别是,我们表明,在具有不同几何形状的数据集中,所开发的方法“Fuzzy-RW”优于其他常用算法。作为应用,我们讨论了生物和人脸识别基准(如IRIS和YALE人脸数据集)的数据聚类。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
60克50 独立随机变量的和;随机游走
68分10秒 模式识别、语音识别
65C60个 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Abonyi J,Feil B(2007),数据挖掘和系统识别的聚类分析。巴塞尔Birkhäuser·Zbl 1156.62045号
[2] Alamgir M,von Luxburg U(2011),p-电阻家族中的相变。收录:Shawe-Taylor J、Zemel R、Bartlett P、Pereira F、Weinberger K(编辑)《神经信息处理系统进展》,第24卷。http://books.nips.cc/papers/files/nips24/NIPS2011_0278.pdf
[3] Arias-Castro E,Chen G,Lerman G(2010)基于局部线性近似的谱聚类。arXiv:1001.1323v1·Zbl 1271.62132号
[4] Belhumeur P、Hespanha J、Kriegman D(1997)《特征脸与渔夫脸:使用特定类别线性投影的识别》。IEEE Trans-Pattern Ana Mach Intell 19(7):711–720·doi:10.1109/34.598228
[5] Belkin M,Niyogi P(2003),用于降维和数据表示的拉普拉斯特征映射。神经计算16:137-1396·Zbl 1085.68119号 ·doi:10.1162/089976603321780317
[6] Ben-Hur A,Elisseeff A,Guyon I(2002)一种基于稳定性的聚类数据结构发现方法。摘自:太平洋生物计算研讨会,第6-17页
[7] Bezdek J,Ehrlich R,Full W(1984)FCM:模糊c均值聚类算法。计算机地球科学10:191–203
[8] Bezdek J、Hall L、Clark M、Goldgof D、Clarke L(1997)《模糊模型医学图像分析》。统计方法医学研究6:191–214·doi:10.1191/096228097677057357
[9] Bock H-H(1974)《自动化Klassifikation》。Theoretische und praktische Methoden zur Gruppierung und Strukturierung von Daten(聚类分析)。范登和克公司;哥廷根·鲁普勒支(德语)·Zbl 0279.62013年
[10] Bock H-H(1987)关于聚类分析、主成分聚类和多维尺度之间的接口。收录:Bozdogan H,Gupta A(eds)多元统计建模和数据分析。多德雷赫特·雷德尔,第17-34页
[11] Brémaud P(1999)《马尔可夫链:吉布斯场、蒙特卡罗模拟和队列》。纽约州施普林格·Zbl 0949.60009号
[12] Brunelli R,Poggio T(1993)《人脸识别:特征与模板》。IEEE Trans-Pattern Ana Mach Intell 15(10):1042–1053·数字对象标识代码:10.1109/34.254061
[13] Cao F、Delon J、Desolneux A、MuseéP、Sur F(2007)《检测群体和应用于形状识别的统一框架》。数学成像视觉杂志27(2):91–119·Zbl 1478.68313号 ·doi:10.1007/s10851-006-9176-0
[14] Cao F,Lisani J-L,Morel J-M,MuseéP,Sur F(2008)《形状识别理论》。柏林施普林格
[15] Chen G,Lerman G(2009)谱曲率聚类(SCC)。国际J计算机视觉81(3):317–330·doi:10.1007/s11263-008-0178-9
[16] Chen S,Zhang D(2004)基于新的核诱导距离测度的带空间约束的FCM鲁棒图像分割。IEEE Trans-Syst Man Cybern第B部分34(4):1907–1916·doi:10.1109/TSMCB.2004.831165
[17] Chung F(1997)谱图理论。CBMS,第92卷。美国数学学会,普罗维登斯·Zbl 0867.05046号
[18] Coifman R,Lafon S(2006)扩散图。应用计算和谐分析21(1):5–30·Zbl 1095.68094号 ·doi:10.1016/j.acha.2006.04.006
[19] Cominetti O,Matzavinos A,Samarasinghe S,Kulasiri D,Liu S,Maini P,Erban R(2010)Diffuzzy:复杂数据集的模糊聚类算法。国际计算机智能生物信息系统生物1(4):402–417
[20] Desolneux A,Moisan L,Morel J-M(2008)《从格式塔理论到图像分析:概率方法》。纽约州施普林格·Zbl 1241.68001号
[21] Franke M,Geyer-Schulz A(2009)动态数据集受限随机行走聚类的更新算法。高级数据分析分类3(1):63–92·Zbl 1282.62151号 ·doi:10.1007/s11634-009-0039-6
[22] Fu L,Medico E(2007)FLAME,一种用于分析DNA微阵列数据的新型模糊聚类方法。BMC生物信息8(3)。doi:10.11861471-2105-8-3
[23] Gan G,Ma C,Wu J(2007)《数据聚类:理论、算法和应用》。收录于:ASA-SIAM统计和应用概率系列。费城SIAM·Zbl 1185.68274号
[24] Georghiades A,Belhumeur P,Kriegman D(2001)从少到多:可变照明和姿势下人脸识别的照明锥模型。IEEE Trans-Pattern Ana Mach Intell 23(6):643–660·doi:10.1109/34.927464
[25] Haralick R,Harpaz R(2005)线性流形聚类。In:Perner P,Imiya A(eds)模式识别中的机器学习和数据挖掘。计算机科学课堂讲稿,第3587卷。柏林施普林格,第132-141页
[26] Haralick R,Harpaz R(2007)通过随机搜索在高维空间中的线性流形聚类。图案识别40(10):2672–2684·Zbl 1132.68636号 ·doi:10.1016/j.patcog.2007.01.020
[27] Hathaway R,Bezdek J(2001)Fuzzy$$c$$-表示不完整数据的聚类。IEEE Trans-Syst Man Cybern第B部分31(5):735–744·数字对象标识代码:10.1109/3477.956035
[28] 何X,闫S,胡Y,Niyogi P,Zhang H-J(2005)利用拉普拉斯人脸进行人脸识别。IEEE Trans-Pattern Ana Mach Intell 27(3):328–340·doi:10.1109/TPAMI.2005.55
[29] Higham D、Kalna G、Kibble M(2007)《光谱聚类及其在生物信息学中的应用》。计算应用数学杂志204(1):25–37·Zbl 1123.65024号 ·doi:10.1016/j.cam.2006.04.026
[30] Jain A(2010)数据聚类:超过K-means 50年。图案识别信31(8):651–666·doi:10.1016/j.patrec.2009.09.011
[31] Kimmel R,Sapiro G(2003)人脸识别数学。SIAM新闻36(3)。http://www.siam.org/news/news.php?id=309
[32] Kogan J(2007)《大数据和高维数据聚类介绍》。剑桥大学出版社,纽约·Zbl 1183.62106号
[33] Lee K-C,Ho JM,Kriegman D(2005)获取可变光照下人脸识别的线性子空间。IEEE Trans-Pattern Ana Mach Intell 27(5):684–698
[34] Levine E,Domany E(2001)无监督估计聚类有效性的重抽样方法。神经计算机13(11):2573–2593·Zbl 0993.68113号 ·doi:10.1162/089976601753196030
[35] Liao C-S,Lu K,Baym M,Singh R,Berger B(2009)IsoRankN:多蛋白网络全局比对的光谱方法。生物信息学25(12):i253–i258·doi:10.1093/bioinformatics/btp203
[36] Macqueen J(1967)多元观测分类和分析的一些方法。摘自:第五届伯克利数理统计与概率研讨会论文集。加利福尼亚大学出版社,第281-297页·Zbl 0214.46201号
[37] Meila M(2006)$$k$$-均值的良好最优的唯一性。收录:Cohen W,Moore A(编辑)《第23届机器学习国际会议论文集》,第625-632页
[38] Miyamoto S、Ichihashi H、Honda K(2008)《模糊聚类算法:c-means聚类方法及其应用》。模糊和软计算研究,第229卷。柏林施普林格·Zbl 1147.68073号
[39] Muller N、Magaia L、Herbst B(2004)奇异值分解、特征面和3D重建。SIAM版本46(3):518–545·Zbl 1061.65033号 ·doi:10.1137/S0036144501387517
[40] Ng A、Jordan M、Weiss Y(2002)《关于光谱聚类:分析和算法》。收录:Leen T、Dietterich T、Tresp V(eds)《神经信息处理系统进展》,第14卷。麻省理工学院出版社,剑桥,第849-856页
[41] Shental N,Bar-Hillel A,Hertz T,Weinshall D(2009)具有等效约束的高斯混合模型。收录:Basu S、Davidson I、Wagstaff K(eds)约束聚类:算法、理论和应用的进展。查普曼&伦敦霍尔,第33-58页·Zbl 1161.68775号
[42] Shi J,Malik J(2000)标准化切割和图像分割。IEEE Trans-Pattern Anal Image Segm 22(8):888–905·数字对象标识代码:10.1109/34.868688
[43] Snel B,Bork P,Huynen M(2002)《从基因的基因组关联中识别功能模块》。PNAS 99(9):5890–5895·doi:10.1073/pnas.092632599
[44] Späth H(1985)聚类分析。奇切斯特Ellis Horwood有限公司·Zbl 0584.62094号
[45] Tsao J,Lauterbur P(1998)基于广义聚类的多模态图像配准。第20届国际会议议程IEEE Eng-Med Biol Soc 20(2):667–670
[46] Tziakos I,Theoharatos C,Laskaris N,Economou G(2009)使用拉普拉斯特征映射进行彩色图像分割。电子成像杂志18(2):023004·doi:10.1117/1.3122369
[47] von Luxburg U(2007)光谱聚类教程。Stat Comput 17(4):395–416·数字对象标识代码:10.1007/s11222-007-9033-z
[48] von Luxburg U,Radl A,Hein M(2010)《在太空中迷失:通勤距离的大样本分析》。收录:Lafferty J、Williams CKI、Shawe-Taylor J、Zemel R、Culotta A(编辑)《神经信息处理系统进展》,第23卷。http://books.nips.c/papers/files/nips23/NIPS210_0929.pdf
[49] Yen D,Vanvyve F,Wouters F,Fouss F,Verleysen M,Saerens M(2005),使用基于随机行走的距离测量进行聚类。收录:Verleysen M(ed)收录:第13届欧洲人工神经网络研讨会论文集,第317–324页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。