×

\(k)-Mnv-Rep:矩阵对象数据的(k)型聚类算法。 (英语) Zbl 1475.62199号

摘要:在矩阵对象数据中,一个对象(或样本)由多个特征向量(记录)描述,所有这些特征向量都负责观察到的对象分类。矩阵对象数据的一个任务是通过分析和利用特征向量的信息将其聚类成一组。矩阵对象数据在许多实际应用中广泛存在。以前的研究通常处理对象通常由特征向量表示的数据集,这在许多实际任务中可能会违反。在本文中,我们提出了一种\(k)-多数值表示(缩写为\(k)-Mnv-Rep)算法来对数值矩阵对象数据进行聚类。在该算法中,定义了两个数值矩阵对象之间的一种新的相似度测度,并给出了更新聚类中心的一种启发式方法。此外,我们还提出了一种对混合矩阵对象数据进行聚类的(k)-多值表示(缩写为(k)-Mv-Rep)算法。这两个提出的算法打破了先前研究的局限性,可以应用于解决在许多实际任务中广泛存在的矩阵对象数据集。在真实数据集和合成数据集上的一些实验表明了这两种算法的优点和有效性。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)

软件:

UCI-毫升
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安德鲁斯。;Tsochantaridis,I。;Hofmann,T.,用于多实例学习的支持向量机,《神经信息处理系统的进展》,第15期,第561-568页(2002年)
[2] K.Bache,M.Lichman,UCI机器学习库,2014年,网址:http://archive.ics.uci.edu/ml。
[3] 曹,F。;黄,Z。;梁,J。;X.赵。;Meng,Y。;Qian,Y.,带集值特征的分类数据聚类算法,IEEE神经网络和学习系统汇刊,29,10,4593-4606(2018)
[4] 曹,F。;梁,J。;李,D。;Zhao,X.,分类数据子空间聚类的加权k模式算法,神经计算,108,5,23-30(2013)
[5] 曹,F。;Yu,L。;黄,Z。;Liang,J.,k-mw-modes:分类矩阵对象数据的聚类算法,应用软计算,57,605-614(2017)
[6] Chen,L。;王,S。;王凯。;Zhu,J.,概率距离分类数据的软子空间聚类,模式识别,51,322-332(2016)
[7] 陈,Y。;Bi,J。;Wang,Z.,Miles:通过嵌入式实例选择进行多实例学习,IEEE模式分析和机器智能汇刊,28,121931-1947(2006)
[8] 陈,Y。;Wang,Z.,基于区域学习和推理的图像分类,《机器学习研究杂志》,5,913-939(2004)
[9] 切普利吉纳,V。;税务,D。;Loog,M.,带袋差异的多实例学习,模式识别,48,1,264-275(2015)
[10] E.Decencière,X.Zhang,G.Cazuguel,B.Lay,B.Cochener,C.Trone,P.Gain,R.Ordonez,P.Massin,A.Erginay,B.Charton,J.Klein,公开发布图像数据库的反馈:Messidor数据库。图像分析和体视学(2014)231-234·兹比尔1393.92026
[11] Demsar,J.,多数据集分类器的统计比较,机器学习研究杂志,7,1,1-30(2006)·Zbl 1222.68184号
[12] 德里尼亚斯,P。;弗里兹,A。;Kannan,R。;Vempala,S。;Vinay,V.,通过奇异值分解聚类大型图,机器学习,56,1-3,9-33(2004)·Zbl 1089.68090号
[13] Edgar,G.,《测量、拓扑和分形几何》(2008),Springer:Springer New York·Zbl 1152.28008号
[14] J.犯规。多实例学习中的学习实例权重,怀卡托大学硕士论文,2009年。
[15] 高,Y。;Xu,K.,Prankaggreg:基于快速聚类的部分等级聚合,《信息科学》,478408-421(2019)
[16] Han,J。;M.Kamber。;Pei,J.,数据挖掘:概念和技术,数据挖掘概念模型方法和算法第二版,5,4,1-18(2011)
[17] Huang,Z.,用分类值聚类大数据集的k-means算法的扩展,数据挖掘和知识发现,2,3,283-304(1998)
[18] 黄,Z。;Ng,M.K.,分类数据聚类的模糊K模式算法,IEEE模糊系统事务,7,4,446-452(1999)
[19] 黄,Z。;Ng,M.K。;荣,H。;Li,Z.,k均值聚类中的自动变量加权,IEEE模式分析和机器智能汇刊,27,5,657-668(2005)
[20] Jain,A.K。;Dubes,R.C.,《聚类数据的算法》,技术计量学,32,2,227-229(1988)·Zbl 0665.62061号
[21] 詹姆斯,F。;Eibe,F.,《多实例学习假设综述》,《知识工程评论》,25,1,1-25(2010)
[22] 坎德米尔,M。;Hamprecht,F.A.,《监管不力的计算机辅助诊断:一项基准研究》,《计算机化医学成像和图形》,42,44-50(2015)
[23] L.Kaufmann,P.Rousseeuw,《利用medoids进行聚类》,载《基于L_1)规范相关方法的统计数据分析》,1987年,第405-416页。
[24] 库马尔,K.M。;Reddy,A.R.,使用基于密度的初始聚类中心的高效k-means聚类过滤算法,信息科学,418-419286-301(2017)·Zbl 1443.62183号
[25] 梁,J。;Bai,L。;Dang,C。;Cao,F.,《k均值型算法与不平衡数据分布》,IEEE模糊系统事务,20,4,728-745(2012)
[26] J.Macqueen,《多元观测分类和分析的一些方法》,载于《伯克利数理统计与概率研讨会论文集》,1967年,第281-297页·Zbl 0214.46201号
[27] 聂,F。;王,X。;Huang,H.,带自适应邻域的聚类和预测聚类,(Acm Sigkdd知识发现和数据挖掘国际会议(2014)),977-986
[28] 聂,F。;王,X。;M.I.乔丹。;Huang,H.,基于图形聚类的约束拉普拉斯秩算法,(第三十届AAAI人工智能会议论文集(2016)),1969-1976
[29] Ray,S。;Craven,M.,《使用生物医学文本学习用功能信息注释蛋白质的统计模型》,BMC生物信息学,6,补遗1,S18(2005)
[30] 希夫曼,S。;雷诺兹,L。;Young,F.,《多维标度:理论、方法和应用导论》(1981年),学术出版社·Zbl 0539.65027号
[31] 斯科特,S。;张杰。;Brown,J.,《广义多因素学习》,《国际计算智能与应用杂志》,2005年第5期,第01期,第21-35页
[32] Shang,R。;Wang,W。;斯托尔金,R。;Jiao,L.,非负谱学习和基于稀疏回归的双粒度正则化特征选择,IEEE控制论汇刊,48,2,793-806(2018)
[33] Shang,R。;朱,Z。;Jiao,L。;Wang,W。;Yang,S.,基于全球判别的非负谱聚类,模式识别,55,172-182(2016)·Zbl 1412.62085号
[34] A.Srinivasan,S.Muggleton,R.King,《比较归纳逻辑编程系统对背景知识的使用》,载《第五届归纳逻辑编程国际研讨会论文集》,1995年,第199-230页。
[35] 斯特雷尔,A。;Ghosh,J.,《集群集成-用于组合多个分区的知识重用框架》,《机器学习研究杂志》,3583-617(2003)·Zbl 1084.68759号
[36] 陶,Q。;斯科特·S。;Vinodchandran,N.V。;Osugi,T.T.,通过近似盒子计数实现基于Svm的广义多实例学习,(机器学习国际会议(2004)),101
[37] 托马斯·G·D。;Richard,H.L.,用轴平行矩形解决多实例问题,人工智能,89,31-71(1997)·Zbl 1042.68650号
[38] Wang,J。;Zucker,J.D.,《解决多实例问题:懒惰学习方法》(第十七届机器学习国际会议(2000)),1119-1126
[39] N.Weidmann,E.Frank,B.Pfahringer,广义多实例问题的两级学习方法,收录于:《第14届欧洲机器学习会议论文集》,2003年,第468-479页。
[40] R.Xu,D.Wunsch,聚类,John Wiley and Son,2008。
[41] X.Xu,《多实例问题中的统计学习》,怀卡托大学硕士论文,2003年。
[42] 杨,M。;Shang,R。;Jiao,L。;张伟。;Yang,S.,具有稀疏和正交约束的对偶图正则化非负矩阵分解,人工智能的工程应用,69,24-35(2018)
[43] 杨,M。;Shang,R。;Jiao,L。;张伟。;袁,Y。;Yang,S.,基于特征选择的局部判别聚类的双粒度稀疏非负矩阵分解,神经计算,290,87-99(2018)
[44] 张,M。;Zhou,Z.,多实例聚类及其在多实例预测中的应用,应用智能,31,1,47-68(2009)
[45] Zhou,Z。;蒋,K。;Li,M.,基于多实例学习的web挖掘,应用智能,22,2,135-147(2005)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。