×

近似内核竞争学习。 (英语) Zbl 1325.68203号

摘要:内核竞争学习已经成功地用于实现稳健聚类。然而,内核竞争学习(KCL)对于大规模数据处理来说是不可扩展的,因为(1)它必须计算并存储太大而无法计算并保存在内存中的完整核矩阵;(2)它不能并行计算。本文提出了一种处理大规模数据集的近似核竞争学习框架。拟议框架由两部分组成。首先,它导出了一种近似核竞争学习(AKCL),它通过采样在子空间中学习核竞争学习。我们对为什么提出的近似模型适用于核心竞争学习提供了坚实的理论分析,此外,我们还表明AKCL的计算复杂性大大降低。其次,我们提出了一种基于集合的核竞争学习策略的伪并行近似核竞争学习(PAKCL),它克服了在核竞争学习中使用并行编程的障碍,显著加速了大规模聚类的近似核竞争学习。对公开数据集的实证评估表明,所提出的AKCL和PAKCL可以与KCL进行比较,并大大降低了计算成本。此外,与相关的近似聚类方法相比,所提出的方法在聚类精度方面取得了更有效的聚类性能。

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿哈特,S.C。;Krishnamurthy,A.K。;陈,P。;Melton,D.E.,矢量量化的竞争学习算法,神经网络,3,3,227-290(1990)
[3] Banerjee,A。;Ghosh,J.,高维超球面上可扩展平衡聚类的频率敏感竞争学习,IEEE神经网络汇刊,15,3,702-719(2004)
[5] 布拉德利,P.S。;Bennett,K.P。;Demiriz,A.,《受限k-means聚类》,技术代表MSR-TR-2000-65(2000),微软研究院
[6] Chen,W.-Y。;Song,Y。;Bai,H。;林,C.-J。;Chang,E.Y.,分布式系统中的并行谱聚类,IEEE模式分析和机器智能汇刊,33,3,568-586(2011)
[10] 科特雷尔,M。;锤子,B。;哈森福。;Villmann,T.,Batch和median神经气体,神经网络,19,6,762-771(2006)·Zbl 1102.68542号
[14] 迪伦,I.S。;关,Y。;Kulis,B.,《无特征向量加权图切割-多级方法》,IEEE模式分析和机器智能汇刊,29,111944-1957(2007)
[18] 费菲,L。;弗格斯,R。;Perona,P.,对象类别的一次性学习,IEEE模式分析和机器智能汇刊,28,4,594-611(2006)
[21] Fowlkes,C。;Belongie,S。;Chung,F。;Malik,J.,使用Nyström方法进行光谱分组,IEEE模式分析和机器智能汇刊,26,2,214-225(2004)
[23] 格里芬,G。;Holub,A。;Perona,P.,Caltech-256对象类别数据集,技术报告7694(2007),加利福尼亚理工学院
[25] Huang,Z.,用分类值聚类大数据集的(k)均值算法的扩展,数据挖掘和知识发现,2,3,283-304(1998)
[26] Inokuchi,R。;宫本茂,S.,《聚类的核心方法:竞争学习和(c)均值》,《国际不确定性、模糊性和基于知识的系统杂志》,14,4,481-493(2006)·Zbl 1110.68126号
[27] Jain,A.K.,《数据聚类:50年之后(K)-均值》,《模式识别字母》,31,8,651-666(2010)
[29] 鹿岛,H。;Ide,T。;加藤,T。;Sugiyama,M.,《大规模内核方法的最新进展和趋势》,IEICE信息与系统事务,E92-D,71338-1353(2009)
[30] 考夫曼,L。;Rousseeuw,P.J.,《在数据中发现群体:聚类分析简介》(2005),威利出版社
[31] Kohonen,T.,《自组织映射》,IEEE学报,78,9,1464-1480(1990)
[32] Lay,D.C.,线性代数及其应用(2002),Addison-Wesley
[35] 吕尔,S。;Lazarescu,M.,使用基于连通性的代表点对动态数据流进行增量聚类,数据与知识工程,68,1,1-27(2009)
[38] 马丁内茨,T.M。;Berkovich,S.G。;Schulten,K.J.,用于矢量量化的“Neural-gas”网络及其在时间序列预测中的应用,IEEE神经网络汇刊,4,4,558-569(1993)
[40] Ng,R.T.等人。;Han,J.,Clarans:空间数据挖掘的对象聚类方法,IEEE知识与数据工程汇刊,14,5,1003-1016(2002)
[43] 奥多内斯,C。;Omiecinski,E.,高效基于磁盘\(k)-表示关系数据库的集群,IEEE知识与数据工程学报,16,8,909-921(2004)
[48] F.-M.施莱夫。;朱,X。;Hammer,B.,《大数据集的软竞争学习》,(数据库和信息系统的新趋势,数据库和信息体系的新趋势、智能系统和计算的进展,第185卷(2013年)),141-151
[50] Schölkopf,B。;Smola,A。;Müller,K.-R.,作为核特征值问题的非线性分量分析,神经计算,10,5,1299-1319(1998)
[51] Tsang,I.W。;郭敬通(Kwok,J.T.)。;Cheung,P.-M.,核心向量机:超大数据集上的快速SVM训练,机器学习研究杂志,6363-392(2005)·Zbl 1222.68320号
[52] van Gemert,J.C。;Veenman,C.J。;Smeulders,A.W.M。;Geusebroek,J.-M,《视觉词汇歧义》,IEEE模式分析和机器智能汇刊,32,7,1271-1283(2010)
[53] 韦桑托,J。;Alhoniemi,E.,自组织映射的聚类,IEEE神经网络汇刊,11,3,586-600(2000)
[55] 王,C.-D。;赖,J.-H。;Zhu,J.-Y.,基于图的多原型竞争学习及其应用,IEEE系统、人与控制论汇刊,C部分:应用与评论,42,6,934-946(2012)
[58] 徐,L。;Krzyzak,A。;Oja,E.,Rival惩罚竞争学习的聚类分析、RBF网络和曲线检测,IEEE神经网络学报,4,4,636-649(1993)
[59] Xu,R。;Wunsch,D.,聚类算法综述,IEEE神经网络交易,16,3,645-678(2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。