×

在成对约束的指导下,嵌入曲线距离分析的增强聚类。 (英语) Zbl 1484.62083号

摘要:聚类和降维因其在数据分析中的优异性能而受到广泛关注。传统方法处理高维数据时,在分类或聚类之前先进行降维,其步骤是连续的,精度较低。针对这一问题,提出了一种基于成对约束的增强聚类嵌入曲线距离分析(eceCDA)方法。在eceCDA过程中,使用无监督学习算法学习可靠的成对约束。然后计算高维空间中任意两个样本之间的曲线距离。接下来,构造一个权重函数来保持投影空间中样本的局部拓扑。最后,在成对约束和聚类准则的指导下,将成对曲线距离投影到低维空间中。因此,可以同时高精度地执行降维和聚类。为了证明eceCDA的优越性能,在几个基准上进行了大量实验。实验结果表明,eceCDA优于其他著名的聚类和降维算法。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 扎赫拉·艾哈迈迪;Beigy,Hamid,《存在概念漂移时数据流的半监督集成学习》,(混合人工智能系统国际会议(2012),Springer),526-537
[2] Timothy Apasiba Abeo,Xiang Jun Shen,Jian Ping Gou,Qi Rong Mao,Bing Kun Bao,Shuying Li,Dictionary induced least squares framework for multi-view dimensionality reduction with multi-manifold embeddings,IET Computer Vision 13(2)(2019)97-108。
[3] Martin Becker、Jens Lippel、AndréStuhlsatz、Thomas Zielke,深度神经网络数据可视化的稳健降维,图形模型(2020)101060。
[4] Giansalvo Cirriancione;莫里齐奥·西里安西奥内;戴米安·吉尔伯特(Damien Guilbert);阿里·穆罕默德;Randazzo,Vincenzo,《使用曲线元件分析检测电解槽应用交错dc/dc降压变换器中的功率开关开路故障》,(电机与系统国际会议(ICEMS)(2018),IEEE),2221-2225
[5] Giansalvo Cirriancione;珍妮·赫罗特;Randazzo,V.,用于实时数据简化的在线曲线分量分析(oncca),(2015年神经网络国际联合会议(IJCNN)(2015),IEEE),1-8
[6] Giansalvo Cirriancione;文森佐·兰达佐;拉胡尔·库马尔。;莫里齐奥·西里安西奥内;Pasero,Eros,感应电机定子故障检测的增长曲线分量分析(gcca),(信号交换动力学的神经方法(2020),Springer),235-244
[7] 皮埃尔·德马尔蒂尼;Hérault,Jeanny,曲线成分分析:用于数据集非线性映射的自组织神经网络,IEEE神经网络汇刊,8,1,148-154(1997)
[8] 邓江洲;郭俊鹏;王勇,一种基于概率分布的协作过滤k-medoids聚类推荐算法,基于知识的系统,175,96-106(2019)
[9] 邓平;王红军;李天瑞;Horn,Shi-Jinn;朱新文,无监督集成学习指导下的线性判别分析,信息科学,480211-221(2019)·Zbl 1443.68145号
[10] 穆罕默德·埃纳亚塔塔尔;阿里·易卜拉欣·内贾德;Motameni,Homayun,区间值勾股模糊环境下最短路径问题的Dijkstra算法,复杂与智能系统,5,2,93-100(2019)
[11] 范明玉;乔红;张波;张晓琴,用于特征提取的等距多流形学习,(2012年IEEE第十二届数据挖掘国际会议(2012),IEEE),241-250
[12] 布伦丹·J·弗雷。;Dueck,Delbert,通过在数据点之间传递消息进行聚类,《科学》,3155814972-976(2007)·Zbl 1226.94027号
[13] Georgios,Douzas;费尔南多,巴考;Felix,Last,《通过基于k-means and smove的启发式过采样方法改善不平衡学习》,《信息科学》,465,1-20(2018)
[14] 黄德根;蒋振超;邹丽;李丽双,使用支持向量机和长短期记忆网络从生物医学文献中提取药物相互作用,信息科学,415100-109(2017)
[15] 黄树东;康、赵;徐增林。,带软上限范数的自加权多视图聚类,基于知识的系统,158,1-8(2018)
[16] 卡尔、桑梅特;Garg,Ishan,基于有监督和无监督学习方法的入侵检测集成技术,(计算和数据科学进展国际会议(2018),Springer),228-238
[17] 寇刚;彭毅;王国训,基于mcdm方法的金融风险分析聚类算法评估,信息科学,275,11,1-12(2014)
[18] Peter Laurinec;马雷克·洛德勒;Mária的Lucká;Rozinajová,Viera,基于Density-based的无监督集成学习方法,用于聚合或聚集用电量的时间序列预测,智能信息系统杂志,53,2,219-239(2019)
[19] John Aldo Lee、Amaury Lendasse、Nicolas Donckers、Michel Verleysen,《稳健的非线性投影方法》,摘自:《欧洲人工神经网络研讨会》,2000年,第13-20页。
[20] John Aldo Lee、Amaury Lendasse、Michel Verleysen,《曲线距离的非线性投影:等值线与曲线距离分析》,神经计算57(2004)49-76。
[21] 马克·列侬(Marc Lennon);Gregoire Mercier;玛丽·凯瑟琳·穆乔特(Marie Catherine Mouchot);劳伦斯·休伯特·莫伊(Laurence Hubert-Moy);Serpico,Sebastiano B.,高光谱图像非线性降维的曲线成分分析,Proc Spie,4541157-168(2002)
[22] 李飞江;钱玉华。;王洁婷;梁继业,《多粒度信息融合:基于dempster-shafer证据理论的聚类集成方法》,信息科学,378389-409(2017)·Zbl 1429.68295号
[23] 李浩;王蒙;Hua,Xian-Sheng,Msra-mm 2.0:大型网络多媒体数据集,(2009年IEEE国际数据挖掘研讨会(2009),IEEE),164-169
[24] 李瑞凡;王聪;郝宏伟;涂旭燕,用判别等距特征映射对人脸进行分类,(墨西哥人工智能国际会议(2005),施普林格),565-573
[25] 李志;李朝卓;杨利群;Yu,Philip S。;李周军,可扩展图形半监督学习的混合分布建模,基于知识的系统,200,文章105974 pp.(2020)
[26] 林伟超;蔡志芳;胡亚汉。;Jhang,Jing-Shang,基于聚类的类间均衡数据欠采样,信息科学,409,17-26(2017)
[27] 刘汉阳;韩俊伟;聂飞平;李雪龙,平衡聚类与最小二乘回归,(第三十一届AAAI人工智能会议(2017)),2231-2237
[28] 米尔扎埃尼亚(Amir Mirzaeinia);Hassanalian,Mostafa,通过kuhn-munkers算法在智能城市中实现最低成本无人机-最佳匹配:能源管理和效率提高,航空航天,6,11,125(2019)
[29] 彭亚琼;郝志宇;Yun,Xiaochun,流数据上方差减少随机梯度下降的无锁并行化,IEEE并行和分布式系统事务,31,9,2220-2231(2020)
[30] 罗德里格斯,亚历克斯;Laio,Alessandro,通过快速搜索和发现密度峰值进行聚类,《科学》,34461911492-1496(2014)
[31] 萨姆·罗伊斯(Sam T.Roweis)。;Saul,Lawrence K.,局部线性嵌入的非线性降维,科学,29055002323-2326(2000)
[32] 赛义德,纳西尔;Nam,Haewoon;Haq,Mian Imtiaz Ul;Saqib,Dost Bhatti Muhammad,多维尺度调查,ACM计算调查(CSUR),51,3,1-25(2018)
[33] Sathya,R。;Abraham,Annamma,模式分类的有监督和无监督学习算法比较。国际高级研究杂志,人工智能,2,2,34-38(2013)
[34] 石学森;沈玉尧;王永清;Bai,Li,实时航空遥测数据的差分聚类压缩算法,IEEE Access,657425-57433(2018)
[35] 亚历山大·斯特雷尔(Alexander Strehl);Ghosh,Joydeep,《集群集成——用于组合多个分区的知识重用框架》,《机器学习研究杂志》,3,3,583-617(2002)·Zbl 1084.68759号
[36] 王琦;秦泽群;聂飞平;李雪龙,谱嵌入自适应邻域聚类,IEEE神经网络和学习系统汇刊,30,4,1265-1271(2018)
[37] 斯万特·沃尔德;Esbensen,Kim;Paul Geladi,主成分分析,化学计量学和智能实验室系统,2,1-3,37-52(1987)
[38] 严文珠;孙全森;孙怀江;李彦蒙,图像集分类的联合降维与度量学习,信息科学,516109-124(2020)·Zbl 1457.68243号
[39] Yan,Zhang;赵,张;秦杰;李,张;李冰;范章,李,基于线性嵌入的半监督局部多流形等距映射特征提取,模式识别,76,662-678(2018)
[40] 叶文婷;王红军;闫、珊;李天瑞;Yang,Yan,基于暗知识的聚类集成的非负矩阵分解,基于知识的系统,163624-631(2019)
[41] 易金峰;杨天宝;金荣;Jain,Anil K。;Mahdavi,Mehrdad,矩阵完备的鲁棒集成聚类,(2012年IEEE第12届国际数据挖掘会议(2012年),IEEE),1176-1181
[42] 张、季;王红军;朱洁雷;黄树东;李天瑞;赵启刚,用于学习区分表征的改进高斯-贝努利限制玻尔兹曼机器,基于知识的系统,185,第104911页(2019)
[43] 张勇;宋宪芳;龚敦伟,《用于特征选择的基于返回树的二进制萤火虫算法》,《信息科学》,418561-574(2017)
[44] 张永彦,郭燮,王文清,王晓凡,钱富才,杜旭龙,杜金华,基于聚类的工业数据分布式降维,收录于:IEEE工业电子与应用会议(ICIEA),IEEE,2018年,第370-374页。
[45] 郑宇。,轨迹数据挖掘:概述,ACM智能系统与技术交易(TIST),6,3,29(2015)
[46] 周志华,《当半监督学习遇到集成学习时》,(多分类器系统国际研讨会(2009),斯普林格),529-538
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。