×

混合数据上分类属性的多视图异构融合和嵌入。 (英文) Zbl 1491.68164号

摘要:分类属性在实际收集的数据中普遍存在。然而,此类属性缺乏定义良好的距离度量,无法通过代数运算直接操作,因此许多数据挖掘算法无法直接处理它们。对于具有多视图异构数据特征的类别属性,学习适当的度量或有效的数字嵌入是非常重要但具有挑战性的。提出了一种新的多视图异构融合模型(MVHF),该模型首先捕获每个视图的基本耦合信息,然后通过多核度量学习将来自不同视图的异构信息进行融合,以度量此类类别属性之间的内在距离;基于这些测量的距离,我们进一步使用流形学习方法来学习每个分类值的高质量数字嵌入。在33个混合数据集上的实验表明,与最先进的距离度量或嵌入竞争对手相比,支持MVHF的分类显著提高了性能。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68T09号 数据分析和大数据的计算方面
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 啊哈,DW;Kibler,D。;Albert,MK,基于实例的学习算法,《马赫学习》,6,1,37-66(1991)
[2] 艾奇逊,J。;Aitken,CG,通过核方法进行多元二进制识别,Biometrika,63,3,413-420(1976)·Zbl 0344.62035号
[3] 亚历山大(Alexandridis),A。;软骨病,E。;Giannopoulos,N。;Sarimveis,H.,分类径向基函数网络的快速高效训练方法,IEEE Trans Neural Netw Learn Syst,28,11,2831-2836(2017)
[4] Bashan,Y。;Neagu,D。;MJ Ridley,《比较异质对象的框架:模糊、数值和类别属性的相似性度量》,《软计算》,17,9,1595-1615(2013)
[5] Y.本吉奥。;科尔维尔,A。;Vincent,P.,表示学习:综述和新观点,IEEE跨模式分析Mach-Intell,35,8,1798-1828(2013)
[6] Boriah S、Chandola V、Kumar V(2008)分类数据的相似性度量:比较评估。摘自:2008年SIAM数据挖掘国际会议记录,SIAM,第243-254页
[7] Cao,L.,复杂交互的耦合学习,Inf Process Manag,51,2,167-186(2015)
[8] 曹,F。;梁,J。;李,D。;Bai,L。;Dang,C.,k模式聚类算法的差异性度量,基于知识的系统,26,120-127(2012)
[9] Cerda,P。;瓦罗佐,G。;Kégl,B.,《使用脏分类变量进行学习的相似编码》,《马赫学习》,107,1477-1494(2018)
[10] Chang,X。;聂,F。;王,S。;Yang,Y。;周,X。;Zhang,C.,双线性分析的复合秩k预测,IEEE Trans Neural Netw Learn Syst,27,7,1502-1513(2016)
[11] Chang,X。;Yu,Y。;Yang,Y。;Xing,EP,未剪辑视频中复杂事件分析的语义池,IEEE Trans-Pattern Ana Mach Intell,39,8,1617-1632(2017)
[12] Chen,L。;王,S。;王凯。;Zhu,J.,概率距离分类数据的软子空间聚类,模式识别,51,322-332(2016)
[13] Chen,L。;Ye,Y。;郭,G。;Zhu,J.,基于核的分类数据线性分类,软计算,20,8,2981-2993(2016)·Zbl 1373.62302号
[14] 科恩,P。;西,SG;艾肯,LS,《行为科学应用多元回归/相关分析》(2014),伦敦:心理学出版社,伦敦
[15] 考克斯,MAA;Cox,TF,多维定标,《美国统计学会期刊》,46,2,1050-1057(2001)·Zbl 1004.91067号
[16] 克罗夫特,WB;梅茨勒,D。;斯特罗曼,T.,《搜索引擎:实践中的信息检索》(2010年),《阅读:艾迪森·韦斯利》,《阅读》
[17] Demšar,J.,多数据集上分类器的统计比较,J Mach Learn Res,7,1月,1-30(2006)·Zbl 1222.68184号
[18] 糖尿病,糖尿病;El Hindi,K.,《使用差分进化改进标称值的距离测量》,应用软件计算,64,14-34(2018)
[19] A.弗兰克。;Asuncion,A.,UCI机器学习库(2010),欧文:加州大学欧文分校信息与计算机科学学院
[20] Golinko E,Sonderman T,Zhu X(2017)CNFL:用于聚类和分类的类别到数字特征学习。2017年IEEE第二届网络空间数据科学国际会议(DSC)。IEEE,第585-594页
[21] 郭C,Berkhahn F(2016)范畴变量的实体嵌入。arXiv预打印arXiv:1604.06737
[22] 埃尔南德斯·佩雷拉,E。;苏亚雷斯-罗梅罗,JA;Fontenla-Romero,O。;Alonso-Betanzos,A.,《符号特征的转换方法:应用于入侵检测问题的比较》,专家系统应用,36,7,10612-10617(2009)
[23] Hsu CW,Chang CC,Lin CJ等人(2003)支持向量分类实用指南
[24] 伊恩科,D。;Pensa,RG,分类数据中的正向和未标记学习,神经计算,196113-124(2016)
[25] 伊恩科,D。;彭萨,RG;Meo,R.,《从上下文到距离:分类数据聚类的学习差异性》,ACM Trans-Knowl Discov data(TKDD),6,1,1(2012)
[26] Jain P,Kulis B,Dhillon IS(2010)核函数的归纳正则化学习。主题:神经信息处理系统的进展,第946-954页
[27] Jain,P。;库利斯,B。;Davis,合资公司;Dhillon,IS,使用线性变换的度量和核学习,J Mach Learn Res,2013年3月13日,519-547(2012)·Zbl 1283.68290号
[28] 贾,H。;Cheung,J。;Liu,J.,分类数据无监督学习的新距离度量,IEEE Trans Neural Netw学习系统,27,5,1065-1079(2016)
[29] 简·S。;曹,L。;卢克。;Gao,H.,非IID分类数据的非监督耦合度量相似性,IEEE Trans-Knowl data Eng,301810-1823(2018)
[30] 简·S。;庞,G。;曹,L。;卢克。;Gao,H.,CURE:通过分层耦合学习实现灵活的分类数据表示,IEEE跨知识数据工程,31853-866(2018)
[31] Kasif,S。;萨尔茨伯格,S。;华尔兹,D。;Rachlin,J。;Aha,DW,基于记忆推理的概率框架,Artif Intell,104,1-2,287-311(1998)·Zbl 0908.68124号
[32] Kim,K。;Js,Hong,回归分析中混合数值和类别数据的混合决策树算法,模式识别Lett,98,39-45(2017)
[33] Kullback,S。;莱布勒,RA,《信息与充分性》,《数学统计年鉴》,22,1,79-86(1951)·Zbl 0042.38403号
[34] Le,SQ;Ho,TB,分类数据的基于关联的差异性度量,模式识别快报,26,16,2549-2557(2005)
[35] LeCun,Y。;博图,L。;Orr,GB;米勒,K。;蒙塔冯,G。;Orr,GB;穆勒,KR,高效后盾,神经网络:交易技巧,9-48(2012),柏林:施普林格出版社,柏林
[36] 李,C。;江,L。;李,H。;吴杰。;Zhang,P.,Toward value difference metric with attribute weighting,知识信息系统,50,3,795-825(2017)
[37] 李,Z。;聂,F。;Chang,X。;Yang,Y.,Beyond trace ratio:多类判别分析中迹比的加权调和平均值,IEEE Trans-Knowl Data Eng,29,10,2100-2110(2017)
[38] 李强。;熊,Q。;季S。;Wen,J。;高,M。;Yu,Y。;Xu,R.,使用微调条件概率进行标称属性的数据转换,模式识别快报,128,107-114(2019)
[39] 米勒,B。;莱因哈特,J。;斯特里克兰,MT,《神经网络:简介》(2012),柏林:施普林格出版社,柏林
[40] 纳多,C。;Bengio,Y.,《泛化误差的推断》,《马赫学习》,52,3,239-281(2003)·兹比尔1039.68104
[41] Ng、MK;马克·俊杰(Mark Junjie,L.)。;Joshua Zhexue,H。;曾友,H.,《关于k模式聚类算法中差异性度量的影响》,IEEE Trans-Pattern Ana Mach Intell,29,3,503-507(2007)
[42] Ortakaya,AF,独立加权值差异度量,模式识别快报,97,61-68(2017)
[43] 欧阳,D。;李强。;Racine,J.,交叉验证和分类数据概率分布估计,《非参数统计杂志》,18,1,69-100(2006)·Zbl 1087.62051号
[44] 压力,WH;Flannery,英国石油公司;Teukolsky,SA;Vetterling、WT、数字食谱。科学计算艺术(1986),伦敦:剑桥大学,伦敦·Zbl 0587.65003号
[45] 斯坦菲尔,C。;Waltz,D.,《迈向基于记忆的推理》,Commun ACM,29,12,1213-1228(1986)
[46] 王,C。;Dong,X。;周,F。;曹,L。;Chi,CH,分类数据的耦合属性相似性学习,IEEE Trans Neural Netw Learn Syst,26,4,781-797(2015)
[47] Wang,H。;冯·L。;Liu,Y.,基于几何平均的相似性度量的度量学习,软计算,20,10,3969-3979(2016)
[48] Zhang K,Wang Q,Chen Z,Marsic I,Kumar V,Jiang G,Zhang J(2015)《从范畴到数字:多重传递性远程学习与嵌入》。摘自:2015年SIAM数据挖掘国际会议记录。SIAM,第46-54页
[49] 赵伟。;李强。;朱,C。;宋,J。;刘,X。;Yin,J.,《模型软件分类数据嵌入:数据驱动方法》,《软计算》,223603-3619(2018)·Zbl 1398.68470号
[50] 郑琦。;刁,X。;曹,J。;刘,Y。;李,H。;姚,J。;Chang,C。;Lv,G.,从整体到部分:基于参考的分类数据聚类表示,IEEE Trans Neural Netw Learn Syst(2019)·doi:10.1109/TNNLS.2019.2911118
[51] 周,ZH,《机器学习》(2016),北京:清华出版社,北京
[52] 朱,C。;曹,L。;刘,Q。;尹,J。;Kumar,V.,《具有层次耦合的类别数据的异构度量学习》,IEEE Trans-Knowl data Eng,30,7,1254-1267(2018)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。