×

多源流特征的在线特征选择。 (英语) Zbl 07810464号

摘要:基于在线方式的多源流特征选择已经引起了研究人员的极大关注,因为它可以降低异构大数据的维数。然而,传统的在线算法,如阿尔法投资,在线流媒体功能选择(OSFS公司),联机组功能选择(OGFS公司)以及可扩展且准确的在线方法(萨奥拉)只考虑具有固定实例的单个数据源,不直接适用于多源数据。多源因果特征选择(MCFS公司)可以在多个介入数据集中搜索不变集。然而,固定的特征空间受到了限制,多源数据之间需要完全相同的特征。为了克服这些局限性,我们提出了一种称为多源流特征选择的新方法(MSFS公司)解决多源流特征的特征选择问题。这个MSFS公司该算法分三个阶段处理来自随机源的一个新特征:相关性、源内冗余和源间冗余分析。那就是,MSFS公司尝试挖掘不同数据源之间的潜在关系,而不是仅独立考虑每个数据源。特别是,使用来自所有数据源的重叠实例在线分析每个新特征,并动态调整目标变量的马尔可夫覆盖层(MB)。评估MSFS公司算法,我们在14个数据集和两个真实场景中将其与上述算法进行了比较。结果表明:MSFS公司在分类精度和特征选择数量上优于现有算法。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68单位10 图像处理的计算方法
第68季度32 计算学习理论
68T09年 数据分析和大数据的计算方面
94A08级 信息与通信理论中的图像处理(压缩、重建等)
2005年6月2日 马尔可夫过程:估计;隐马尔可夫模型

软件:

LOFS公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 何毅。;吴,B。;Wu,D。;Beyazit,E。;陈,S。;Wu,X.,《走向挖掘多变的数据流:生成方法》,IEEE Trans。神经网络学习。系统。,32, 3, 1228-1240 (2020)
[2] 何毅、袁晓元、陈沙生、吴晓武,《不完全监督下的可变特征空间在线学习》,载《AAAI人工智能会议论文集》,第35卷,2021年,第4106-4114页。
[3] Wu,D。;何毅。;罗,X。;尚,M。;Wu,X.,《具有反复无常流媒体特征的在线特征选择:一般框架》,载《IEEE大数据国际会议(大数据)》,2019年,683-688(2019)
[4] 何毅、吴斌、吴德武、吴晓武,《论部分多任务学习》,载《第24届欧洲人工智能会议》,IOS出版社,2020年,第1174-1181页。
[5] Luong,A.V。;Nguyen,T.T.(阮,T.T.)。;Liew,A.W.-C。;Wang,S.,进化数据流的异构集成选择,模式识别。,112,3-4,第107743条pp.(2021)
[6] 谢伟。;朱,F。;江,J。;林,E.-P。;Wang,K.,Topicsketch:从twitter实时检测突发话题,IEEE Trans。知识。数据工程,28,8,2216-2229(2016)
[7] Martinez-Ríos,E。;蒙特西诺斯。;Alfaro Pone,M。;Pecchia,L.,《基于临床和生理数据的高血压检测和血压估计中的机器学习综述》,Biomed。信号处理。控制,68,2,第102813条pp.(2021)
[8] 吴永强。;胡,D。;邓,P.-Y。;唐,Z。;曹毅。;张,W.-M。;朱丽梅。;Ren,H.,非参数贝叶斯先验诱导深度网络自动检测认知状态,IEEE Trans。赛博。,51, 11, 5483-5496 (2021)
[9] 吴永强。;唐,Z。;姚,Y。;邱晓云。;邓,P.-Y。;熊,P。;Song,A。;朱丽梅。;Zhou,M.,通过功能性近红外光谱检测大脑工作负荷的可伸缩γ驱动多层网络,IEEE Trans。赛博。,1-15 (2021)
[10] 王,D。;Irani,D。;Pu,C.,《网络垃圾邮件的进化研究:2011年网络垃圾邮件语料库与2006年网络垃圾语料库》(第八届国际协作计算会议:网络、应用和工作共享(CollaborateCom)(2012)),40-49
[11] 胡,X。;周,P。;李,P。;Wang,J。;Wu,X.,关于使用流媒体特征进行在线特征选择的调查,Front。计算。科学。,12, 3, 479-493 (2018)
[12] 蔡,J。;罗,J。;王,S。;Yang,S.,《机器学习中的特征选择:一个新的视角》,神经计算,300,26,70-79(2018)
[13] Wang,J。;赵,P。;海,S.C。;Jin,R.,在线特征选择及其应用,IEEE Trans。知识。数据工程,26,3698-710(2013)
[14] Wu,D。;何毅。;罗,X。;Zhou,M.,基于潜在因素分析的在线稀疏流特征选择方法,IEEE Trans。系统。网络人:系统。,1-15(2021)
[15] Perkins,S。;Theiler,J.,《使用嫁接进行在线特征选择》,(第二十届国际机器学习会议论文集(2003),AAAI出版社),592-599
[16] J.Zhou,D.Foster,R.Stine,L.Ungar,使用字母识别进行流特征选择,收录于:第十一届ACM SIGKDD数据挖掘知识发现国际会议论文集,KDD’05,2005,第384-393页。doi:10.1145/1081870.1081914。
[17] 吴,X。;Yu,K。;丁,W。;Wang,H。;Zhu,X.,带流媒体功能的在线功能选择,IEEE Trans。模式分析。机器。智力。,35, 5, 1178-1192 (2012)
[18] Wang,J。;王,M。;李,P。;刘,L。;赵,Z。;胡,X。;Wu,X.,带组结构分析的在线特征选择,IEEE Trans。知识。数据工程,27,11,3029-3041(2015)
[19] Yu,K。;吴,X。;丁·W。;Pei,J.,《大数据的可扩展和准确在线特征选择》,ACM Trans。知识。发现数据,11,2,1-39(2016)
[20] Yu,K。;刘,L。;李,J。;丁·W。;Le,T.D.,多源因果特征选择,IEEE Trans。模式分析。机器。智力。,42, 9, 2240-2256 (2019)
[21] 李,J。;Cheng,K。;王,S。;Morstatter,F。;特雷维诺,R.P。;Tang,J。;Liu,H.,《特征选择:数据透视》,ACM Compute。调查。,50, 6, 1-45 (2017)
[22] 张,R。;聂,F。;李,X。;Wei,X.,《多视图数据的特征选择:一项调查》,Inf.Fusion,50,158-167(2019)
[23] 刘,H。;毛,H。;Fu,Y.,Robust multi-view feature selection,(2016 IEEE 16th International Conference on Data Mining(ICDM)(2016)),281-290
[24] Hou,B.-J。;张,L。;Zhou,Z.-H.,用特征进化流学习,IEEE Trans。知识。数据工程,33,6,2602-2615(2021)
[25] 郭毅。;Yang,H。;陈,M。;Cheng,J。;Gong,D.,基于集成预测的动态鲁棒多目标优化方法,Swarm Evol。计算。,48, 156-171 (2019)
[26] 郭毅。;Chu,Y。;焦,B。;Cheng,J。;Yu,Z。;崔,N。;Ma,L.,人类活动识别的进化双装配类不平衡学习,IEEE Trans。Emerg.顶部。计算。智力。,1-12 (2021)
[27] 郭毅。;张,Z。;Tang,F.,核化多类支持向量机特征选择,模式识别。,117,第107988条pp.(2021)
[28] Yu,K。;刘,L。;Li,J.,从多个介入数据集学习马尔可夫毯,IEEE Trans。神经网络学习。系统。,31, 6, 2005-2019 (2019)
[29] 彼得斯,J。;Bühlmann,P。;Meinshausen,N.,《使用不变预测进行因果推断:识别和置信区间》,J.R.Stat.Soc.Ser。B(统计方法),78,5,947-1012(2016)·Zbl 1414.62297号
[30] K.Zhang、B.Huang、J.Zhang和C.Glymour、B.Schölkopf,《非平稳/异质数据的因果发现:骨架估计和方向确定》,载《第二十六届国际人工智能联合会议论文集》,IJCAI-172017,第1347-1353页。doi:10.24963/ijcai.2017/187。
[31] Aliferis,C.F。;Statnikov,A。;沙马尔迪诺斯一世。;马尼,S。;Koutsoukos,X.D.,《因果发现和分类特征选择的局部因果和马尔可夫覆盖归纳——第二部分:分析和扩展》,J.Mach。学习。第11、10、235-284号决议(2010年)·Zbl 1242.68198号
[32] Ling,Z。;Yu,K。;Wang,H。;李,L。;Wu,X.,使用特征选择进行局部因果结构学习,IEEE Trans。Emerg.顶部。计算。智力。,5, 4, 530-540 (2021)
[33] Aliferis,C.F。;Statnikov,A。;沙马尔迪诺斯一世。;马尼,S。;Koutsoukos,X.D.,《用于因果发现和分类特征选择的局部因果和马尔可夫覆盖归纳——第一部分:算法和经验评估》,J.Mach。学习。第11、1、171-234号决议(2010年)·Zbl 1242.68197号
[34] Yu,K。;丁·W。;Simovici,医学博士。;Wang,H。;裴,J。;Wu,X.,流特征分类:一种新兴的模式挖掘方法,ACM Trans。知识。发现。数据,9,4,1-31(2015)
[35] Ling,Z。;Yu,K。;Wang,H。;刘,L。;丁·W。;Wu,X.,Bamb:特征选择的平衡马尔可夫毯式发现方法,ACM Trans。智力。系统。技术。,10, 5, 1-25 (2019)
[36] Wang,H。;Ling,Z。;Yu,K。;Wu,X.,面向高效和有效地发现用于特征选择的马尔可夫覆盖层,信息科学。,509, 227-242 (2020)
[37] N.Al Nuaimi,M.M.Masud,走向最佳流媒体特征选择,收录于:2017年IEEE数据科学和高级分析国际会议(DSAA),IEEE,2017年,第775-782页。
[38] Yu,K。;Chen,H.,基于马尔可夫边界的异常值挖掘,IEEE Trans。神经网络学习。系统。,30, 4, 1259-1264 (2018)
[39] Yu,K。;吴,X。;丁·W。;Mu,Y。;Wang,H.,使用代表集的马尔可夫覆盖特征选择,IEEE Trans。神经网络学习。系统。,28, 11, 2775-2788 (2016)
[40] Yu,K。;吴,X。;张,Z。;Mu,Y。;Wang,H。;Ding,W.,非忠实数据分布的马尔可夫覆盖特征选择(Proceedings-IEEE International Conference on data Mining,ICDM(2013)),857-866
[41] 那不勒斯,R.E.,《学习贝叶斯网络》,第38卷(2004),皮尔逊-普伦蒂斯·霍尔上鞍河:新泽西州皮尔逊-普伦蒂斯·哈尔上鞍河
[42] 杨,J。;沈,A。;Yu,K。;Chen,Y.,使用基于最大相关最小冗余的特征选择预测肺结节的语义特征,2019年IEEE生物信息学和生物医学国际会议(BIBM),1318-1323(2019)
[43] 杨,J。;郭,X。;安,N。;王,A。;Yu,K.,基于流特征的对称不确定性因果结构学习算法,信息科学。,467, 708-724 (2018) ·Zbl 1441.68217号
[44] 周,H。;Zhang,Y。;Zhang,Y。;Liu,H.,基于条件互信息的特征选择:最小条件相关性和最小条件冗余,应用。智力。,49, 3, 883-896 (2019)
[45] González-López,J。;文图拉,S。;Cano,A.,《使用互信息的多标签分类中连续特征的分布式选择》,IEEE Trans。神经网络学习。系统。,31, 7, 2280-2293 (2019)
[46] Yu,K。;丁·W。;Wu,X.,Lofs:在线流媒体特征选择库,Knowl-基于系统。,113, 1, 1-3 (2016)
[47] Zhang,Y。;Zhou,Z.-H.,通过相关性最大化实现多标签降维,ACM Trans。知识。发现数据,4,3,1-21(2010)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。