计算机科学››2020,第47卷››发行(6A): 480-484.数字对象标识:10.11896/JsJkx.20190800095

数据库 & 大数据 & 数据科学 • 上一篇   下一篇

改进的局部和相似性保持特征选择算法

李金霞1,赵志刚1,李强1,吕慧显2,李明生1  

  1. 1青岛大学计算机科学技术学院 山东 青岛 266071;
    2青岛大学自动化与电气工程学院 山东 青岛 266071
  • 发布日期:2020-07-07
  • 通讯作者:赵志刚(zhaolhx@163.com)
  • 作者简介:lJx7130@163.com
  • 基金资助:
    国家重点研发项目(2017YFB0203102)

改进的保持局部性和相似性的特征选择算法

李金霞1、赵志刚1,李强1,LV辉县2和李明生1  

  1. 1青岛大学计算机科学与技术学院,中国山东青岛266071
    2青岛大学自动化与电气工程学院,中国山东青岛266071
  • 出版:2020-07-07
  • 关于作者:李金霞,1994年出生,研究生。她的主要研究兴趣包括机器学习等。
    赵志刚,1973年生,教授,中国计算机联合会会员。他的主要研究兴趣包括图像处理、机器学习和压缩感知。
  • 支持单位:
    这项工作得到了国家重点研发计划(2017YFB0203102)的支持。

摘要:LSPE(位置和相似性保持嵌入)特征选择算法首先基于KNN公司定义图结构来保持数据的局部性,再基于定义图学习数据的低维重构系数来保持数据的局部性和相似性。两个步骤独立进行,缺乏交互。由于近邻个数是人为定义的,使得学习到的图结构不具备自适应的近邻,不是最优的,进而影响算法性能。为优化LSPE公司算法的性能,提出改进的局部和相似性保持特征选择算法,将图学习与稀疏重构、特征选择并入同一个框架,使得图学习和稀疏编码同时进行,其要求编码过程是稀疏的,自适应近邻的和非负的。所提算法旨在寻找一个能保持数据的局部性和相似性的投影,并对投影矩阵施2,1范数,进而选择能够保持局部性和相似性的相关特征。实验结果表明,改进后的算法减少了主观人为影响,消除了选择特征的不稳定性,对数据噪声鲁棒性更强,提高了图像分类的准确率。

关键词: 局部和相似性保持, 特征选择, 无监督学习, 稀疏重构

摘要:LSPE(Locality and similarity preserving embedding)特征选择算法首先基于KNN的预定义图结构维护数据的局部性,然后基于定义图的学习数据的低维重构系数维护数据的区域性和相似性。这两个步骤是独立的,缺乏互动。由于最近邻数是人工定义的,因此学习的图结构没有自适应的最近邻,并且不是最优的,这将影响算法的性能。为了优化LSPE的性能,提出了一种改进的保持局部性和相似性的特征选择算法。该算法将图学习、稀疏重建和特征选择集成到同一框架中,使图学习和稀疏编码同时进行。编码过程要求是稀疏的、自适应的邻域和非负的。目标是找到一个可以保持数据的局部性和相似性的项目,并应用2,1-对proJection矩阵进行范数,然后选择能够保持局部性和相似性的相关特征。实验结果表明,改进的算法降低了主观影响,消除了特征选择的不稳定性,对数据噪声具有更强的鲁棒性,提高了图像分类的准确性。

关键词: 特征选择, 保持局部性和相似性, 稀疏重建, 无监督学习

中图分类号: 

  • TP391.4标准
[1] LI T,MENG Z,NI B,等。用于图像分类和动作识别的稳健几何p-范数特征池。Ima-ge&Vision Computing,2016,55(P2):64-76。
[2] 赵Z,刘华。基于谱分析的半监督特征选择//2007年SIAM国际数据挖掘会议记录。明尼苏达州明尼阿波利斯:SIAM,2007:26-28。
[3] 刘毅,NIE F,WU J,等。基于噪声不敏感跟踪比准则的高效半监督特征选择。神经计算,2013105(完成):12-18。
[4] CHANG X,NIE F P,YANG Y,等.半监督多标签特征选择的凸公式//第28届AAAI人工智能会议论文集.2014:1171-1177。
[5] ROWEIS S T.通过局部线性嵌入降低非线性维数。科学,2000290(5500):2323-2326。
[6] BELKIN M,NIYOGI P.降维和数据表示的拉普拉斯特征映射。麻省理工学院出版社,2003年。
[7] BENGIO Y,VINCENT P.LLE、Isomap、MDS、特征映射和谱聚类的样本外扩展//神经信息处理系统国际会议。麻省理工学院出版社,2003年。
[8] 何旭,闫思,胡毅,等。基于拉普拉斯人脸的人脸识别。IEEE模式分析和机器智能汇刊,2005年,27(3):328-340。
[9] HE X.邻里保护嵌入//第十届IEEE计算机视觉国际会议。2005:1208-1213。
[10] 乔莉,陈仕,谭欣。稀疏性保持问题及其在人脸识别中的应用。模式识别,2010,43(1):331-341。
[11] KAI Y,TONG Z,GONG Y.使用局部坐标编码的非线性学习//神经信息处理系统的进展。2009:2223-2231。
[12] 方旭,徐毅,李旭,等。用于特征选择的局部性和相似性保持嵌入。神经计算,2014128:304-315。
[13] 王杰,杨杰,凯毅,等.图像分类的局部约束线性编码//计算机视觉与模式识别.2010:3360-3367。
[14] 方旭,徐毅,李旭,等。线性回归中非负稀疏图的学习。IEEE图像处理汇刊,2015,24(9):2760-2771
[15] YANG J,ZHANG Y.压缩传感L1问题的交替方向算法。SIAM科学计算期刊,2011,33(1):250-278。
[16] 福纳加,京之助。统计模式识别导论。学术出版社,1972年。
[17] NIE F,HUANG H,CAI X,等。基于联合2,1-范数最小化的高效稳健特征选择//神经信息处理系统进展。2010:1813-1821。
[18] 韩毅、许志明、马志明等。针对样本外数据的流形学习图像分类。信号处理,2013,93(8):2169-2177。
[19] YAN F,WANG X D.一种基于局部判别约束的半监督特征选择方法。模式识别与人工智能,2017,30(1):89-95。
[1] 宋杰, 梁美玉, 薛哲, 杜军平, 寇菲菲.
基于无监督集群级的科技论文异质图节点表示学习方法
基于无监督聚类层次的科技论文异构图节点表示学习方法
计算机科学, 2022, 49(9): 64-69.https://doi.org/10.11896/jsjkx.220500196
[2] 李斌, 万源.
基于相似度矩阵学习和矩阵校正的无监督多视角特征选择
基于相似矩阵学习和矩阵对齐的无监督多视图特征选择
计算机科学, 2022, 49(8): 86-96.https://doi.org/10.11896/jsjkx.210700124
[3] 胡艳羽, 赵龙, 董祥军.
一种用于癌症分类的两阶段深度特征选择提取算法
用于癌症分类的两阶段深度特征选择提取算法
计算机科学, 2022, 49(7): 73-78.https://doi.org/10.11896/jsjkx.210500092
[4] 康雁, 王海宁, 陶柳, 杨海潇, 杨学昆, 王飞, 李浩.
混合改进的花授粉算法与灰狼算法用于特征选择
用于特征选择的改进花授粉算法和灰狼算法的混合
计算机科学, 2022年,49(6A):125-132。https://doi.org/10.11896/jsjkx.210600135
[5] 储安琪, 丁志军.
基于灰狼优化算法的信用评估样本均衡化与特征选择同步处理
Gray-Wolf优化算法在信用评估中样本均衡和特征选择同步处理中的应用
计算机科学, 2022, 49(4): 134-139.https://doi.org/10.11896/jsjkx.210300075
[6] 孙林, 黄苗苗, 徐久成.
基于邻域粗糙集和救济的弱标记特征选择方法
基于邻域粗糙集和浮雕的弱标记特征选择方法
计算机科学, 2022, 49(4): 152-160.https://doi.org/10.11896/jsjkx.210300094
[7] 李宗然, 陈秀宏, 陆赟, 邵政毅.
鲁棒联合稀疏不相关回归
稳健的联合稀疏不相关回归
计算机科学, 2022, 49(2): 191-197.https://doi.org/10.11896/jsjkx.210300034
[8] 侯宏旭, 孙硕, 乌尼尔.
蒙汉神经机器翻译研究综述
蒙古语-汉语神经机器翻译综述
计算机科学, 2022, 49(1): 31-40.https://doi.org/10.11896/jsjkx.210900006
[9] 张叶, 李志华, 王长杰.
基于核密度估计的轻量级物联网异常流量检测方法
基于核密度估计的轻量级物联网异常流量检测方法
计算机科学, 2021, 48(9): 337-344.https://doi.org/10.11896/jsjkx.200600108
[10] 杨蕾, 降爱莲, 强彦.
基于自编码器和流形正则的结构保持无监督特征选择
基于自动编码器和流形正则化的保结构无监督特征选择
计算机科学, 2021, 48(8): 53-59.https://doi.org/10.11896/jsjkx.200700211
[11] 侯春萍, 赵春月, 王致芃.
基于自反馈最优子类挖掘的视频异常检测算法
基于自反馈最优子类挖掘的视频异常事件检测算法
计算机科学, 2021, 48(7): 199-205.https://doi.org/10.11896/jsjkx.200800146
[12] 胡艳梅, 杨波, 多滨.
基于网络结构的正则化逻辑回归
基于网络结构的正则化Logistic回归
计算机科学, 2021, 48(7): 281-291.https://doi.org/10.11896/jsjkx.201100106
[13] 周钢, 郭福亮.
基于特征选择的高维数据集成学习方法研究
基于特征选择的高维数据集成学习方法研究
计算机科学, 2021年,48(6A):250-254。https://doi.org/10.11896/jsjkx.200700102
[14] 丁思凡, 王锋, 魏巍.
一种基于标签相关度的减压阀
基于标签相关性的地形特征选择算法
计算机科学, 2021, 48(4): 91-96.https://doi.org/10.11896/jsjkx.200800025
[15] 滕俊元, 高猛, 郑小萌, 江云松.
噪声可容忍的软件缺陷预测特征选择方法
软件缺陷预测中的抗噪声特征选择方法
计算机科学, 2021, 48(12): 131-139.https://doi.org/10.11896/jsjkx.201000168
已查看
全文


摘要

引用

  共享   
  讨论   
找不到建议阅读的文章!