计算机工程与应用››2020,第56卷››发行(11): 51-59.内政部:10.3778/j.issn.1002-8331.1907-0352

• 理论与研发 • 上一篇   下一篇

最大熵和[二,0]范数约束的无监督特征选择算法

周婉莹,马盈仓,续秋霞,郑毅  

  1. 西安工程大学 理学院,西安 710600
  • 出版日期:2020-06-01 发布日期:2020-06-01

基于最大熵和[12,0]范数约束的无监督特征选择算法

周婉莹、马英仓、徐秋霞、郑毅  

  1. 西安理工大学科学学院,中国西安710600
  • 在线:2020-06-01 出版:2020-06-01

摘要:

无监督特征选择可以降低数据维数,提高算法的学习性能,是机器学习和模式识别等领域中的重要研究课题。和大多数在目标函数中引入稀疏正则化解决松弛问题的方法不同,提出了一种基于最大熵和[二,0]范数约束的无监督特征选择算法。使用具有唯一确定含义的[二,0]范数等式约束,即选择特征的数量,不涉及正则化参数的选取,避免调整参数。结合谱分析探索数据的局部几何结构并基于最大熵原理自适应的构造相似矩阵。通过增广拉格朗日函数法,设计了一种交替迭代优化算法对模型求解。在四个真实数据集上与其他几种无监督特征选择算法的对比实验,验证了所提算法的有效性。

关键词: 无监督特征选择, 范数约束, 最大熵, 增广拉格朗日

摘要:

无监督特征选择可以降低数据维数,提高算法的学习性能。它是机器学习和模式识别领域的一个重要研究课题。与大多数通过在目标函数中引入稀疏正则化来解决松弛问题的方法不同,提出了一种基于最大熵和[12,0]范数约束的无监督特征选择算法。首先,使用具有唯一明确意义的[l2,0]范数相等约束,即选择特征个数,这不涉及正则化参数的选择,也避免了参数调整。其次,结合谱分析,探索数据的局部几何结构,并基于最大熵原理自适应构造相似矩阵。最后,设计了一种替代迭代优化算法,用增广拉格朗日函数法求解模型。在四个实际数据集上与其他无监督特征选择算法进行比较,验证了该算法的有效性。

关键词: 无监督特征选择, 范数约束, 最大熵, 增广拉格朗日