计算机工程与应用››2021,第57卷››问题(6): 58-66.内政部:10.3778/j.issn.1002-8331.2003-0227

• 理论与研发 • 上一篇   下一篇

针对高维数据的马尔科夫毯特征选择

李静星,杨有龙  

  1. 西安电子科技大学 数学与统计学院,西安 710126
  • 出版日期:2021-03-15 发布日期:2021-03-12

高维数据的马尔可夫覆盖特征选择

李京兴、杨友龙  

  1. 西安710126西电大学数学与统计学院
  • 在线:2021-03-15 出版:2021-03-12

摘要:

针对不满足忠实分布的高维数据分类问题,一种新的基于粒子群算法的马尔科夫毯特征选择方法被提出。它通过有效地提取相关特征和剔除冗余特征,能够产生更好的分类结果。在特征预处理阶段,该算法通过最大信息系数衡量标准对特征的相关度和冗余性进行分析得到类属性的马尔科夫毯代表集和次最优特征子集;在搜索评价阶段,采用新的适应度函数通过粒子群算法选出最优特征子集;用此模型对测试集进行预测。实验结果表明,该算法在12个数据集上具有一定的优势。

关键词: 特征选择, 最大信息系数, 马尔科夫毯代表集, 你好, 适应度函数, 粒子群算法

摘要:

针对高维数据分类不满足信度分布的问题,提出了一种基于粒子群优化的马尔可夫覆盖特征选择算法。通过有效提取相关特征并消除冗余特征,可以产生更好的分类结果。在特征预处理阶段,该算法利用最大信息系数度量标准分析特征的相关性和冗余性,得到类属性的马尔可夫覆盖代表集和次优特征子集。在搜索和评估阶段,使用新的适应度函数通过粒子群优化来选择最优特征子集。该模型用于预测测试集。实验结果表明,该算法在12个数据集上具有一定的优势。

关键词: 特征选择, 最大信息系数, 马尔可夫毯子代表集, 次优特征子集, 健身功能, 粒子群优化