×

当有用信息来自许多甚至所有功能时,进行高维分类。 (英语) Zbl 1462.62377号

摘要:在分析高维数据时,通常会将维数从数千或数万减少到更小的数字,通常在5到20之间。这样大幅度减少的一个原因是为了减少问题的概念难度。这一困难突显出,模型需要允许少量特征提供大多数可用于分类的信息,但允许更多的特征(实际上可能是所有特征)提供更高级别性能所需的其余信息。在这种情况下,推断几乎必然涉及显著的非线性方面。本文基于贝叶斯规则分类器的经验近似,并引入自适应特征选择来优化性能,提出了这类方法。这种固有的非线性方法使该方法能够利用特征之间的任何交互作用,从而提高分类器的准确性。该方法是循序渐进的,包括稳步构建一个复杂性不断增加的模型,当经验误差度量表明进一步的复杂性只会降低性能时停止。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62C12号机组 经验决策程序;经验贝叶斯程序
62F07型 统计排名和选择程序
62克07 密度估算
PDF格式BibTeX公司 XML格式引用