阿林达姆·查特吉;霍尔,彼得 当有用信息来自许多甚至所有功能时,进行高维分类。 (英语) Zbl 1462.62377号 J.印度统计协会。 50,编号1-2,51-82(2012). 摘要:在分析高维数据时,通常会将维数从数千或数万减少到更小的数字,通常在5到20之间。这样大幅度减少的一个原因是为了减少问题的概念难度。这一困难突显出,模型需要允许少量特征提供大多数可用于分类的信息,但允许更多的特征(实际上可能是所有特征)提供更高级别性能所需的其余信息。在这种情况下,推断几乎必然涉及显著的非线性方面。本文基于贝叶斯规则分类器的经验近似,并引入自适应特征选择来优化性能,提出了这类方法。这种固有的非线性方法使该方法能够利用特征之间的任何交互作用,从而提高分类器的准确性。该方法是循序渐进的,包括稳步构建一个复杂性不断增加的模型,当经验误差度量表明进一步的复杂性只会降低性能时停止。 MSC公司: 62H30型 分类和区分;聚类分析(统计方面) 62C12号机组 经验决策程序;经验贝叶斯程序 62F07型 统计排名和选择程序 62克07 密度估算 关键词:贝叶斯规则;密度估计;特征选择;内核方法;似然比;变量选择 PDF格式BibTeX公司 XML格式引用 \textit{A.Chatterjee}和\textit{P.Hall},J.Indian Stat.Assoc.50,No.1--2,51-82(2012;Zbl 1462.62377)