亨尼,C。;辛齐亚·维罗利 基于分位数的分类器。 (英语) Zbl 1499.62212号 生物特征 103,第2期,435-446(2016). 摘要:用小样本高维数据进行分类在许多应用领域都很重要。分位数分类器是基于距离的分类器,无论维数如何,都需要一个参数,并根据观测分量到类内分位数的加权分量距离之和对观测进行分类。通过最小化训练样本中的误分类错误,可以选择分位数的最佳百分比。结果表明,对于具有渐近最优分位数的分类规则,这种选择是一致的,并且在某些假设下,随着变量数趋于无穷大,正确分类的概率收敛到一。讨论了预测变量分布偏态的影响。在综合仿真研究和实际数据应用中,最优分位数分类器可降低误分类率。 引用于5文件 MSC公司: 62小时30分 分类和区分;聚类分析(统计方面) 关键词:高维数据;基于中值的分类器;误分率;偏斜度 PDF格式BibTeX公司 XML格式引用 \textit{C.Hennig}和\textit{C.Viroli},Biometrika 103,编号2,435-446(2016;Zbl 1499.62212) 全文: DOI程序 arXiv公司