摘要

高维、小样本数据集与传统低维数据集具有不同的几何特性。Hall等人(2005)在其关于固定样本大小下增加维度的渐近研究中表明,每个数据向量大致位于高维空间中规则单纯形的顶点上。他们结果的一个可能不吸引人的方面是潜在的假设,这要求变量,作为一个时间序列,几乎是独立的。我们利用样本协方差矩阵的渐近性质,在温和得多的条件下建立了等价的几何表示。我们讨论了结果的含义,例如在高维空间中使用主成分分析,扩展到非相关样本的情况,以及二进制分类问题。

此内容仅以PDF格式提供。
您当前没有访问此文章的权限。