×

在分离两个多元正态分布的混合物之前使用主成分。 (英语) Zbl 0538.62050号

摘要:在聚类前应用主成分来降低数据的维数时,通常使用具有最大特征值的成分。我们通过两个多元正态分布的混合证明,这种做法一般来说是不合理的。导出了两个子种群的距离与主成分的任何子集之间的关系,表明特征值较大的成分不一定包含更多信息(距离)。
通过使用实际数据的假设和实际情况进一步证明了这一结果。研究了缩放变量对不同分量信息分布的影响。利用一组生成的数据说明了两个正态分布的混合应用,其中信息集中在具有最大和最小特征值的分量中。

MSC公司:

62H25个 因子分析和主成分;对应分析
62小时30分 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部