张伟坚 在分离两个多元正态分布的混合物之前使用主成分。 (英语) Zbl 0538.62050号 J.R.Stat.Soc.,塞尔维亚。C类 32, 267-275 (1983). 摘要:在聚类前应用主成分降低数据维数时,通常使用特征值最大的成分。我们通过两个多元正态分布的混合证明,这种做法一般来说是不合理的。导出了两个子种群的距离与主成分的任何子集之间的关系,表明特征值较大的成分不一定包含更多信息(距离)。通过使用实际数据的假设和实际情况进一步证明了这一结果。研究了缩放变量对不同分量信息分布的影响。利用一组生成的数据说明了两个正态分布的混合应用,其中信息集中在具有最大和最小特征值的分量中。 引用于43文件 MSC公司: 62H25个 因子分析和主成分;对应分析 62H30型 分类和区分;聚类分析(统计方面) 关键词:部件的选择;主要成分;群集;两个多元正态分布的混合;距离;特征值;缩放比例 PDF格式BibTeX公司 XML格式引用 \textit{W.-C.Chang},J.R.Stat.Soc.,Ser.公司。C 32、267--275(1983年;Zbl 0538.62050) 全文: DOI程序