×

非线性主成分分析及其应用。 (英文) Zbl 1366.62011年

Springer统计简报JSS统计研究系列。新加坡:Springer(ISBN 978-981-10-0157-4/pbk;978-981-10-0159-8/电子书)。viii,80页。(2016).
本书涉及非线性主成分分析(PCA)和多重对应分析(MCA)的原理和相关应用,它们是分析混合测量水平数据的有用方法,即联合包括分类(标称和序数)和数值变量的数据。
在这个框架内,本专著分为两部分。第一部分(非线性主成分分析)由本书的第2-3章组成,而第二部分(应用和相关主题)由最后四章(第4-7章)组成。第一章(引言)简要介绍了这本专著的概况。在续集中,简要介绍了第2-7章中每一章的主题。
在第二章(非线性主成分分析)中,首先简要介绍了普通主成分分析。众所周知,普通PCA用于将大量变量减少为少量复合变量,且信息损失尽可能少,除其他外,它还受到假设所有变量都在数字级别缩放的限制。然而,它可以扩展到处理混合测量水平数据。对于这种扩展,需要对定性数据进行量化,以获得最佳缩放数据。具有最优尺度的PCA称为非线性PCA。在第二章的后续部分,讨论了定性数据的量化,并引入了非线性PCA。结果表明,非线性PCA可以通过最小化两类损失函数来求解:低阶近似和带约束的同质性分析。为此,提供了使用交替最小二乘(ALS)算法的两种算法:原理F.W.杨等【《心理测量学》43、279–281(1978;Zbl 0383.92001号)]以及A.吉菲【非线性多元分析。奇切斯特等:John Wiley&Sons(1990;Zbl 0697.62048号)]. 第2章的最后一节给出了非线性PCA的示例。
MCA是一种广泛用于分析分类数据的技术,其目的是将大的变量集简化为较小的组分集,以总结数据中包含的信息。由于MCA的目的与PCA相似,因此可以将其视为对PCA分类数据的自适应。基于这一事实,第三章(多重对应分析)介绍了MCA作为非线性PCA的一个特例。在该框架中,给出了一个公式,其中量化的数据矩阵通过使用量化技术的较低秩矩阵来近似。第3章最后一节给出了MCA的演示。
本书的应用部分(第二部分)由四章组成。在每一章中,讨论了非线性PCA的一个应用。第二部分第一章(第4章,非线性主成分分析中的变量选择)描述了混合测量水平数据的变量选择。具体而言,考虑到任何测量级多元数据都可以在主成分分析的背景下由具有最佳尺度的ALS统一处理为数值数据(如第2章所示),提出了非线性主成分分析中的变量选择。第二部分第二章(第5章,稀疏多重对应分析)阐述了稀疏MCA。一个实际数据示例表明,稀疏MCA可以提供简单的解决方案。第6章(联合降维与聚类)阐述了联合降维和聚类。在此背景下,对结合MCA和(k)-均值聚类来获得定性变量关系的技术进行了综述。以实际数据为例进行了说明。最后,在第7章(非线性主成分分析交替最小二乘算法的收敛加速)中,提出了ALS的加速算法。提出的算法使用了数值分析领域的一种思想(向量(varepsilon)算法),旨在生成比第2章中提出的算法更快的线性收敛序列。
总之,本书试图证明非线性主成分分析和主成分分析的理论和应用的有用性。作者写了一本有趣且极具价值的书,对其主题的数学基础和统计原理进行了极好的概述。在每一章的末尾,提供了一个简短的参考文献列表,这将有助于希望进一步研究这一领域的读者。

MSC公司:

62-02 与统计有关的研究展览(专著、调查文章)
62-07 数据分析(统计)(MSC2010)
62H25个 因子分析和主成分;对应分析
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部