IDEAS主页打印自https://ideas.repec.org/p/upf/upfgen/1856.html
  我的参考书目  保存此纸张

主成分分析

作者

上市的:
  • 迈克尔·格林纳克
  • 帕特里克·J·F·格罗南
  • 黑斯蒂
  • 阿方索·伊奥迪斯·德恩扎
  • 安吉洛斯·马科斯
  • 埃琳娜·图日利娜

摘要

主成分分析是一种通用的统计方法,用于将按变量分类的案例数据表简化为其基本特征,称为主成分。主成分是原始变量的几个线性组合,最大限度地解释了所有变量的方差。在此过程中,该方法仅使用这几个主要组件提供原始数据表的近似值。在这篇综述中,我们全面回顾了该方法的定义和几何学,以及其数值和图形结果的解释。主要图形结果通常以双点图的形式出现,使用主要组件映射案例,并添加原始变量以支持案例位置的距离解释。该方法的变体也被处理,例如分组数据的分析以及分类数据的分析,称为对应分析。我们还描述和说明了主成分分析的最新创新应用:它用于估计大数据矩阵中的缺失值,稀疏成分估计,以及图像、形状和函数的分析。补充材料包括R环境中的视频动画和计算机脚本。

建议引用

  • 迈克尔·格林纳克(Michael Greenacre)、帕特里克·J·F·格罗恩(Patrick J.F Groenen)、特雷弗·哈斯蒂(Trevor Hastie)、阿方索·伊奥迪斯·德恩扎(Alfonso Iodice d'Enza)、安吉洛斯·马科斯(Angelos Markos。"主成分分析,"经济学工作论文1856年,蓬佩法布拉大学经济与商业系。
  • 手柄:RePEc:upf:upfgen:1856年
    作为

    从出版商下载全文

    文件URL: https://econ-papers.upf.edu/papers/1856.pdf
    文件功能:整张纸
    下载限制:
    ---><---

    IDEAS上列出的参考文献

    作为
    1. Booysen,Frikkie&van der Berg,Servaas&Burger,Ronelle&Maltitz,Michael von&Rand,Gideon du,2008年。"使用资产指数评估撒哈拉以南非洲七个国家的贫困趋势,"世界发展爱思唯尔,第36卷(6),第1113-1130页,6月。
    2. N.Locantore&J.Marron&D.Simpson&N.Tripoli&J.Zhang&K.Cohen&Graciela Boente&Ricardo Fraiman&Babette Brumback&Christophe Croux&Jianqing Fan&Alois Kneip&John Marden&Daniel P,1999年。"功能数据的稳健主成分分析,"测试:西班牙统计与运筹学会官方期刊,施普林格;《运营调查协会》,第8卷(1),第1-73页,6月。
    3. Bongiorno,Enea G.&Goia,Aldo,2019年。"用洛伦茨曲线的函数主成分分析描述收入群体的集中度,"多元分析杂志爱思唯尔,第170(C)卷,第10-24页。
    4. Mahsa Ghorbani和Edwin K P Chong,2020年。"基于主成分的股价预测,"PLOS ONE系列,公共科学图书馆,第15卷(3),第1-20页,三月。
    5. J.Le-Rademacher&L.Billard,2017年。"直方图值数据的主成分分析,"数据分析和分类进展,施普林格;德国船级社-Gesellschaft für Klassifikation(GfKl);日本船级社;意大利统计学会分类和数据分析小组(CLADAG);国际船级社联合会(IFCS),第11卷(2),第327-351页,6月。
    6. Alexander G.Ioannidis、Javier Blanco-Portillo、Karla Sandoval、Erika Hagelberg、Carmina Barberena-Jonas、Adrian V.S.Hill、Juan Esteban Rodríguez-Rodrígue、Keolu Fox、Kathryn Robson和Sonia,2021年。"从基因组网络推断波利尼西亚人口的路径和时间,"自然《自然》,第597卷(7877),第522-526页,9月。
    7. 马特奥·马齐奥塔和阿德里亚诺·帕雷托,2019年。"PCA在井身测量中的使用与误用,"《社会指标研究:生活质量测量的国际和跨学科杂志》Springer,第142(2)卷,第451-476页,4月。
    8. Giordani,Paolo&Kiers,Henk A.L.,2006年。"模糊区间数据的三种主成分分析方法的比较,"计算统计与数据分析爱思唯尔,第51(1)卷,第379-397页,11月。
    9. J.Gower,1975年。"广义procutes分析,"心理测量学,施普林格;《心理测量学会》,第40卷(1),第33-51页,3月。
    10. Peres Neto、Pedro R.和Jackson、Donald A.和Somers、Keith M.,2005年。"有多少主要成分?确定重新访问的非平凡轴数量的停止规则,"计算统计与数据分析爱思唯尔,第49(4)卷,第974-997页,6月。
    11. 贾亚·克里希纳库玛(Jaya Krishnakumar)和A.Nagar,2008年。"基于主成分、因子分析、MIMIC和结构方程模型的多维指数的精确统计性质,"《社会指标研究:生活质量测量的国际和跨学科杂志》《施普林格》,第86卷(3),第481-496页,5月。
    12. Gad Abraham和Michael Inouye,2014年。"大规模基因组数据的快速主成分分析,"PLOS ONE系列《公共科学图书馆》,第9卷(4),第1-5页,4月。
    13. JOURNEE,Michel&NESTEROV,Yurii&RICHTARIK,Peter&SEPULCHRE,Rodolphe,2010年。"稀疏主成分分析的广义幂方法,"利达重印核心2232,卢万天主教大学,运营研究和计量经济中心(CORE)。
    14. 约翰·艾奇森和迈克尔·格林纳克,2002年。"合成数据的双像素,"英国皇家统计学会杂志C辑英国皇家统计学会,第51卷(4),第375-392页,10月。
    15. 卡尔·埃卡特和盖尔·扬,1936年。"低阶矩阵对一个矩阵的逼近,"心理测量学,施普林格;心理测量学会,第1卷(3),第211-218页,9月。
    16. Josse,Julie&Husson,François,2016年。"missMDA:一个处理多元数据分析中缺失值的包,"统计软件杂志《开放获取统计基础》,第70卷(i01)。
    17. Josse,Julie&Husson,François,2012年。"使用交叉验证近似值选择主成分分析中的成分数量,"计算统计与数据分析爱思唯尔,第56卷(6),1869-1879页。
    18. Federica Gioia和Carlo Lauro,2006年。"区间数据的主成分分析,"计算统计学Springer,第21卷(2),第343-363页,6月。
    19. 弗雷德里克·布森,2002年。"综合发展指数综述与评价,"《社会指标研究:生活质量测量的国际和跨学科杂志》施普林格,第59卷(2),第115-151页,8月。
    20. 迈克尔·格林纳克,2019年。"对应分析在含缺失数据的混合尺度数据集聚类中的应用,"经济学工作论文1626年,蓬佩法布拉大学经济与商业系。
    21. Nick Patterson和Alkes L Price和David Reich,2006年。"人口结构与特征分析,"PLOS遗传学,公共科学图书馆,第2卷(12),第1-20页,12月。
    22. 沈海鹏、黄建华,2008。"基于正则化低秩矩阵逼近的稀疏主成分分析,"多元分析杂志爱思唯尔,第99卷(6),第1015-1034页,7月。
    23. Lê,Sébastien和Josse,Julie和Husson,François,2008年。"FactoMineR:多元分析的R包,"统计软件杂志《开放获取统计基础》,第25卷(i01)。
    24. Song,Jun和Li,Bing,2021年。"函数数据的非线性和加性主成分分析,"多元分析杂志,爱思唯尔,第181卷(C)。
    25. Ocaña,F.a.和Aguilera,a.M.和Valderrama,M.J.,1999年。"基于范数选择的功能主成分分析,"多元分析杂志爱思唯尔,第71卷(2),第262-276页,11月。
    26. 大卫·里索(Davide Risso)、范妮·佩罗多(Fanny Perraudeau)、斯维特拉娜·格里布科娃(Svetlana Gribkova)、桑德琳·杜多特(Sandrine Dudoit)和珍妮·菲利佩(Jean-Philippe Vert),2018年。"一种通用灵活的单细胞RNA-seq数据信号提取方法,"自然通信《自然》,第9卷(1),第1-17页,12月。
    27. Yao,Fang和Muller,Hans-Georg和Wang,Jane Ling,2005年。"稀疏纵向数据的功能数据分析,"美国统计协会杂志,美国统计协会,第100卷,第577-590页,6月。
    28. Richards,Greg和van der Ark,L.Andries,2013年。"游客文化消费维度:多重对应分析,"旅游管理爱思唯尔,第37卷(C),第71-76页。
    29. 迈克尔·格林纳克和拉斐尔·帕尔多,2006年。"子集对应分析,"社会学方法与研究第35(2)卷,第193-218页,11月。
    30. Charles R.Harris&K.Jarrod Millman&Stéfan J.Walt&Ralf Gommers&Pauli Virtanen&David Cournapeau&Eric Wieser&Julian Taylor&Sebastian Berg&Nathaniel J.Smith&Robert Kern&Matti Picu,2020年。"使用NumPy进行数组编程,"自然《自然》,第585卷(7825),第357-362页,9月。
    31. 赖德坚,2003。"中国人类发展指标的主成分分析,"《社会指标研究:生活质量测量的国际和跨学科杂志》,施普林格,第61卷(3),第319-330页,3月。
    32. Guerra Urzola,Rosember&Van Deun,Katrijn&Vera,J.C.&Sijtsma,K.,2021年。"稀疏PCA指南:模型比较和应用,"其他出版物TiSEM4d35b931-7f49-444b-b92f-a,蒂尔堡大学经济与管理学院。
    33. Rosember Guerra-Urzola&Katrijn Van Deun&Juan C.Vera&Klaas Sijtsma,2021年。"稀疏主成分分析指南:模型比较与应用,"心理测量学,施普林格;《心理测量学会》,第86卷(4),第893-919页,12月。
    34. 阿诺德·沃伦伯格,1977年。"冗余分析——典型相关分析的替代方法,"心理测量学,施普林格;《心理测量学会》,第42卷(2),第207-219页,6月。
    35. 齐格弗里德·霍尔曼(Siegfried Hörmann)和乌卡斯·基奇恩(Kidziñski)以及马克·哈林(Marc Hallin),2015年。"动态功能主成分,"英国皇家统计学会期刊B辑皇家统计学会,第77卷(2),第319-348页,3月。
    36. Hui Zou和Trevor Hastie,2005年。"补遗:通过弹性网进行规则化和变量选择,"英国皇家统计学会学报B辑英国皇家统计学会,第67卷(5),第768-768页,11月。
    37. Herv©Cardot&David Degras,2018年。"高维在线主成分分析:选择哪种算法?,"国际统计评论国际统计局,第86(1)卷,第29-50页,4月。
    38. Hui Zou和Trevor Hastie,2005年。"通过弹性网进行正则化和变量选择,"英国皇家统计学会期刊B辑英国皇家统计学会,第67卷(2),第301-320页,4月。
    39. Li,Yingxing&Huang,Chen&Härdle,Wolfgang K.,2019年。"空间功能主成分分析及其在脑图像数据中的应用,"多元分析杂志爱思唯尔,第170(C)卷,第263-274页。
    40. Sun Makosso-Kallyth和Edwin Diday,2012年。"区间PCA对符号直方图变量的自适应,"数据分析和分类进展,施普林格;德国船级社-Gesellschaft für Klassifikation(GfKl);日本船级社;意大利统计学会分类和数据分析小组(CLADAG);国际船级社联合会(IFCS),第6卷(2),第147-159页,7月。
    完整参考文献 (包括与IDEAS上的项目不匹配的项目)

    引文

    引文由CitEc项目,订阅其RSS源用于此项目。
    作为


    引用人:

    1. Kin Sibanda&Alungile Qoko&Dorcas Gonese,2024年。"撒哈拉以南非洲国家的卫生支出、机构质量和五岁以下儿童死亡率,"IJERPH公司,MDPI,第21卷(3),第1-23页,3月。

    最相关的项目

    这些是最常引用与本书相同作品的项目,也被与本书同样的作品引用。
    1. Rosember Guerra-Urzola&Niek C.Schipper&Anya Tonne&Klaas Sijtsma&Juan C.Vera&Katrijn Deun,2023年。"主成分分析最小二乘法的稀疏化:套索约束和基数约束的比较,"数据分析和分类进展,施普林格;德国船级社-德国船级社;日本船级社;意大利统计学会分类和数据分析小组(CLADAG);国际船级社联合会(IFCS),第17卷(1),第269-286页,3月。
    2. Nerea González-García和Ana Belén Nieto-Librero&Purifiicación Galindo-Villardón,2023年。"CenetBiplot:一种新的基于弹性网CSVD的稀疏正交Biplot方法,"数据分析和分类进展,施普林格;德国船级社-德国船级社;日本船级社;意大利统计学会分类和数据分析小组(CLADAG);国际船级社联合会(IFCS),第17卷(1),第5-19页,3月。
    3. Rosember Guerra-Urzola&Katrijn Van Deun&Juan C.Vera&Klaas Sijtsma,2021年。"稀疏PCA指南:模型比较和应用,"心理测量学,施普林格;《心理测量学会》,第86卷(4),第893-919页,12月。
    4. Guerra Urzola,Rosember&Van Deun,Katrijn&Vera,J.C.&Sijtsma,K.,2021年。"稀疏PCA指南:模型比较和应用,"其他出版物TiSEM4d35b931-7f49-444b-b92f-a,蒂尔堡大学经济与管理学院。
    5. Kim,Hyun Hak&Swanson,Norman R.,2018年。"使用简约因子、机器学习、变量选择和收缩方法挖掘大数据,"国际预测杂志爱思唯尔,第34卷(2),第339-354页。
    6. Mihee Lee和Haipeng Shen&Jianhua Z.Huang&J.S.Marron,2010年。"基于稀疏奇异值分解的双聚类,"生物计量学国际生物识别学会,第66卷(4),第1087-1095页,12月。
    7. Ali Mahzarnia和Jun Song,2022年。"多元函数组稀疏回归:函数预测因子选择,"PLOS ONE系列《公共科学图书馆》,第17卷(4),第1-22页,4月。
    8. Amir Beck和Yakov Vaisbourd,2016年。"稀疏主成分分析问题:最优性条件和算法,"最优化理论与应用杂志,施普林格,第170(1)卷,第119-143页,7月。
    9. Maria Iannario&Rosaria Romano&Domenico Vistocco,2023年。"体育调查分析中多块数据的二元分析,"运筹学年鉴,施普林格,第325(1)卷,第701-714页,6月。
    10. 伊恩·乔利夫(Ian Jolliffe),2022年。"用主成分分析进行50年的个人时间旅行,"多元分析杂志爱思唯尔,第188(C)卷。
    11. Mitzi Cubilla-Montilla&Ana Belen Nieto-Librero&M.Purifiicación Galindo-Villardón&Carlos A.Torres-Cubilla,2021年。"稀疏HJ Biplot:一种基于弹性网的新方法,"数学,MDPI,第9卷(11),第1-15页,6月。
    12. 托马斯·德斯波伊斯(Thomas Despois)和凯瑟琳·多兹(Catherine Doz),2022年。"通过稀疏性识别和解释因子模型中的因子:不同的方法,"工作文件哈尔什-03626503,哈尔。
    13. 托马斯·德斯波伊斯(Thomas Despois)和凯瑟琳·多兹(Catherine Doz),2023年。"通过稀疏性识别和解释因子模型中的因子:不同的方法,"应用计量经济学杂志,John Wiley&Sons,Ltd.,第38卷(4),第533-555页,6月。
    14. Ali Habibnia和Esfandiar Maasoumi,2021年。"大数据环境中的预测:神经网络(AAShNet)的自适应自动收缩估计,"数量经济学杂志,施普林格;印度计量经济学会,第19卷(1),第363-381页,12月。
    15. 刘进兴、徐勇、郑春厚、王毅、杨靖宇,2012。"基于奇异值加权主成分的特征基因选择,"PLOS ONE系列,公共科学图书馆,第7卷(7),第1-10页,7月。
    16. Paolo Fornaro和Henri Luomaranta,2020年。"芬兰实际经济活动:机器学习方法,"实证经济学,施普林格,第58卷(1),第55-71页,1月。
    17. Petros C.Lazaridis&Ioannis E.Kavvadias&Konstantinos Demertzis&Lazaros Iliadis&Lazaro K.Vasiliadis,2023年。"钢筋混凝土框架地震累积损伤评估的可解释机器学习,"持续性,MDPI,第15卷(17),第1-31页,8月。
    18. Seán Schmitz&Sophia Becker&Laura Weiand&Norman Niehoff&Frank Schwartzbach&Erika von Schneidemesser,2019年。"公众接受交通减少政策改善城市空气质量的决定因素,"持续性,MDPI,第11卷(14),第1-16页,7月。
    19. 梅罗拉、乔瓦尼·玛丽亚和陈,杰迈,2019年。"投影稀疏主成分分析:一种有效的最小二乘法,"多元分析杂志爱思唯尔,第173(C)卷,第366-382页。
    20. Anshul Verma&Orazio Angelini&Tiziana Di Matteo,2019年。"一套新的集群驱动的综合发展指标,"论文1911.11226,arXiv.org,2020年3月修订。

    有关此项目的更多信息

    犹太人分类:

    • 第19号-数学和定量方法——计量经济和统计方法与方法:概述——其他
    • C88号-数学和定量方法——数据收集和数据估计方法;计算机程序---其他计算机软件

    统计

    访问和下载统计

    更正

    本网站上的所有材料均由各自的出版商和作者提供。你可以帮助纠正错误和遗漏。请求更正时,请提及此项目的句柄:RePEc:upf:upfgen:1856年。请参阅一般信息关于如何更正RePEc中的材料。

    如果您编写了此项目,但尚未在RePEc注册,我们鼓励您这样做在这里。这允许将您的个人资料链接到此项目。它还允许您接受我们不确定的该项目的潜在引用。

    如果CitEc公司识别了书目参考,但没有将RePEc中的项目链接到它,您可以帮助这个表格.

    如果你知道引用这一条的缺失条目,你可以通过以与上述相同的方式为每个引用条目添加相关引用来帮助我们创建这些链接。如果您是此项目的注册作者,您可能还需要检查您的RePEc作者服务个人资料,因为可能有一些引文等待确认。

    有关此项目的技术问题,或更正其作者、标题、摘要、书目或下载信息,请联系:负责人(以下电子邮件可用)。供应商的一般联系方式:网址:http://www.econ.upf.edu/.

    请注意,更正可能需要几周时间才能筛选出来各种RePEc服务。

    思想是一个经济学研究论文服务。RePEc使用各出版商提供的书目数据。