2023年8月 艾奇逊40年来的成分数据分析:再评价
迈克尔·格林纳克,埃里克·格伦斯基,约翰·培根-肖恩,Ionas Erb公司,托马斯·奎因
作者关联+
统计师。科学。 38(3): 386-410 (2023年8月)。 内政部:10.1214/22-STS880

摘要

约翰·艾奇逊(John Aitchison)的成分数据分析方法自1982年向英国皇家统计学会(Royal Statistical Society)宣读其论文以来,一直沿用至今。本文总结并重新评价了Aitchison的对数比方法,该方法是为了解决在固定和约束下处理数据时存在的问题。人们坚持认为,这种方法最初所基于的性质(主要是次成分相干)不需要完全满足——准相干就足够了,也就是说就所有实际目的而言,准相干就足以达到相干。这使该字段可以使用更简单的数据转换,例如功率转换,允许数据中的零值。精确等距的附加属性随后被引入,而不是在Aitchison的原始概念中引入,强制使用等距对数比变换,但这些都很复杂,难以解释,涉及几何平均数的比。如果此属性在某些分析上下文中被视为重要的,例如无监督学习,则可以通过显示常规的两两对数比以及替代的拟相干变换也可以是拟计量的来放宽此属性,这意味着它们在所有实际用途中都足够接近精确等距。结论是,等距和相关的对数比变换(如枢轴对数比)不是良好实践的先决条件,尽管许多作者坚持必须使用它们。这一结论在这里得到了地球化学和基因组学案例研究的充分支持,在这些案例研究中,Aitchison最初提出的两两对数比或无需零替换的原始成分的Box-Cox幂变换证明了其良好性能。

致谢

我们感谢北爱尔兰地质调查局对本研究中使用的Tellus地球化学数据集的支持。Tellus数据是根据开放政府许可证提供的。此外,我们感谢期刊编辑和副编辑对我们的论文进行了非常专业和精简的处理,也感谢审稿人在两次修订中改进了这篇论文。与此同时,我们要向约翰·艾奇逊致敬,并感谢他从20世纪80年代初开始为CoDA奠定的基础。我们相信,对该领域的重新评估将有助于改进CoDA的实践。

引用

下载引文

迈克尔·格林纳克。 埃里克·格伦斯基(Eric Grunsky)。 约翰·培根·肖恩(John Bacon-Shone)。 爱奥那斯Erb。 托马斯·奎因。 “艾奇逊40年来的成分数据分析:重新评估。” 统计师。科学。 38 (3) 386 - 410, 2023年8月。 https://doi.org/10.1214/22-STS880

问询处

发布日期:2023年8月
欧几里德项目首次推出:2023年8月20日

数学科学网:MR4630375号
数字对象标识符:10.1214/22-STS880

关键词:Box–Cox变换,成分建模,对应分析,等距测量,日志管理员,对数比变换,主成分分析,普鲁克分析,亚成分连贯

版权所有©2023数学统计研究所

期刊文章
25页

此文章仅适用于订户
它不可单独出售。
+ 保存到我的库中

第38卷•第3期•2023年8月
返回页首