×

具有未观察到的成分或低于检测极限值的成分响应的回归。 (英语) Zbl 07258985号

小结:处理成分数据集中的零和缺失值的典型方法是用合理的值进行插补,然后用插补数据集(例如回归模型)估计所需的统计模型。这篇文章的目的是在贝叶斯回归(Bayesian regression)框架内提出解决这个问题的替代方法,并给出组合响应。在第一步中,含有缺失数据的成分数据集被认为遵循单纯形上的正态分布,其平均值是一些完全观测到的解释变量的Aitchison仿射线性组合。这种线性组合的系数和缺失值都可以用标准吉布斯抽样技术进行估计。在第二步中,正态分布的加性误差被认为叠加在成分响应上,如果与每个变量的加性标准偏差相比“太小”,则将值视为“低于检测极限”(BDL)。在此框架内,可以使用Metropolis-Hastings算法估计回归参数和所有缺失值(包括BDL)。这两种方法在不需要任何初步插补步骤的情况下估计回归系数,并充分传播因缺失值和BDL未被实际观测而产生的不确定性,这是插补方法无法实现的。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aitchison,J(1982)成分数据的统计分析(含讨论)。英国皇家统计学会期刊B辑(统计方法),44,139-77·Zbl 0491.62017号
[2] Aitchison,J(1986)成分数据的统计分析。伦敦:查普曼和霍尔有限公司(2003年重印,由布莱克本出版社提供额外材料)·Zbl 0688.62004号 ·doi:10.1007/978-94-009-4109-0
[3] Barceló-Vidal,C,Martín-Fernández,JA,Pawlowsky-Glahn,V(2001)《成分数据分析的数学基础》。在Ross,G(编辑),IAMG'01-The VII Annual Conference of The International Association for Mathematical Geology,Cancun:IAMG·Zbl 1052.62531号
[4] Blatt,H,Middleton,G,Murray,R(1972)沉积岩的起源。新泽西州Enlgewood Cliffs:普伦蒂斯·霍尔。
[5] Casella,G,George,EI(1992)解释吉布斯采样器。美国统计学家,46,167-74。
[6] Egozcue,JJ,Pawlowsky-Glahn,V(2005)成分数据分析中的零件组及其平衡。数学地质学,37795-828·Zbl 1177.86018号 ·doi:10.1007/s11004-005-7381-9
[7] Egozcue,JJ,Pawlowsky-Glahn,V,Mateu-Figueras,G,Barceló-Vidal,C(2003)成分数据分析的等距对数比变换。数学地质学,35279-300·Zbl 1302.86024号 ·doi:10.1023/A:1023818214614
[8] Ferreira,JTAS,Steel,FJ(2007)一类新的偏态多元分布及其在回归分析中的应用。《中国统计》,第17期,第505-29页·Zbl 1144.62035号
[9] Gelman,A,Carlin,JB,Stern,HS,Rubin,DB(1995)贝叶斯数据分析。纽约:查普曼和霍尔出版社。 ·doi:10.1201/9780429258411
[10] Gross,AL(2000)《缺失数据多重相关性的贝叶斯区间估计:吉布斯抽样方法》。多元行为研究,35,201-27·doi:10.1207/S15327906MBR3502_3
[11] Gross,AL,Torres-Quevedo,R(1995)《用贝叶斯方法估计缺失数据的相关性》。《心理测量学》,60,341-54·Zbl 0863.62026号 ·doi:10.1007/BF02294379
[12] Hastings,WK(1970)使用马尔可夫链的蒙特卡罗采样方法及其应用。《生物统计学》,57,97-109·Zbl 0219.65008号 ·doi:10.1093/biomet/57.1.97
[13] Little,RJA,Rubin,DB(2002),缺失数据的统计分析。纽约:威利·Zbl 1011.62004号 ·doi:10.1002/9781119013563
[14] Liu,C(1996)不完全数据的贝叶斯鲁棒多元线性回归。美国统计协会杂志,91,1219-27·Zbl 0880.62028号 ·doi:10.1080/01621459.1996.10476991
[15] Martín-Fernández,JA,Hron,K,Templ,M,Filzmoser,P,Palarea Albaladejo,J(2012)基于模型的合成数据中舍入零的替换:经典和稳健方法。计算统计与数据分析,562688-704·Zbl 1255.62116号 ·doi:10.1016/j.csda.2012.02.012
[16] Mateu-Figueras,G,Pawlowsky-Glahn,V,Barceló-Vidal,C(2003)《单纯形上的分布》。在Thió-Henestrosa,S,Martín-Fernández,J-A(编辑),《第一届成分数据分析国际研讨会论文集》。吉罗纳:吉罗纳大学。
[17] Palarea-Albaladejo,J,Martín-Fernández,JA,Gómez-García,JA(2007)处理成分四舍五入零的参数方法。数学地质学,39625-45·兹比尔1130.86001 ·数字对象标识代码:10.1007/s11004-007-9100-1
[18] Pawlowsky-Glahn,V,Egozcue,JJ(2001)《单形统计分析的几何方法》。随机环境研究和风险评估,15384-98·Zbl 0987.62001号 ·doi:10.1007/s004770100077
[19] R核心团队(2013)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。URLhttp://www.R-project.org。
[20] Templ,M,Hron,K,Filzmoser,P(2011)rob《成分:成分数据稳健统计分析的R包》。Pawlowsky-Glahn,V,Buccianti,A(eds),《成分数据分析:理论与应用》。英国奇切斯特:约翰·威利父子公司。 ·doi:10.1002/9781119976462.4h25
[21] Tierney,L(1994)用于探索后验分布的马尔可夫链。《统计年鉴》,第22期,1701-62页·Zbl 0829.62080号 ·doi:10.1214/aos/1176325750
[22] Tolosana-Delgado,R,von Eynatten,H(2009)《沉积物岩相成分的粒度控制:成分回归和四舍五入零点》。数学地球科学,41869-86·Zbl 1178.86025号 ·doi:10.1007/s11004-009-9216-6
[23] van den Boogaart,KG,Tolosana-Delgado,R,Bren,M(2011)检测限的成分意义。In Egozcue,JJ,Tolosana-Delgado,R,Ortego,MI(eds),《第四届成分数据分析国际研讨会论文集》。巴塞罗那:CIMNE。
[24] van den Boogaart,KG,Tolosana-Delgado,R(2013)与R.Heidelberg:Springer一起分析成分数据·Zbl 1276.62011年 ·doi:10.1007/978-3-642-36809-7
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。