雅各布·菲克塞尔;斯科特·泽格;阿比鲁普·达塔 成分结果和预测因素的无转换线性回归。 (英语) Zbl 1520.62197号 生物计量学 78,第3号,974-987(2022). 摘要:构成数据在许多领域都很常见,既可以作为结果变量,也可以作为预测变量。当结果变量和预测变量都是组合变量时,模型的库存是有限的,并且由于使用了复杂的对数比率转换,现有模型通常很难在组合空间中解释。我们开发了一个无转换线性回归模型,其中成分结果的期望值表示为来自成分预测值的单个马尔可夫转换。我们的方法基于估计方程,因此不需要完全指定数据可能性,并且对不同的数据生成机制是鲁棒的。我们的模型解释简单,在成分结果和协变量中都允许0和1,并且包含了几个有趣的子类。我们还开发了预测因子两个分量的线性独立性和效应大小相等性的置换测试。最后,我们表明,尽管模型简单,但我们使用来自教育和医学研究的两个数据集准确地捕获了成分数据之间的关系。{©2021作者。生物计量学由威利期刊有限责任公司代表国际生物识别学会出版。} 引用于2文件 MSC公司: 第62页第10页 统计学在生物学和医学中的应用;元分析 关键词:成分数据;EM算法;估计方程;Kullback-Leibler距离损失函数;无转换 软件:ggplot2;格特恩;抢劫成分;个人数据处理;DirichletReg公司;方形 PDF格式BibTeX公司 XML格式引用 \textit{J.Fiksel}等人,《生物统计学》78,第3期,974--987(2022年;Zbl 1520.62197) 全文: 内政部 arXiv公司 OA许可证 参考文献: [1] Aitchison,J.(1982)成分数据的统计分析。英国皇家统计学会杂志:B辑(方法学),44139-160·Zbl 0491.62017号 [2] Aitchison,J.(1986)《成分数据的统计分析》。伦敦:查普曼和霍尔·Zbl 0688.62004号 [3] Aitchison,J.(1992)关于成分差异的测量标准。数学地质学,24365-379·Zbl 0970.86531号 [4] Aitchison,J.(2003)《成分数据的统计分析》。考德威尔,新泽西州:布莱克本出版社·Zbl 0688.62004号 [5] Aitchison,J.和Bacon‐Shone,J.(1984)混合物实验的对数对比模型。生物特征,71,323-330。 [6] Aitchison,J.和Bacon‐Shone,J.(1999)《构成的凸线性组合》。生物特征,86,351-364·Zbl 0931.62009号 [7] Alenazi,A.(2019)成分数据回归,将成分数据作为预测变量,有无零值。数据科学杂志,17,219-237。 [8] Billheimer,D.、Guttorp,P.和Fagan,W.F.(2001)物种组成的统计解释。《美国统计协会杂志》,96,1205-1214·兹比尔1073.62573 [9] Böhning,D.(1992)多项式逻辑回归算法。统计数学研究所年鉴,44,197-200·Zbl 0763.62038号 [10] Butler,A.和Glasbey,C.(2008)零成分数据的潜在高斯模型。英国皇家统计学会杂志:C辑(应用统计学),57,505-520。 [11] Chen,J.、Zhang,X.和Li,S.(2017)具有成分响应和协变量的多元线性回归。应用统计学杂志,442270-2285·Zbl 1516.62201号 [12] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977)通过em算法从不完整数据中获得最大似然。英国皇家统计学会杂志:B辑(方法学),39,1-22·Zbl 0364.62022号 [13] Du,Y.和Varadhan,R.(2020)SQUAREM:EM、MM和其他类似EM的单调算法的现成加速的R包。统计软件杂志,文章,92,1-41。 [14] Dubow,E.F.、Boxer,P.和Huesmann,L.R.(2009)父母教育对儿童教育和职业成功的长期影响:家庭互动、儿童攻击和青少年抱负的调解。《梅里尔·帕尔默季刊》(韦恩州立大学出版社),第55、224页。 [15] Dumuid,D.,Stanford,T.E.,Martin‐Fernández,J.‐A。,佩迪西奇。,Maher,C.A.、Lewis,L.K.等(2018)体力活动、久坐时间和睡眠研究的成分数据分析。医学研究中的统计方法,27,3726-3738。 [16] Egozcue,J.J.、Pawlowsky‐Glahn,V.、Mateu‐Figueras,G.和Barcelo‐Vidal,C.(2003)成分数据分析的等距对数比变换。数学地质学,35279-300·Zbl 1302.86024号 [17] 欧盟统计局(2015)《档案:生活状况统计——当今成人儿童的家庭状况》。https://ec.europa.eu/eurostat/统计解释/index.php?title=生存条件统计_-_今天的家庭状况 [18] Fiksel,J.和Datta,A.(2020)《法典:成分结果和预测因子的无转换线性回归》。https://cran.r-project.org/package=codalm。访问日期:2020年1月3日。 [19] Fiksel,J.、Datta,A.、Amouzou,A.和Zeger,S.(2021)数据集移动下的广义贝叶斯量化学习。美国统计协会杂志,https://doi.org/101080/01621459.2021.1909599 ·Zbl 1514.68247号 ·doi:10.1080/01621459.2021.1909599 [20] Filzmoser,P.、Hron,K.和Templ,M.(2018)《瑞士R.Cham的应用成分数据分析和工作实例:Springer》。 [21] Friedman,J.、Hastie,T.和Tibshirani,R.(2001)《统计学习的要素》,第1卷。统计学中的斯普林格系列。纽约:斯普林格·Zbl 0973.62007号 [22] Gourieroux,C.、Monfort,A.和Trogon,A.(1984)《伪最大似然法:理论》。《计量经济学》,52,681-700·Zbl 0575.62031号 [23] Greenwell,B.M.(2017)pdp:用于构建部分依赖图的R包。《R杂志》,9,421-436。 [24] Hamilton,N.E.和Ferry,M.(2018)ggtern:使用ggplot2的三元图。统计软件杂志,代码段,87,1-17。 [25] Hron,K.、Filzmoser,P.和Thompson,K.(2012年)《成分解释变量的线性回归》。应用统计学杂志,391115-1128·Zbl 1514.62130号 [26] Jones,M.M.T.(2005)使用比例数据估计马尔可夫转移矩阵:信用风险的应用。编号5‐219。华盛顿。DC:国际货币基金组织。 [27] Lee,T.‐C。,Judge,G.G.和Zellner,A.(1970)从聚合时间序列数据估计马尔可夫概率模型的参数。《对经济分析的贡献》,第65卷。阿姆斯特丹:荷兰北部·Zbl 0199.53202号 [28] Leite,M.L.C.(2016)将成分数据方法应用于营养流行病学。医学研究中的统计方法,253057-3065。 [29] Lin,W.,Shi,P.,Feng,R.和Li,H.(2014)成分协变量回归中的变量选择。生物特征,101785-797·Zbl 1306.62164号 [30] MacRae,E.C.(1977)用聚合数据估计时变马尔可夫过程。《计量经济学》,第45期,第183-198页·兹伯利0364.62084 [31] Maier,M.J.(2014)Dirichletreg:R.研究报告系列中成分数据的Dirichlet回归,报告125。澳大利亚维也纳:WU维也纳经济与商业大学统计与数学研究所。 [32] Morais,J.、Thomas‐Agnan,C.和Simioni,M.(2018)解释变量对成分回归模型的影响。《奥地利统计杂志》,47,1-25。 [33] Mullahy,J.(2015)计量经济份额模型的多元分数回归估计。《计量经济学方法杂志》,471-100·Zbl 1345.6206号 [34] Murteira,J.M.和Ramalho,J.J.(2016)多元分数数据的回归分析。《计量经济学评论》,35,515-552·Zbl 1491.62248号 [35] Nguyen,T.H.A.、Laurent,T.、Thomas‐Agnan,C.和Ruiz‐Gazen,A.(2018)用尾码法分析社会经济因素对法国部门选举的影响。TSE工作文件18‐961。法国图卢兹:图卢兹经济学院(TSE)。 [36] Papke,L.E.和Wooldridge,J.M.(1996)分数响应变量的计量经济学方法及其在401(k)计划参与率中的应用。应用计量经济学杂志,11619-632。 [37] Templ,M.、Filzmoser,P.和Reimann,C.(2008)《应用于区域地球化学数据的聚类分析:问题和可能性》。应用地球化学,232198-2213。 [38] Templ,M.、Hron,K.和Filzmoser,P.(2011)《成分:成分数据稳健统计分析的R‐包》。收录:Pawlowsky,V.(编辑)和Buccianti,G.A.(编辑)《成分数据分析:理论与应用》。纽约:约翰·威利父子出版社,第341-355页。 [39] Tsagris,M.(2015)使用包含零值的成分数据进行回归分析。arXiv预印本,arXiv:1508.01913·Zbl 1449.62152号 [40] Van den Boogaart,K.G.和Tolosana‐Delgado,R.(2013)《利用R分析成分数据》,第122卷。柏林:斯普林格·Zbl 1276.62011年 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。