×

兹马思-数学第一资源

成分数据分析的原始路径算法。(英语) Zbl 07212311
摘要:我们考虑协变量为非负且其和始终为1的成分数据的LASSO估计。由于回归系数的线性约束由求和到一个条件,标准的套索算法不能直接应用于合成数据。因此,通常使用带有线性约束的特定正则化回归模型。然而,线性约束会增加计算时间,这在高维情况下变得更为严重。此外,在现有的方法中,没有研究回归的精确计算。本文首先提出了一种高维组合数据的正则化回归的精确解路径算法,并将其推广到分类模型中。我们还比较了它的计算速度,并将其应用于经济学中的收入不平等数据和生物学中的人体肠道微生物群数据。通过对模拟数据集和真实数据集的分析,我们证明了我们的专用算法比广义LASSO算法更有效。
理学硕士:
62 统计
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Aigner,D.J.;Amemiya,T.;Poirier,D.J.,关于生产边界的估计:不连续密度函数参数的最大似然估计,Internat。经济。修订版,17,2377-396(1976)·Zbl 0339.62083
[2] Aitchison,J.;Bacon-shone,J.,《混合物实验的对数对比模型》,Biometrika,71,2233-330(1984)
[3] Bezanson,J.;Edelman,A.;Karpinski,S.;Shah,V.B.,Julia:数值计算的新方法,暹罗修订版,59,1,65-98(2017)·Zbl 1356.68030
[4] Bondell,H.D.;Reich,B.J.,《方差分析中的同步因子选择和折叠水平》,生物特征学,65,1169-177(2009)·Zbl 1159.62048
[5] Brodie,J.;Daubechies,I.;De Mol,C.;Giannone,D.;Loris,I.《稀疏和稳定的马科维茨投资组合》,Proc。自然。Acad。科学,106,30,12267-12272(2009)·Zbl 1203.91271
[6] Buccianti,A.;Mateu Figueras,G.;Pawlowsky-Glahn,V.《地球科学中的成分数据分析:从理论到实践》(2006),伦敦地质学会·Zbl 1155.86002号
[7] Cannon,J.P.;Lee,T.A.;Bolanos,J.T.;Danziger,L.H.,《乳酸杆菌的致病相关性:超过200例的回顾性回顾》,欧洲。J、 临床。微生物学。进料。第24、1、31-40页(2005年)
[8] Efron,B.;Hastie,T.;Johnstone,I.;Tibshirani,R.,《最小角度回归》,Ann。统计,32,2,407-499(2004年)·Zbl 1091.62054
[9] Fang,H.;Huang,C.;Zhao,H.;Deng,M.,Cclasso:通过套索对成分数据进行相关性推断,生物信息学,31,19,3172-3180(2015)
[10] Friedman,J.;Hastie,T.;Hfling,H.;Tibshirani,R.,《路径坐标优化》,Ann。申请。统计,1302-332(2007年)·Zbl 1378.90064
[11] Friedman,J.;Hastie,T.;Tibshirani,R.,《通过坐标下降实现广义线性模型的正则化路径》,J.Stat.Softw.,33,1,1-22(2010年)
[十二] Gaines,B.R.;Kim,J.;Zhou,H.,《用于拟合约束套索的算法》,J.Comput。图表。Statist.,27,4861-871(2018年)
[13] Lee,C.S.;Li,X.-D.;Zhang,G.;Li,J.;Ding,A.-J.;Wang,T.,《香港和广州市区和郊区气溶胶的重金属和铅同位素组成——空气污染物、大气的长程传输证据》。《环境》,41,2432-447(2007)
[14] Lee,C.-P.;Lin,C.-J.,l2损耗(方形铰链损耗)多类支持向量机研究,神经计算,25,51302-1323(2013)·Zbl 1414.68065
[15] Leite,M.L.C.,应用成分数据方法学进行营养流行病学,统计方法医学。第25、6、3057-3065号决议(2016年)
[16] Lin,W.;Shi,P.;Feng,R.;Li,H.,《成分协变量回归中的变量选择》,Biometrika,101,4785-797(2014)·Zbl 1306.62164
[17] Meinshausen,N.;Bühlmann,P.,《稳定性选择》,J.R.Stat.Soc。爵士。B Stat.Methodol.,72,4,417-473(2010年)·Zbl 1411.62142
[18] Montassier,E.;Al-Ghalith,G.A.;Ward,T.;Corvec,S.;Gastinne,T.;Potel,G.;Moreau,P.;de la Cochetiere,M.F.;Batard,E.;Knights,D.《预处理肠道微生物群预测化疗相关血流感染》,Genome Med.,8,1,49(2016)
[19] Osborne,M.R.;Presnell,B.;Turlach,B.A.,《套索及其双套索》,J.Comput。图表。Stat.,9,2319-337(2000年)
[20] R: 统计计算语言与环境(2008),统计计算基金会:奥地利维也纳统计计算基金会,网址:http://www.R-project.org。国际标准书号3-900051-07-0
[21] Rosset,S.;Zhu,J.,分段线性正则化解路径,Ann。统计,35,31012-1030(2007年)·Zbl 1194.62094
[22] Salminen,M.K.;Tynkkynen,S.;Rautelin,H.;Saxelin,M.;Vaara,M.;Ruutu,P.;Sarna,S.;Valtonen,V.;Järvinen,A.,《芬兰鼠李糖乳杆菌gg益生菌使用快速增加期间的乳酸菌菌血症》,临床。感染。第35、10、1155-1160页(2002年)
[23] Tibshirani,R.J.;Taylor,J.,《广义套索的解路径》,Ann。统计师,39,3,1335-1371(2011年)·Zbl 1234.62107
[24] Tibshirani,R.J.,套索问题和唯一性,电子。J、 Stat.,71456-1490(2013年)·Zbl 1337.62173
[25] Tseng,P.;Yun,S.,非光滑可分离极小化的坐标梯度下降法,数学。程序,117,1-2,387-423(2009年)·Zbl 1166.90016号
[26] 周,H.;Lange,K.,约束估计的路径算法,J.Comput。图表。统计师,22,2261-283(2013年)
[27] Zhou,H.;Wu,Y.,正则化统计估计的一般路径算法,J.Amer。统计学家。协会,第109、506、686-699页(2014年)·Zbl 1367.62223
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。