×

一种基于似然的boosting算法,用于二进制数据的因子分析模型。 (英语) Zbl 07476379号

小结:统计增强是一种非常有效的方法,用于拟合复杂模型,同时执行变量选择和防止过拟合。然而,现有的方法并不直接适用于二进制数据的因子分析模型,因为任何梯度下降方法都无法在零载荷下从起点开始移动。该算法利用对数似然函数的负曲率方向,能够避开局部非凸区域。采用组件式方法可得到稀疏解,其优点是便于解释,而无需对载荷进行后旋转。该方法还对估计值进行正则化,从而减少其均方误差。为了减轻推理过程的计算负担,使用了一种合适的伪似然,称为两两似然。此外,为了自动选择模型中包含的潜在变量的数量,考虑了组套索惩罚。通过仿真研究和实际数据实例说明了该方案的良好性能。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 巴托洛缪,D.J。;Knott,M。;穆斯塔基,I.,《潜在变量模型和因子分析:统一方法》(2011年),威利:威利伦敦·Zbl 1266.62040号
[2] Battauz,M.,标称响应模型的正则化估计,Multivar。行为。研究,55,811-824(2020)
[3] 贝根,A.A。;Glas,C.A.,多维IRT模型的MCMC估计和一些模型-效应分析,《心理测量学》,66,541-561(2001)·兹比尔1293.62234
[4] 博克·R·D。;Aitkin,M.,项目参数的边际最大似然估计:EM算法的应用,《心理测量学》,46,443-459(1981)
[5] Bühlmann,P。;Yu,B.,稀疏推进,J.Mach。学习。第71001-1024号决议(2006年)·Zbl 1222.68155号
[6] Cai,L.,用Metropolis-Hastings-Robbins-Monro算法进行高维探索性项目因子分析,《心理测量学》,75,33-57(2010)·Zbl 1272.62113号
[7] De Bin,R.,Cox回归中的Boosting:基于相似性和基于模型的方法之间的比较,重点是R包CoxBoost和mboost,Compute。统计,31,513-531(2016)·Zbl 1342.65029号
[8] de Leon,A.,分组连续模型的成对似然法及其扩展,Stat.Probab。莱特。,75, 49-57 (2005) ·Zbl 1080.62039号
[9] Eddelbuettel,D。;François,R.,Rcpp:无缝R和C++集成,J.Stat.Softw。,40, 1-18 (2011)
[10] Eddelbuettel,D。;Sanderson,C.,RcppArmadillo:使用高性能C++线性代数加速R,计算。统计数据分析。,71, 1054-1063 (2014) ·Zbl 1471.62055号
[11] 欧洲气压计88.1(2017)。GESIS数据档案,科隆。ZA6925数据文件版本1.0.0(2018)
[12] 弗伦德,Y。;Schapire,R.E.,《新增压算法的实验》,(机器学习:第十三届国际会议论文集(1996),Morgan Kaufmann:Morgan Koufmann San Francisco,CA,USA),148-156
[13] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,《加性逻辑回归:助推的统计观点》,Ann.Stat.,28337-407(2000)·Zbl 1106.62323号
[14] Friedman,J.H.,《贪婪函数近似:梯度提升机》,《Ann.Stat.》,第29期,第1189-1232页(2001年)·Zbl 1043.62034号
[15] 高,X。;Song,P.X.-K.,高维数据中模型选择的复合似然贝叶斯信息标准,美国统计协会,105,1303-1325(2010)
[16] 新墨西哥州古尔德。;Lucidi,S。;罗姆,M。;Toint,P.L.,在无约束优化的线搜索方法中利用负曲率方向,Optim。方法软件。,14, 75-98 (2000) ·Zbl 0988.90039号
[17] Jöreskog,K.G。;穆斯塔基,I.,《序数变量的因子分析:三种方法的比较》,多变量。行为。第36347-387号决议(2001年)
[18] Katsikatsou,M。;穆斯塔基,I。;杨华伦,F。;Jöreskog,K.G.,具有有序数据的因子分析模型的成对似然估计,计算。统计数据分析。,56, 4243-4258 (2012) ·Zbl 1255.62172号
[19] Kirk,D.B.,关于二元正态(四分位)相关系数的数值近似,《心理测量学》,38,259-268(1973)·Zbl 0282.62049号
[20] Lindsay,B.G.,复合似然法,康特姆。数学。,80, 221-239 (1988) ·Zbl 0672.62069号
[21] Mayr,A。;粘合剂H。;Gefeller,O。;Schmid,M.,《推进算法的演变》,《方法与医学》,第53期,第419-427页(2014年)
[22] McCormick,G.P.,修改Armijo的负曲率步长规则,数学。程序。,13, 111-115 (1977) ·Zbl 0367.90100号
[23] 奥利瓦雷斯,A。;Moguerza,J.M。;Prieto,F.J.,《在改进的线性搜索中使用负曲率的非凸优化》,欧洲期刊Oper。Res.,189,706-722(2008)·Zbl 1146.90054号
[24] R: 统计计算语言与环境(2020),R统计计算基金会:R统计计算基础,奥地利维也纳
[25] Reckase,M.D.,多维项目反应理论模型(2009),Springer:Springer纽约·Zbl 1291.62023号
[26] Reise,S.P。;Revicki,D.A.,《项目反应理论建模手册:在典型绩效评估中的应用》(2014),Routledge:Routledge New York
[27] Revelle,W.,《心理学:心理学、心理测量学和人格研究程序》(2020),西北大学:伊利诺伊州西北大学埃文斯顿分校,R包2.0.9版
[28] 夏皮雷,R.E。;Freund,Y.,《Boosting:Foundations and Algorithms》(2012),麻省理工学院出版社:麻省理学院出版社剑桥·Zbl 1278.68021号
[29] 席林,S。;Bock,R.D.,用自适应正交法进行高维最大边际似然项目因子分析,《心理测量学》,70533-555(2005)·Zbl 1306.62497号
[30] 赛博尔德,H。;伯瑙,C。;布列斯特,A.-L。;De Bin,R.,《关于高维线性Cox模型提升步骤数的选择和影响》,计算。统计,33,1195-1215(2018)·Zbl 1417.65056号
[31] Sun,J。;陈,Y。;刘杰。;Ying,Z。;Xin,T.,通过(L_1)正则化选择多维项目反应理论模型的潜在变量,《心理测量学》,81921-939(2016)·兹比尔1367.62322
[32] Tutz,G。;Binder,H.,通过基于likelihood-based boosting的隐式变量选择的广义加性建模,生物统计学,62961-971(2006)·Zbl 1116.62075号
[33] Tutz,G。;Gerthiss,J.,《评分量表作为预测因素——量表水平的老问题和一些答案》,《心理测量学》,79,357-376(2014)·Zbl 1308.62151号
[34] Van Houwelingen,J.C。;Le Cessie,S.,统计模型的预测值,Stat.Med.,91303-1325(1990)
[35] Varin,C.,《综合边际可能性》,高级统计分析。,92, 1-28 (2008) ·Zbl 1171.62315号
[36] Varin,C.等人。;N.里德。;Firth,D.,《复合似然法概述》,Stat.Sin。,21, 5-42 (2011) ·Zbl 05849508号
[37] 瓦林,C。;Vidoni,P.,关于复合似然推断和模型选择的注释,Biometrika,92519-528(2005)·Zbl 1183.62037号
[38] 袁,M。;Lin,Y.,《分组变量回归中的模型选择和估计》,J.R.Stat.Soc.,Ser。B、 统计方法。,68, 49-67 (2006) ·Zbl 1141.62030号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。