×

随机缺失响应的高维回归的模型平均方法。 (英语) Zbl 1470.62107号

摘要:本研究考虑了随机缺失响应情况下的超高维预测问题。为了提高响应变量条件均值的预测精度,提出了两步模型平均法。第一步指定了几个候选模型,每个模型都具有低维预测因子。为了实现这一步骤,开发了一种新的特征筛选方法来区分活动和非活动预测因子。该方法采用多计算确定独立筛选(MI-SIS)程序,通过将具有相似大小MI-SIS值的协变量分组,形成候选模型。第二步开发了一个新的准则,用于使用加权删除一交叉验证(WDCV)找到一组候选模型平均值的最佳权重。在某些正则性条件下,我们证明了所提出的筛选统计量具有排序一致性,并且WDCV准则渐进地达到了尽可能最低的预测损失。仿真研究和实例证明了所提出的方法。

MSC公司:

62J05型 线性回归;混合模型
62兰特 大数据和数据科学的统计方面
62D10号 缺少数据
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Akaike,H.(1973)。信息论和最大似然原理的推广。第二届信息理论国际研讨会论文集,267-281。Akademiai Kiado,布达佩斯·Zbl 0283.62006号
[2] Akaike,H.(1979年)。自回归模型拟合最小AIC过程的贝叶斯推广。生物特征66,237-242·Zbl 0407.62064号
[3] Ando,T.和Li,K.C.(2014)。用于高维回归的模型平均方法。美国统计协会杂志109,254-265·Zbl 1367.62209号
[4] Chang,J.、Tang,C.Y.和Wu,Y.(2013)。边际经验似然和确定独立性特征筛选。《统计年鉴》41,2123-2148·Zbl 1277.62109号
[5] Chang,J.、Tang,C.Y.和Wu,Y.(2016)。通过边际经验似然对非参数和半参数模型进行局部独立性特征筛选。《统计年鉴》44,515-539·Zbl 1486.62082号
[6] Chiang,A.P.,Beck,J.S.,Yen,H.J.,Tayeh,M.K.,Scheetz,T.E.,Swiderski,R.E.,Nishimura,D.Y.,Braun,T.A.,Kim,K.-Y.,Huang,J.,Elbedour,K.,Carmi,R.,Slusarski,D.C.,Casavant,T.L.,Stone,E.M.和Sheffield,V.C.(2006年)。利用SNP阵列进行纯合度映射,确定了一个新的bardet-biedl综合征基因(bbs11)基因。美国国家科学院院刊103,6287-6292。
[7] Dardanoni,V.、Modica,S.和Peracchi,F.(2011年)。具有估算协变量的回归:一种广义缺失指标方法。《经济学杂志》162,362-368·Zbl 1441.62658号
[8] Fan,J.和Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。《美国统计协会杂志》96,1348-1360·Zbl 1073.62547号
[9] Fan,J.和Lv,J.(2008)。确保超高维特征空间的独立筛选。英国皇家统计学会杂志:B辑(统计方法)70849-911·Zbl 1411.62187号
[10] Fan,J.和Song,R.(2010年)。具有NP-维数的广义线性模型中的确定独立筛选。《统计年鉴》38,3567-3604·Zbl 1206.68157号
[11] Fang,F.、Lan,W.、Tong,J.和Shao,J.(2017)。使用零星数据进行预测的模型平均。《商业与经济统计杂志》37,517-527。
[12] Hansen,B.E.(2007)。最小二乘模型平均。《计量经济学》75,1175-1189·兹比尔1133.91051
[13] Hansen,B.E.和Racine,J.(2012年)。折刀模型平均值。《经济学杂志》167,38-46·Zbl 1441.62721号
[14] He,X.,Wang,L.和Hong,H.G.(2013)。高维异质数据的分位数自适应无模型变量筛选。《统计年鉴》41,342-369·Zbl 1295.62053号
[15] Hjort,N.L.和Claeskens,G.(2003)。频繁模型平均估值器。《美国统计协会杂志》98,879-899·Zbl 1047.62003年
[16] Hoeting,J.A.、Madigan,D.、Raftery,A.E.和Volinsky,C.T.(1999)。贝叶斯模型平均化:教程。统计科学14382-417·Zbl 1059.62525号
[17] Huang,J.、Ma,S.和Zhang,C.H.(2008)。稀疏高维回归模型的自适应套索。《中国统计》第18卷,1603-1618页·Zbl 1255.62198号
[18] 易卜拉欣,J.G.、朱,H.和唐,N.(2008)。使用EM算法解决缺失数据问题的模型选择标准。《美国统计协会杂志》103,1648-1658·Zbl 1286.62082号
[19] Lai,P.、Liu,Y.、Liu,Z.和Wan,Y.(2017)。随机缺失响应的超高维数据的无模型特征筛选。计算统计与数据分析105,201-216·Zbl 1466.62125号
[20] Lan,W.,Ma,Y.,Zhao,J.,Wang,H.和Tsai,C.L.(2018)。高维线性回归模型的序贯模型平均。中国统计局28,449-469·Zbl 1382.62037号
[21] Lee,S.Y.和Tang,N.S.(2006年)。具有不可忽略缺失数据的非线性结构方程模型的贝叶斯分析。《心理测量学》71,541-564·Zbl 1306.62459号
[22] Li,K.C.(1987)。岭回归中CL的渐近最优性和广义交叉验证及其在样条平滑中的应用。《统计年鉴》第14期,第1011-1112页·Zbl 0629.62043号
[23] Li,R.,Zhong,W.和Zhu,L.(2012)。通过距离相关学习进行特征筛选。美国统计协会期刊1071129-1139·Zbl 1443.62184号
[24] Little,R.J.A.和Rubin,D.B.(2019年)。缺失数据的统计分析。第3版。John Wiley&Sons Inc.,纽约·Zbl 1411.62006年
[25] Liu,Q.、Okui,R.和Yoshimura,A.(2016)。广义最小二乘模型平均。经济计量评论35,1692-1752·Zbl 1491.62061号
[26] Schomaker,M.、Wan,A.T.K.和Heumann,C.(2010年)。缺少观测值的频繁模型平均值。计算统计与数据分析54,3336-3347·兹比尔1284.62063
[27] Scheetz,T.E.、Kim,K.-Y.、Swiderski,R.E.、Philp1,A.R.、Braun,T.A.、Knudtson,K.L.、Dorrance,A.M.、DiBona,G.F.、Huang,J.、Casavant,T.L.、Sheffield,V.C.和Stone,E.M.(2006)。哺乳动物眼睛中基因表达的调节及其与黑麦病的相关性。美国国家科学院院刊103,14429-14434。
[28] Schwarz,G.(1978年)。估算模型的维度。统计年鉴6,461-464·Zbl 0379.62005年
[29] Tibshirani,R.(1996)。通过套索回归收缩和选择。英国皇家统计学会杂志:B辑(统计方法)58,267-288·兹比尔0850.62538
[30] Wan,A.T.K.、Zhang,X.和Zou,G.(2010)。采用mallows准则的最小二乘模型平均。《经济学杂志》156,277-283·Zbl 1431.62291号
[31] Wang,D.和Chen,S.(2009)。估计缺失值方程的经验可能性。《统计年鉴》37,490-517·Zbl 1155.62021号
[32] Wang,Q.和Li,Y.(2018)。如何使完整数据的无模型特征筛选方法适用于缺少响应的情况?《斯堪的纳维亚统计杂志》45,324-346·Zbl 1405.62020号
[33] Xie,J.、Lin,Y.、Yan,X.和Tang,N.(2020年)。超高维异质分类数据的类别自适应变量筛选。美国统计协会杂志115,747-760·Zbl 1445.62020号
[34] Zhang,C.H.(2010)。极小极大凹惩罚下的几乎无偏变量选择。《统计年鉴》38,894-942·Zbl 1183.62120号
[35] 张欣(2013)。随机完全缺失协变量的模型平均值。《经济快报》121、360-363·Zbl 1288.62109号
[36] Zhang,X.,Yu,D.,Zou,G.和Liang,H.(2016)。广义线性模型和广义线性混合效应模型的最优模型平均估计。美国统计协会杂志1111775-1790。
[37] Zhu,L.P.、Li,L、Li、R.和Zhu、L.X.(2011)。超高维数据的无模型特征筛选。《美国统计协会杂志》106,1464-1475·Zbl 1233.62195号
[38] 谢金汉云南省统计建模与数据分析重点实验室,云南大学,昆明,650500,中华人民共和国。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。