文件Zbl 1470.62107-zbMATH打开

随机缺失响应的高维回归的模型平均方法。（英语） Zbl 1470.62107号

统计正弦。 31，第2号，1005-1026（2021）.

摘要：本研究考虑了随机缺失响应情况下的超高维预测问题。为了提高响应变量条件均值的预测精度，提出了两步模型平均法。第一步指定了几个候选模型，每个模型都具有低维预测因子。为了实现这一步骤，开发了一种新的特征筛选方法来区分活动和非活动预测因子。该方法采用多计算确定独立筛选（MI-SIS）程序，通过将具有相似大小MI-SIS值的协变量分组，形成候选模型。第二步开发了一个新的准则，用于使用加权删除一交叉验证（WDCV）找到一组候选模型平均值的最佳权重。在某些正则性条件下，我们证明了所提出的筛选统计量具有排序一致性，并且WDCV准则渐进地达到了尽可能最低的预测损失。仿真研究和实例证明了所提出的方法。

引用于4文件

MSC公司：

62J05型	线性回归；混合模型
62兰特	大数据和数据科学的统计方面
62D10号	缺少数据

关键词：

高维数据;随机失踪;模型平均值;多重插补;筛选;加权删除一交叉验证

PDF格式 BibTeX公司 XML格式引用

参考文献：

[1]	Akaike，H.（1973）。信息论和最大似然原理的推广。第二届信息理论国际研讨会论文集，267-281。Akademiai Kiado，布达佩斯·Zbl 0283.62006号
[2]	Akaike，H.（1979年）。自回归模型拟合最小AIC过程的贝叶斯推广。生物特征66，237-242·Zbl 0407.62064号
[3]	Ando，T.和Li，K.C.（2014）。用于高维回归的模型平均方法。美国统计协会杂志109，254-265·Zbl 1367.62209号
[4]	Chang，J.、Tang，C.Y.和Wu，Y.（2013）。边际经验似然和确定独立性特征筛选。《统计年鉴》41，2123-2148·Zbl 1277.62109号
[5]	Chang，J.、Tang，C.Y.和Wu，Y.（2016）。通过边际经验似然对非参数和半参数模型进行局部独立性特征筛选。《统计年鉴》44，515-539·Zbl 1486.62082号
[6]	Chiang，A.P.，Beck，J.S.，Yen，H.J.，Tayeh，M.K.，Scheetz，T.E.，Swiderski，R.E.，Nishimura，D.Y.，Braun，T.A.，Kim，K.-Y.，Huang，J.，Elbedour，K.，Carmi，R.，Slusarski，D.C.，Casavant，T.L.，Stone，E.M.和Sheffield，V.C.（2006年）。利用SNP阵列进行纯合度映射，确定了一个新的bardet-biedl综合征基因（bbs11）基因。美国国家科学院院刊103，6287-6292。
[7]	Dardanoni，V.、Modica，S.和Peracchi，F.（2011年）。具有估算协变量的回归：一种广义缺失指标方法。《经济学杂志》162，362-368·Zbl 1441.62658号
[8]	Fan，J.和Li，R.（2001）。通过非冲突惩罚似然及其oracle属性进行变量选择。《美国统计协会杂志》96，1348-1360·Zbl 1073.62547号
[9]	Fan，J.和Lv，J.（2008）。确保超高维特征空间的独立筛选。英国皇家统计学会杂志：B辑（统计方法）70849-911·Zbl 1411.62187号
[10]	Fan，J.和Song，R.（2010年）。具有NP-维数的广义线性模型中的确定独立筛选。《统计年鉴》38，3567-3604·Zbl 1206.68157号
[11]	Fang，F.、Lan，W.、Tong，J.和Shao，J.（2017）。使用零星数据进行预测的模型平均。《商业与经济统计杂志》37，517-527。
[12]	Hansen，B.E.（2007）。最小二乘模型平均。《计量经济学》75，1175-1189·兹比尔1133.91051
[13]	Hansen，B.E.和Racine，J.（2012年）。折刀模型平均值。《经济学杂志》167，38-46·Zbl 1441.62721号
[14]	He，X.，Wang，L.和Hong，H.G.（2013）。高维异质数据的分位数自适应无模型变量筛选。《统计年鉴》41，342-369·Zbl 1295.62053号
[15]	Hjort，N.L.和Claeskens，G.（2003）。频繁模型平均估值器。《美国统计协会杂志》98，879-899·Zbl 1047.62003年
[16]	Hoeting，J.A.、Madigan，D.、Raftery，A.E.和Volinsky，C.T.（1999）。贝叶斯模型平均化：教程。统计科学14382-417·Zbl 1059.62525号
[17]	Huang，J.、Ma，S.和Zhang，C.H.（2008）。稀疏高维回归模型的自适应套索。《中国统计》第18卷，1603-1618页·Zbl 1255.62198号
[18]	易卜拉欣，J.G.、朱，H.和唐，N.（2008）。使用EM算法解决缺失数据问题的模型选择标准。《美国统计协会杂志》103，1648-1658·Zbl 1286.62082号
[19]	Lai，P.、Liu，Y.、Liu，Z.和Wan，Y.（2017）。随机缺失响应的超高维数据的无模型特征筛选。计算统计与数据分析105，201-216·Zbl 1466.62125号
[20]	Lan，W.，Ma，Y.，Zhao，J.，Wang，H.和Tsai，C.L.（2018）。高维线性回归模型的序贯模型平均。中国统计局28，449-469·Zbl 1382.62037号
[21]	Lee，S.Y.和Tang，N.S.（2006年）。具有不可忽略缺失数据的非线性结构方程模型的贝叶斯分析。《心理测量学》71，541-564·Zbl 1306.62459号
[22]	Li，K.C.（1987）。岭回归中CL的渐近最优性和广义交叉验证及其在样条平滑中的应用。《统计年鉴》第14期，第1011-1112页·Zbl 0629.62043号
[23]	Li，R.，Zhong，W.和Zhu，L.（2012）。通过距离相关学习进行特征筛选。美国统计协会期刊1071129-1139·Zbl 1443.62184号
[24]	Little，R.J.A.和Rubin，D.B.（2019年）。缺失数据的统计分析。第3版。John Wiley&Sons Inc.，纽约·Zbl 1411.62006年
[25]	Liu，Q.、Okui，R.和Yoshimura，A.（2016）。广义最小二乘模型平均。经济计量评论35，1692-1752·Zbl 1491.62061号
[26]	Schomaker，M.、Wan，A.T.K.和Heumann，C.（2010年）。缺少观测值的频繁模型平均值。计算统计与数据分析54，3336-3347·兹比尔1284.62063
[27]	Scheetz，T.E.、Kim，K.-Y.、Swiderski，R.E.、Philp1，A.R.、Braun，T.A.、Knudtson，K.L.、Dorrance，A.M.、DiBona，G.F.、Huang，J.、Casavant，T.L.、Sheffield，V.C.和Stone，E.M.（2006）。哺乳动物眼睛中基因表达的调节及其与黑麦病的相关性。美国国家科学院院刊103，14429-14434。
[28]	Schwarz，G.（1978年）。估算模型的维度。统计年鉴6，461-464·Zbl 0379.62005年
[29]	Tibshirani，R.（1996）。通过套索回归收缩和选择。英国皇家统计学会杂志：B辑（统计方法）58，267-288·兹比尔0850.62538
[30]	Wan，A.T.K.、Zhang，X.和Zou，G.（2010）。采用mallows准则的最小二乘模型平均。《经济学杂志》156，277-283·Zbl 1431.62291号
[31]	Wang，D.和Chen，S.（2009）。估计缺失值方程的经验可能性。《统计年鉴》37，490-517·Zbl 1155.62021号
[32]	Wang，Q.和Li，Y.（2018）。如何使完整数据的无模型特征筛选方法适用于缺少响应的情况？《斯堪的纳维亚统计杂志》45，324-346·Zbl 1405.62020号
[33]	Xie，J.、Lin，Y.、Yan，X.和Tang，N.（2020年）。超高维异质分类数据的类别自适应变量筛选。美国统计协会杂志115，747-760·Zbl 1445.62020号
[34]	Zhang，C.H.（2010）。极小极大凹惩罚下的几乎无偏变量选择。《统计年鉴》38，894-942·Zbl 1183.62120号
[35]	张欣（2013）。随机完全缺失协变量的模型平均值。《经济快报》121、360-363·Zbl 1288.62109号
[36]	Zhang，X.，Yu，D.，Zou，G.和Liang，H.（2016）。广义线性模型和广义线性混合效应模型的最优模型平均估计。美国统计协会杂志1111775-1790。
[37]	Zhu，L.P.、Li，L、Li、R.和Zhu、L.X.（2011）。超高维数据的无模型特征筛选。《美国统计协会杂志》106，1464-1475·Zbl 1233.62195号
[38]	谢金汉云南省统计建模与数据分析重点实验室，云南大学，昆明，650500，中华人民共和国。

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
拉	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

随机缺失响应的高维回归的模型平均方法。（英语） Zbl 1470.62107号

MSC公司：

关键词：

参考文献：

示例

领域

操作员

随机缺失响应的高维回归的模型平均方法。 （英语） Zbl 1470.62107号

MSC公司：

关键词：

参考文献：

随机缺失响应的高维回归的模型平均方法。（英语） Zbl 1470.62107号