×

高维错误指定模型的双估计友好推理。 (英语) Zbl 07654778号

总结:所有模型都可能是错误的,但这不一定是推理的问题。考虑随机设计线性模型中预测响应(Y)的变量(X)显著性的标准(t)检验,同时控制其他协变量(Z)。这就产生了零假设的正确渐近I型误差控制,该零假设在任意的(X,Z)上(Y)的回归模型,前提是(Z)上的(X)的线性回归模型成立。对于广义线性模型中的Wald检验,我们称之为“双估计友好”(DEF)性质,这种与错误指定类似的稳健性也适用,但需要进行一些小的修改。
在本文中,我们探讨了这一现象,并提出了尊重DEF属性的高维回归设置方法。我们主张为(Y)和相关协变量(X)指定(稀疏)广义线性回归模型;我们的框架给出了条件独立性为null的有效推论,如果这些都成立。在这两种规格都是线性的特殊情况下,我们的建议相当于对流行的衰减拉索测试进行了小修改。我们还研究了通过反转我们的测试来构建(X)回归系数的置信区间;即使在部分线性模型中,(Z)对(Y)的贡献可以是任意的,这些模型也有覆盖保证。数值实验证明了该方法的有效性。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bang,H.和Robins,J.M.(2005年)。缺失数据和因果推理模型中的双重稳健估计。生物识别61 962-972. ·Zbl 1087.62121号 ·文件编号:10.1111/j.1541-0420.2005.00377.x
[2] Belloni,A.、Chernozhukov,V.和Wang,L.(2011年)。方形套索:通过圆锥曲线编程对稀疏信号进行枢轴恢复。生物计量学98 791-806. ·Zbl 1228.62083号 ·doi:10.1093/biomet/asr043
[3] 博克斯,G.E.P.(1976)。科学和统计。J.Amer。统计师。协会。71 791-799. ·Zbl 0335.62002号
[4] BRADIC,J.、WAGER,S.和ZHU,Y.(2019)。平均治疗效果的稀疏双稳健推断。预印本。可从arXiv:1905.00744获得。
[5] BRILLINGER,D.R.(1983年)。具有“高斯”回归变量的广义线性模型。埃里希·莱曼的节日.华兹华斯统计师/可能性。序列号。97-114. 加利福尼亚州贝尔蒙特市沃兹沃斯·Zbl 0519.62050号
[6] Bühlmann,P.和van de Geer,S.(2011)。高维数据统计:方法、理论和应用.统计学中的斯普林格系列海德堡施普林格·Zbl 1273.62015年 ·doi:10.1007/978-3-642-20192-9
[7] BüHLMANN,P.和VAN DE GEER,S.(2015)。指定错误线性模型中的高维推理。电子。J.统计。9 1449-1473. ·Zbl 1327.62420号 ·doi:10.1214/15-EJS1041
[8] BUJA,A.,BROWN,L.,BERK,R.,GEORGE,E.,PITKIN,E.,TRASKIN,M.,ZHANG,K.和ZHAO,L.(2019a)。近似模型I:用线性回归说明的结果。统计师。科学。34 523-544. ·兹比尔1440.62020 ·doi:10.1214/18-STS693
[9] BUJA,A.、BROWN,L.、KUCHIBHOTLA,A.K.、BERK,R.、GEORGE,E.和ZHAO,L.(2019b)。模型近似II:参数回归的无模型理论。统计师。科学。34 545-565. ·Zbl 1440.62021号 ·doi:10.1214/18-STS694
[10] Cai,T.T.和Guo,Z.(2017)。高维线性回归的置信区间:最小最大速率和适应性。安。统计师。45 615-646. ·Zbl 1371.62045号 ·doi:10.1214/16-AOS1461
[11] Candès,E.、Fan,Y.、Janson,L.和Lv,J.(2018年)。淘金:高维可控变量选择的“X型”仿制品。J.R.统计社会服务。B.统计方法。80 551-577. ·兹比尔1398.62335 ·doi:10.1111/rssb.12265
[12] CAO,W.、TSIATIS,A.A.和DAVIDIAN,M.(2009)。改进不完全数据总体均值的双稳健估计的效率和鲁棒性。生物计量学96 723-734. ·Zbl 1170.62007年
[13] Chernozhukov,V.、Chetverikov,D.、Demirer,M.、Duflo,E.、Hansen,C.、Newey,W.和Robins,J.(2018)。用于治疗和结构参数的双/脱苦机器学习。经济。J。21 C1-C68·Zbl 07565928号 ·doi:10.1111/ectj.12097
[14] BüHLMANN,P.、KALISCH,M.和MEIER,L.(2014)。着眼于生物学应用的高维统计。每年。修订状态申请。1 255-278.
[15] DEZEURE,R.、BüHLMANN,P.、MEIER,L.和MEINSHAUSEN,N.(2015)。高维推断:置信区间、(p\)-值和R软件hdi。统计师。科学。30 533-558. ·Zbl 1426.62183号 ·doi:10.1214/15-STS527
[16] DUAN,N.和LI,K.-C.(1991)。切片回归:一种无链接回归方法。安。统计师。19 505-530. ·Zbl 0738.62070号 ·doi:10.1214/aos/1176348109
[17] DUKES,O.、AVAGYAN,V.和VANSTEELANDT,S.(2020年)。高维混杂下暴露效应的双重稳健测试。生物识别76 1190-1200. ·Zbl 1520.62184号 ·doi:10.1111/biom.13231
[18] Efron,B.、Hastie,T.、Johnstone,I.和Tibshirani,R.(2004)。最小角度回归。安。统计师。32 407-499. ·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[19] Friedman,J.、Hastie,T.和Tibshirani,R.(2010)。广义线性模型的坐标下降正则化路径。J.统计软件。33 1-22.
[20] Hastie,T.、Tibshirani,R.和Wainwright,M.(2015)。稀疏的统计学习:拉索和推广.统计学和应用概率专著143.佛罗里达州博卡拉顿CRC出版社。
[21] HUBER,P.J.(1967年)。非标准条件下极大似然估计的行为。程序。伯克利第五交响乐团。数学。统计师。和概率(加州伯克利., 1965/66),第一卷:统计221-233. 加利福尼亚大学出版社,加利福尼亚州伯克利·Zbl 0212.21504号
[22] JANKOVá,J.、SHAH,R.D.、BüHLMANN,P.和SAMWORTH,R.J.(2020年)。高维广义线性模型中的优良性测试。J.R.统计社会服务。B.统计方法。82 773-795. ·Zbl 07554773号 ·doi:10.1111/rssb.12371
[23] JENNRICH,R.I.(1969年)。非线性最小二乘估计量的渐近性质。安。数学。斯达。40 633-643. ·Zbl 0193.47201号 ·doi:10.1214/aoms/1177697731
[24] Kang,J.D.Y.和Schafer,J.L.(2007)。双重稳健性的解密:从不完整数据估计总体平均值的替代策略的比较。统计师。科学。22 523-539. ·Zbl 1246.62073号 ·doi:10.1214/07-STS227
[25] LI,K.-C.和DUAN,N.(1989)。链接冲突下的回归分析。安。统计师。17 1009-1052. ·Zbl 0753.62041号 ·doi:10.1214/aos/1176347254
[26] MACKINNON,J.G.和WHITE,H.(1985年)。一些具有改进的有限样本性质的异方差一致协方差矩阵估计。J.计量经济学29 305-325.
[27] Ning,Y.和Liu,H.(2017)。稀疏高维模型的假设检验和置信域的一般理论。安。统计师。45 158-195. ·Zbl 1364.62128号 ·doi:10.1214/16-AOS1448
[28] Ren,Z.、Sun,T.、Zhang,C.-H.和Zhou,H.H.(2015)。大高斯图形模型估计的渐近正态性和最优性。安。统计师。43 991-1026. ·Zbl 1328.62342号 ·doi:10.1214/14-AOS1286
[29] ROBINS,J.M.、MARK,S.D.和NEWEY,W.K.(1992)。通过在混杂因素上模拟暴露条件的期望来估计暴露影响。生物识别48 479-495. ·兹比尔0768.62099 ·doi:10.2307/2532304
[30] Robins,J.M.和Rotnitzky,A.(1995年)。缺失数据多元回归模型的半参数效率。J.Amer。统计师。协会。90 122-129. ·Zbl 0818.62043号
[31] Rosenbaum,P.R.和Rubin,D.B.(1983年)。倾向评分在因果效应观察性研究中的中心作用。生物计量学70 41-55. ·Zbl 0522.62091号 ·doi:10.1093/生物技术/70.141
[32] ROTNITZKY,A.、LEI,Q.、SUED,M.和ROBINS,J.M.(2012)。改进了缺失数据和因果推理模型中的双稳健估计。生物计量学99 439-456. ·Zbl 1239.62071号 ·doi:10.1093/biomet/ass013
[33] Scharfstein,D.O.、Rotnitzky,A.和Robins,J.M.(1999)。使用半参数无响应模型调整不可忽略的退出。J.Amer。统计师。协会。94 1096-1146. ·Zbl 1072.62644号 ·doi:10.2307/2669923
[34] Shah,R.D.和Bühlmann,P.(2018年)。高维线性模型的优良性测试。J.R.统计社会服务。B.统计方法。80 113-135. ·Zbl 06840459号 ·doi:10.1111/rssb.12234
[35] Shah,R.D.和Peters,J.(2020年)。条件独立性测试的难度和广义协方差度量。安。统计师。48 1514-1538. ·Zbl 1451.62081号 ·doi:10.1214/19-AOS1857
[36] SMUCLER,E.、ROTNITZKY,A.和ROBINS,J.M.(2019年)。因果对比的双重稳健正则化估计的统一方法。预印本。可从arXiv:1904.03737获得。
[37] Sun,T.和Zhang,C.-H.(2012)。缩放稀疏线性回归。生物计量学99 879-898. ·Zbl 1452.62515号
[38] Sun,T.和Zhang,C.-H(2013)。用缩放拉索进行稀疏矩阵反演。J.马赫。学习。物件。14 3385-3418. ·Zbl 1318.62184号
[39] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。B类58 267-288. ·Zbl 0850.62538号
[40] van de Geer,S.(2016)。稀疏性下的估计与检验.数学课堂笔记。2159.查姆施普林格·Zbl 1362.62006年 ·doi:10.1007/978-3-319-3274-7
[41] van de Geer,S.A.和Bühlmann,P.(2009)。根据用于证明拉索预言结果的条件。电子。J.统计。3 1360-1392. ·Zbl 1327.62425号 ·doi:10.1214/09-EJS506
[42] van de Geer,S.、Bühlmann,P.、Ritov,Y.和Dezeure,R.(2014)。关于高维模型的渐近最优置信域和检验。安。统计师。42 1166-1202. ·Zbl 1305.62259号 ·doi:10.1214/14-AOS1221
[43] van der Vaart,A.W.(1998)。渐近统计学.剑桥统计与概率数学系列3.剑桥大学出版社,剑桥·Zbl 0910.62001号 ·doi:10.1017/CBO978051180225
[44] Wainwright,M.J.(2019年)。高维统计:非共鸣观点.剑桥统计与概率数学系列48.剑桥大学出版社,剑桥·Zbl 1457.62011年 ·doi:10.1017/9781108627771
[45] White,H.(1982)。错误指定模型的最大似然估计。计量经济学50 1-25. ·Zbl 0478.62088号 ·doi:10.2307/1912526
[46] Zhang,C.-H.和Zhang、S.S.(2014)。高维线性模型中低维参数的置信区间。J.R.统计社会服务。B.统计方法。76 217-242. ·Zbl 1411.62196号 ·doi:10.1111/rssb.12026
[47] ZHU,Y.和BRADIC,J.(2018a)。非解析高维线性模型的显著性检验。电子。J.统计。12 3312-3364. ·Zbl 1416.62305号 ·doi:10.1214/18-EJS1443
[48] ZHU,Y.和BRADIC,J.(2018b)。密集高维线性模型中的线性假设检验。J.Amer。统计师。协会。113 1583-1600·Zbl 1409.62139号 ·doi:10.1080/01621459.2017.1356319
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。