文件Zbl 07654778-zbMATH Open

高维错误指定模型的双估计友好推理。（英语） Zbl 07654778号

统计科学。 38，第1号，68-91（2023）.

总结：所有模型都可能是错误的，但这不一定是推理的问题。考虑随机设计线性模型中预测响应（Y）的变量（X）显著性的标准（t）检验，同时控制其他协变量（Z）。这就产生了零假设的正确渐近I型误差控制，该零假设在任意的（X，Z）上（Y）的回归模型，前提是（Z）上的（X）的线性回归模型成立。对于广义线性模型中的Wald检验，我们称之为“双估计友好”（DEF）性质，这种与错误指定类似的稳健性也适用，但需要进行一些小的修改。
在本文中，我们探讨了这一现象，并提出了尊重DEF属性的高维回归设置方法。我们主张为（Y）和相关协变量（X）指定（稀疏）广义线性回归模型；我们的框架给出了条件独立性为null的有效推论，如果这些都成立。在这两种规格都是线性的特殊情况下，我们的建议相当于对流行的衰减拉索测试进行了小修改。我们还研究了通过反转我们的测试来构建（X）回归系数的置信区间；即使在部分线性模型中，（Z）对（Y）的贡献可以是任意的，这些模型也有覆盖保证。数值实验证明了该方法的有效性。

MSC公司：

62至XX

统计

关键词：

有条件的独立性；衰弱的拉索；双重稳健性；广义线性模型；高维推理

软件：

广义协方差测度；腐蚀性T；格尔姆奈特

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司链接

参考文献：

[1]	Bang，H.和Robins，J.M.（2005年）。缺失数据和因果推理模型中的双重稳健估计。生物识别61 962-972. ·Zbl 1087.62121号 ·文件编号：10.1111/j.1541-0420.2005.00377.x
[2]	Belloni，A.、Chernozhukov，V.和Wang，L.（2011年）。方形套索：通过圆锥曲线编程对稀疏信号进行枢轴恢复。生物计量学98 791-806. ·Zbl 1228.62083号 ·doi:10.1093/biomet/asr043
[3]	博克斯，G.E.P.（1976）。科学和统计。J.Amer。统计师。协会。71 791-799. ·Zbl 0335.62002号
[4]	BRADIC，J.、WAGER，S.和ZHU，Y.（2019）。平均治疗效果的稀疏双稳健推断。预印本。可从arXiv:1905.00744获得。
[5]	BRILLINGER，D.R.（1983年）。具有“高斯”回归变量的广义线性模型。在埃里希·莱曼的节日.华兹华斯统计师/可能性。序列号。97-114. 加利福尼亚州贝尔蒙特市沃兹沃斯·Zbl 0519.62050号
[6]	Bühlmann，P.和van de Geer，S.（2011）。高维数据统计:方法、理论和应用.统计学中的斯普林格系列海德堡施普林格·Zbl 1273.62015年 ·doi:10.1007/978-3-642-20192-9
[7]	BüHLMANN，P.和VAN DE GEER，S.（2015）。指定错误线性模型中的高维推理。电子。J.统计。9 1449-1473. ·Zbl 1327.62420号 ·doi:10.1214/15-EJS1041
[8]	BUJA，A.，BROWN，L.，BERK，R.，GEORGE，E.，PITKIN，E.，TRASKIN，M.，ZHANG，K.和ZHAO，L.（2019a）。近似模型I：用线性回归说明的结果。统计师。科学。34 523-544. ·兹比尔1440.62020 ·doi:10.1214/18-STS693
[9]	BUJA，A.、BROWN，L.、KUCHIBHOTLA，A.K.、BERK，R.、GEORGE，E.和ZHAO，L.（2019b）。模型近似II：参数回归的无模型理论。统计师。科学。34 545-565. ·Zbl 1440.62021号 ·doi:10.1214/18-STS694
[10]	Cai，T.T.和Guo，Z.（2017）。高维线性回归的置信区间：最小最大速率和适应性。安。统计师。45 615-646. ·Zbl 1371.62045号 ·doi:10.1214/16-AOS1461
[11]	Candès，E.、Fan，Y.、Janson，L.和Lv，J.（2018年）。淘金：高维可控变量选择的“X型”仿制品。J.R.统计社会服务。B.统计方法。80 551-577. ·兹比尔1398.62335 ·doi:10.1111/rssb.12265
[12]	CAO，W.、TSIATIS，A.A.和DAVIDIAN，M.（2009）。改进不完全数据总体均值的双稳健估计的效率和鲁棒性。生物计量学96 723-734. ·Zbl 1170.62007年
[13]	Chernozhukov，V.、Chetverikov，D.、Demirer，M.、Duflo，E.、Hansen，C.、Newey，W.和Robins，J.（2018）。用于治疗和结构参数的双/脱苦机器学习。经济。J。21 C1-C68·Zbl 07565928号 ·doi:10.1111/ectj.12097
[14]	BüHLMANN，P.、KALISCH，M.和MEIER，L.（2014）。着眼于生物学应用的高维统计。每年。修订状态申请。1 255-278.
[15]	DEZEURE，R.、BüHLMANN，P.、MEIER，L.和MEINSHAUSEN，N.（2015）。高维推断：置信区间、（p\）-值和R软件hdi。统计师。科学。30 533-558. ·Zbl 1426.62183号 ·doi:10.1214/15-STS527
[16]	DUAN，N.和LI，K.-C.（1991）。切片回归：一种无链接回归方法。安。统计师。19 505-530. ·Zbl 0738.62070号 ·doi:10.1214/aos/1176348109
[17]	DUKES，O.、AVAGYAN，V.和VANSTEELANDT，S.（2020年）。高维混杂下暴露效应的双重稳健测试。生物识别76 1190-1200. ·Zbl 1520.62184号 ·doi:10.1111/biom.13231
[18]	Efron，B.、Hastie，T.、Johnstone，I.和Tibshirani，R.（2004）。最小角度回归。安。统计师。32 407-499. ·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[19]	Friedman，J.、Hastie，T.和Tibshirani，R.（2010）。广义线性模型的坐标下降正则化路径。J.统计软件。33 1-22.
[20]	Hastie，T.、Tibshirani，R.和Wainwright，M.（2015）。稀疏的统计学习:拉索和推广.统计学和应用概率专著143.佛罗里达州博卡拉顿CRC出版社。
[21]	HUBER，P.J.（1967年）。非标准条件下极大似然估计的行为。在程序。伯克利第五交响乐团。数学。统计师。和概率(加州伯克利., 1965/66),第一卷:统计221-233. 加利福尼亚大学出版社，加利福尼亚州伯克利·Zbl 0212.21504号
[22]	JANKOVá，J.、SHAH，R.D.、BüHLMANN，P.和SAMWORTH，R.J.（2020年）。高维广义线性模型中的优良性测试。J.R.统计社会服务。B.统计方法。82 773-795. ·Zbl 07554773号 ·doi:10.1111/rssb.12371
[23]	JENNRICH，R.I.（1969年）。非线性最小二乘估计量的渐近性质。安。数学。斯达。40 633-643. ·Zbl 0193.47201号 ·doi:10.1214/aoms/1177697731
[24]	Kang，J.D.Y.和Schafer，J.L.（2007）。双重稳健性的解密：从不完整数据估计总体平均值的替代策略的比较。统计师。科学。22 523-539. ·Zbl 1246.62073号 ·doi:10.1214/07-STS227
[25]	LI，K.-C.和DUAN，N.（1989）。链接冲突下的回归分析。安。统计师。17 1009-1052. ·Zbl 0753.62041号 ·doi:10.1214/aos/1176347254
[26]	MACKINNON，J.G.和WHITE，H.（1985年）。一些具有改进的有限样本性质的异方差一致协方差矩阵估计。J.计量经济学29 305-325.
[27]	Ning，Y.和Liu，H.（2017）。稀疏高维模型的假设检验和置信域的一般理论。安。统计师。45 158-195. ·Zbl 1364.62128号 ·doi:10.1214/16-AOS1448
[28]	Ren，Z.、Sun，T.、Zhang，C.-H.和Zhou，H.H.（2015）。大高斯图形模型估计的渐近正态性和最优性。安。统计师。43 991-1026. ·Zbl 1328.62342号 ·doi:10.1214/14-AOS1286
[29]	ROBINS，J.M.、MARK，S.D.和NEWEY，W.K.（1992）。通过在混杂因素上模拟暴露条件的期望来估计暴露影响。生物识别48 479-495. ·兹比尔0768.62099 ·doi:10.2307/2532304
[30]	Robins，J.M.和Rotnitzky，A.（1995年）。缺失数据多元回归模型的半参数效率。J.Amer。统计师。协会。90 122-129. ·Zbl 0818.62043号
[31]	Rosenbaum，P.R.和Rubin，D.B.（1983年）。倾向评分在因果效应观察性研究中的中心作用。生物计量学70 41-55. ·Zbl 0522.62091号 ·doi:10.1093/生物技术/70.141
[32]	ROTNITZKY，A.、LEI，Q.、SUED，M.和ROBINS，J.M.（2012）。改进了缺失数据和因果推理模型中的双稳健估计。生物计量学99 439-456. ·Zbl 1239.62071号 ·doi:10.1093/biomet/ass013
[33]	Scharfstein，D.O.、Rotnitzky，A.和Robins，J.M.（1999）。使用半参数无响应模型调整不可忽略的退出。J.Amer。统计师。协会。94 1096-1146. ·Zbl 1072.62644号 ·doi:10.2307/2669923
[34]	Shah，R.D.和Bühlmann，P.（2018年）。高维线性模型的优良性测试。J.R.统计社会服务。B.统计方法。80 113-135. ·Zbl 06840459号 ·doi:10.1111/rssb.12234
[35]	Shah，R.D.和Peters，J.（2020年）。条件独立性测试的难度和广义协方差度量。安。统计师。48 1514-1538. ·Zbl 1451.62081号 ·doi:10.1214/19-AOS1857
[36]	SMUCLER，E.、ROTNITZKY，A.和ROBINS，J.M.（2019年）。因果对比的双重稳健正则化估计的统一方法。预印本。可从arXiv:1904.03737获得。
[37]	Sun，T.和Zhang，C.-H.（2012）。缩放稀疏线性回归。生物计量学99 879-898. ·Zbl 1452.62515号
[38]	Sun，T.和Zhang，C.-H（2013）。用缩放拉索进行稀疏矩阵反演。J.马赫。学习。物件。14 3385-3418. ·Zbl 1318.62184号
[39]	Tibshirani，R.（1996）。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。B类58 267-288. ·Zbl 0850.62538号
[40]	van de Geer，S.（2016）。稀疏性下的估计与检验.数学课堂笔记。2159.查姆施普林格·Zbl 1362.62006年 ·doi:10.1007/978-3-319-3274-7
[41]	van de Geer，S.A.和Bühlmann，P.（2009）。根据用于证明拉索预言结果的条件。电子。J.统计。3 1360-1392. ·Zbl 1327.62425号 ·doi:10.1214/09-EJS506
[42]	van de Geer，S.、Bühlmann，P.、Ritov，Y.和Dezeure，R.（2014）。关于高维模型的渐近最优置信域和检验。安。统计师。42 1166-1202. ·Zbl 1305.62259号 ·doi:10.1214/14-AOS1221
[43]	van der Vaart，A.W.（1998）。渐近统计学.剑桥统计与概率数学系列3.剑桥大学出版社，剑桥·Zbl 0910.62001号 ·doi:10.1017/CBO978051180225
[44]	Wainwright，M.J.（2019年）。高维统计:非共鸣观点.剑桥统计与概率数学系列48.剑桥大学出版社，剑桥·Zbl 1457.62011年 ·doi:10.1017/9781108627771
[45]	White，H.（1982）。错误指定模型的最大似然估计。计量经济学50 1-25. ·Zbl 0478.62088号 ·doi:10.2307/1912526
[46]	Zhang，C.-H.和Zhang、S.S.（2014）。高维线性模型中低维参数的置信区间。J.R.统计社会服务。B.统计方法。76 217-242. ·Zbl 1411.62196号 ·doi:10.1111/rssb.12026
[47]	ZHU，Y.和BRADIC，J.（2018a）。非解析高维线性模型的显著性检验。电子。J.统计。12 3312-3364. ·Zbl 1416.62305号 ·doi:10.1214/18-EJS1443
[48]	ZHU，Y.和BRADIC，J.（2018b）。密集高维线性模型中的线性假设检验。J.Amer。统计师。协会。113 1583-1600·Zbl 1409.62139号 ·doi:10.1080/01621459.2017.1356319

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

高维错误指定模型的双估计友好推理。（英语） Zbl 07654778号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

高维错误指定模型的双估计友好推理。 （英语） Zbl 07654778号

MSC公司：

关键词：

软件：

参考文献：

高维错误指定模型的双估计友好推理。（英语） Zbl 07654778号