×

条件独立性测试的难度和广义协方差度量。 (英语) Zbl 1451.62081号

在证明了条件独立性可测试性的一般结果之后,本文提出了一个测试过程。本测试程序基于评估(X)和(Y)在(Z)上的条件独立性,其中(X)与(Y)是单变量,通过对(Z)和(Z)的非线性回归(X),并推导出一个测试统计量,称为广义协方差测度(GCM),从回归残差之间的样本协方差。该测试程序的有效性与回归程序有关,回归程序能够以适当的速率估计条件平均值。该方法被扩展到处理设置,其中\(X\)和\(Y\)可能是多元的。在这种情况下,检验有效性的证明还要求误差遵守某些力矩限制,并且预测误差的收敛速度稍快。这些理论保证是为核岭回归开发的。给出了仿真评估。该代码位于R包GeneralisedCovarianceMeasure中。

MSC公司:

62J07型 岭回归;收缩估计器(拉索)
62G10型 非参数假设检验
62G08号 非参数回归和分位数回归
62H15型 多元分析中的假设检验
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 巴赫·F(2017)。关于核求积规则与随机特征展开的等价性。J.马赫。学习。决议18第21、38号文件·Zbl 1435.65045号
[2] Bahadur,R.R.和Savage,L.J.(1956年)。非参数问题中某些统计过程的不存在。安。数学。《法律总汇》第27卷第1115-1122页·Zbl 0073.14302号 ·doi:10.1214/aoms/1177728077
[3] Balakrishnan,S.和Wasserman,L.(2019年)。密度和高维多项式的假设检验:尖锐的局部极小极大率。安。统计师。47 1893-1927. ·Zbl 1466.62307号 ·doi:10.1214/18-AOS1729
[4] Barron,A.R.(1989年)。统一强大的拟合优度测试。安。统计师。17 107-124. ·Zbl 0674.62032号 ·doi:10.1214/aos/1176347005
[5] Bergsma,W.P.(2004)。测试连续随机变量的条件独立性。EURANDOM报告2004-049。
[6] Berrett,T.B.和Samworth,R.J.(2019年)。通过互信息进行非参数独立性测试。生物特征106 547-566·Zbl 1464.62267号
[7] Berrett,T.B.、Wang,Y.、Barber,R.F.和Samworth,R.J.(2018年)。条件置换测试。ArXiv,ArXiv:1807.05405。
[8] Bertanha,M.和Moreira,M.J.(2018年)。计量经济学中的不可能推理:理论与应用。ArXiv,ArXiv:1612.02024v3。
[9] Bickel,P.J.、Klaassen,C.A.J.、Ritov,Y.和Wellner,J.A.(1993)。半参数模型的有效自适应估计。约翰·霍普金斯数学科学系列。约翰·霍普金斯大学出版社,马里兰州巴尔的摩·Zbl 0786.62001号
[10] Bühlmann,P.和van de Geer,S.(2011)。高维数据统计:方法、理论和应用。统计学中的斯普林格系列。海德堡施普林格·兹比尔1273.62015
[11] Canay,I.A.、Santos,A.和Shaikh,A.M.(2013)。关于一些具有内生性的非参数模型中识别的可测性。《计量经济学》81 2535-2559·Zbl 1306.62533号 ·doi:10.3982/ECTA10851
[12] Chen,T.和Guestrin,C.(2016)。Xgboost:一个可扩展的树增强系统。第22届ACM SigKDD知识发现和数据挖掘国际会议论文集785-794。ACM公司。
[13] Chen,T.,He,T.、Benesty,M.、Khotilovich,V.和Tang,Y.(2018)。xgboost:极限梯度增强。R包版本0.6.4.1。
[14] Chernozhukov,V.、Chetverikov,D.、Demirer,M.、Duflo,E.、Hansen,C.、Newey,W.和Robins,J.(2018年)。用于治疗和结构参数的双/脱苦机器学习。经济。J.21 C1-C68·Zbl 07565928号
[15] Chernozhukov,V.、Chetverikov,D.和Kato,K.(2013)。高维随机向量和的最大值的高斯近似和乘法器自举。安。统计师。41 2786-2819. ·Zbl 1292.62030 ·doi:10.1214/13-AOS1161
[16] Daudin,J.-J.(1980)。部分关联测度及其在定性回归中的应用。生物特征67 581-590·Zbl 0475.62042号 ·doi:10.1093/biomet/67.3.581
[17] Dawid,A.P.(1979)。统计理论中的条件独立性。J.罗伊。统计师。Soc.序列号。B 41 1-31·Zbl 0408.62004号 ·doi:10.1111/j.2517-6161.1979.tb01052.x
[18] Dobra,A.、Hans,C.、Jones,B.、Nevins,J.R.、Yao,G.和West,M.(2004)。探索基因表达数据的稀疏图形模型。《多元分析杂志》。90 196-212. ·Zbl 1047.62104号 ·doi:10.1016/j.jmva.2004.02.009
[19] Dufour,J.-M.(2003)。计量经济学中的识别、薄弱工具和统计推断。可以。《经济学杂志》。36 767-808.
[20] Fan,J.、Feng,Y.和Xia,L.(2015)。一种基于投影的条件依赖度量,应用于高维无向图形模型。ArXiv,ArXiv:1501.01617·兹比尔1456.62102 ·doi:10.1016/j.jeconom.2019.12.016
[21] Fisher,R.A.(1920年)。通过平均误差和均方误差确定观测精度的方法的数学检验。周一。不是。R.阿斯顿。Soc.80 758-770。
[22] Fisher,R.A.(1934年)。数学似然的两个新性质。程序。R.Soc.A 114 285-307·Zbl 0009.21902号 ·doi:10.1098/rspa.1934.0050
[23] Fisher,R.A.(1935年)。实验设计。奥利弗和博伊德,英国爱丁堡。
[24] Fukumizu,K.、Gretton,A.、Sun,X.和Schölkopf,B.(2008)。条件依赖的核心度量。神经信息处理系统进展20(NIPS)489-496。麻省理工学院出版社。
[25] Gretton,A.、Fukumizu,K.、Teo,C.H.、Song,L.、Schölkopf,B.和Smola,A.(2008)。独立性的核心统计测试。神经信息处理系统进展20(NIPS)585-592。麻省理工学院出版社。
[26] Heinze-Deml,C.、Peters,J.和Meinshausen,N.(2017年)。非线性模型的不变因果预测。J.因果推理。出现。阿西夫,阿西夫:1706.08576。
[27] 霍夫丁(1948)。独立性的非参数检验。安。数学。《美国联邦法律大全》第19卷第546-557页·Zbl 0032.42001号 ·doi:10.1214/aoms/1177730150
[28] Jensen,J.L.和Sörensen,M.(2017)。统计原理:第一门课程(讲稿),丹麦奥胡斯和哥本哈根,可根据要求提供。
[29] Kim,S.(2015)。ppcor:部分和半部分(部分)相关性。R软件包版本1.1。
[30] Koller,D.和Friedman,N.(2009年)。概率图形模型:原理和技术。自适应计算和机器学习。麻省理工学院出版社,马萨诸塞州剑桥·Zbl 1183.68483号
[31] 卡夫,C.(1955)。统计程序一致性和一致性的一些条件。加州大学出版社。统计师。2 125-141. ·Zbl 0066.12202号
[32] Lauritzen,S.L.(1996年)。图形模型。牛津统计科学系列17。牛津大学出版社,纽约·Zbl 0907.62001
[33] LeCam,L.(1973)。维数限制下估计的收敛性。安。统计师。1 38-53. ·兹比尔0255.62006
[34] Li,L.,Tchetgen Tchetgon,E.,van der Vaart,A.和Robins,J.M.(2011)。低正则性条件下处理效果的高阶推断。统计师。普罗巴伯。莱特。81 821-828. ·Zbl 1218.62021号 ·doi:10.1016/j.spl.2011.02.030
[35] Markowetz,F.和Spang,R.(2007年)。推断细胞网络——综述。BMC生物信息。8补充6 S5。
[36] Newey,W.K.和Robins,J.(2018年)。半参数估计的交叉填充和快速剩余率。ArXiv,ArXiv:1801.09138。
[37] Pearl,J.(2009)。因果关系:模型、推理和推理,第二版,剑桥大学出版社,剑桥·Zbl 1188.68291号
[38] Peters,J.、Bühlmann,P.和Meinshausen,N.(2016)。使用不变预测进行因果推断:识别和置信区间。J.R.统计社会服务。B.统计方法。78 947-1012. 带着评论和反驳·Zbl 1414.62297号 ·doi:10.1111/rssb.12167
[39] Peters,J.、Janzing,D.和Schölkopf,B.(2017年)。因果推理的要素:基础和学习算法。自适应计算和机器学习。麻省理工学院出版社,马萨诸塞州剑桥·Zbl 1416.62012年
[40] Ramsey,J.D.(2014)。非线性、非高斯数据的可扩展条件独立性测试。ArXiv,ArXiv:1401.5031。
[41] Ren,Z.、Sun,T.、Zhang,C.-H.和Zhou,H.H.(2015)。大高斯图形模型估计中的渐近正态性和最优性。安。统计师。43 991-1026. ·Zbl 1328.62342号 ·doi:10.1214/14-AOS1286
[42] Robins,J.、Li,L.、Tchetgen Tchetgon,E.和van der Vaart,A.(2008)。非线性泛函的高阶影响函数和极大极小估计。概率与统计:纪念大卫·A·弗里德曼的论文335-421。智能弹药系统·Zbl 1513.62067号
[43] Robins,J.、Tchetgen,Tchetgon,E.、Li,L.和van der Vaart,A.(2009)。半参数最小最大速率。电子。《美国联邦法律大全》第3卷第1305-1321页·Zbl 1326.62080号 ·doi:10.1214/09-EJS479
[44] Robins,J.M.、Li,L.、Mukherjee,R.、Tchetgen,E.T.和van der Vaart,A.(2017)。结构化高维模型上泛函的极大极小估计。安。统计师。45 1951-1987. ·Zbl 1459.62047号 ·doi:10.1214/16-AOS1515
[45] Romano,J.P.(2004)。关于非参数检验,(t)检验的统一行为,以及相关问题。扫描。《美国联邦法律大全》第31卷第567-584页·Zbl 1063.62070号
[46] Shah,R.D.和Bühlmann,P.(2018年)。高维线性模型的优良性测试。J.R.统计社会服务。B.统计方法。80 113-135. ·Zbl 06840459号
[47] Shah,R.D.和Peters,J.(2020年)。补充“条件独立性测试的难度和广义协方差测量”https://doi.org/10.1214/19-AOS1857SUPP。
[48] Spites,P.、Glymour,C.和Scheines,R.(2000)。因果、预测和搜索,第二版,自适应计算和机器学习。麻省理工学院出版社,马萨诸塞州剑桥。附加材料由David Heckerman、Christopher Meek、Gregory F.Cooper和Thomas Richardson撰写,《布拉德福德图书》·Zbl 0806.62001
[49] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。乙58 267-288·Zbl 0850.62538号 ·doi:10.1111/j.2517-6161.1996.tb02080.x
[50] 韦弗,N.(2013)。测量理论和功能分析。新泽西州哈肯萨克市世界科学有限公司·Zbl 1285.28001号
[51] Zhang,K.、Peters,J.、Janzing,D.和Schölkopf,B.(2011)。基于核的条件独立性检验及其在因果发现中的应用。第27届人工智能不确定性年会论文集(UAI)804-813。AUAI出版社。
[52] 郑伟(Zheng,W.)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。