×

高维logistic回归模型的全局和同步假设检验。 (英语) Zbl 1464.62306号

摘要:高维logistic回归广泛用于分析具有二元结果的数据。在本文中,在单回归和双回归设置中都考虑了回归系数的全局测试和大规模多重测试。利用广义低维投影进行偏差校正,构造了检验全局零假设的检验统计量,并导出了其渐近零分布。建立了全局测试的下界,表明该测试在一定的稀疏性范围内是渐近极小极大最优的。为了同时测试各个系数,提出了多种测试方法,并证明了这些方法可以渐近控制错误发现率和错误发现变量。进行了模拟研究,以检验所提出的试验的数值性能及其相对于现有方法的优越性。通过分析代谢组学研究的数据集,也可以说明测试程序,该研究调查粪便代谢物与小儿克罗恩病之间的关系以及治疗对这种关系的影响。

MSC公司:

62H15型 多元分析中的假设检验
62J12型 广义线性模型(逻辑模型)

软件:

测试BMN
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿布拉莫维奇,F。;Grinshtein,V.,“基于稀疏逻辑回归的高维分类,IEEE信息理论汇刊,65,3068-3079(2018)·Zbl 1432.62177号 ·doi:10.1109/TIT.2018.2884963
[2] Bach,F.,“Logistic回归的自洽分析,电子统计杂志,4384-414(2010)·Zbl 1329.62324号 ·doi:10.1214/09-EJS521
[3] Baraud,Y.,“信号检测中的非症状最小最大测试率”,Bernoulli,8577-606(2002)·Zbl 1007.62042号
[4] 巴雷特,J.C。;Hansoul,S。;尼古拉·D·L。;Cho,J.H。;杜尔,R.H。;Rioux,J.D。;Brant,S.R。;西尔弗伯格,M.S。;泰勒,K.D。;巴尔马达,M.M。;Bitton,A.,“全基因组协会定义了30多个克罗恩病的不同易感位点,自然遗传学,40955(2008)·doi:10.1038/ng.175
[5] 贝洛尼,A。;切尔诺朱科夫,V。;Wei,Y.,“具有多个控制的广义线性模型的选择后推断”,《商业与经济统计杂志》,34,606-619(2016)·网址:10.1080/07350015.2016.1166116
[6] Y.本杰米尼。;Hochberg,Y.,“控制错误发现率:一种实用而有力的多重测试方法”,《皇家统计学会杂志》,B辑,57,289-300(1995)·Zbl 0809.62014号 ·doi:10.1111/j.2517-6161.1995.tb02031.x
[7] Y.本杰米尼。;Yekutieli,D.,“依赖性下多重测试中错误发现率的控制”,《统计年鉴》,291165-1188(2001)·Zbl 1041.62061号 ·doi:10.1214/aos/1013699998
[8] Cai,T.T。;Guo,Z.,“高维线性回归的置信区间:极小极大率和适应性”,《统计年鉴》,45615-646(2017)·Zbl 1371.62045号 ·doi:10.1214/16-AOS1461
[9] Cai,T.T。;李,H。;马,J。;Xia,Y.,“差异马尔可夫随机场分析在检测差异微生物群落结构中的应用(2017)
[10] Cai,T.T。;刘伟。;Xia,Y.,“高维稀疏环境下的双样本协方差矩阵测试和支持恢复,美国统计协会杂志,108,265-277(2013)·Zbl 06158341号 ·doi:10.1080/016214592012.758041
[11] Cai,T.T。;刘伟。;Xia,Y.,“依赖下高维均值的双样本检验”,《皇家统计学会杂志》,B辑,76,349-372(2014)·Zbl 07555454号
[12] 坎迪斯,E。;范,Y。;Janson,L。;Lv,J.,“淘金:高维受控变量选择的X型敲除,皇家统计学会期刊,B辑,80,551-577(2018)·Zbl 1398.62335号 ·doi:10.1111/rssb.12265
[13] Candès,E.J.和Sur,P.(2018),“高维Logistic回归中最大似然估计存在的阶段转换”,arXiv编号1804.09753·Zbl 1439.62171号
[14] Fortin,G.,“左旋肉碱与肠道炎症、维生素和激素,86,353-366(2011)
[15] Ingster,Y.I.,“非参数替代方案的渐近最小极大假设检验。I,II,III,统计学的数学方法,285-114(1993)·Zbl 0798.62057号
[16] 英格斯特,Y.I。;Tsybakov,A.B。;Verzelen,N.,“稀疏回归中的检测边界”,《电子统计杂志》,第4期,1476-1526页(2010年)·Zbl 1329.62314号 ·doi:10.1214/10-EJS589
[17] 爪哇马德,A。;Javadi,H.,“通过借记套索控制错误发现率”,《电子统计杂志》,第13期,第1212-1253页(2019年)·Zbl 1418.62061号 ·doi:10.1214/19-EJS1554
[18] 爪哇马德,A。;Montanari,A.,“高维回归的置信区间和假设检验”,《机器学习研究杂志》,第15期,第2869-2909页(2014年)·Zbl 1319.62145号
[19] 爪哇马德,A。;Montanari,A.,“高斯随机设计模型下高维回归的假设检验:渐近理论,IEEE信息理论汇刊,606522-6554(2014)·Zbl 1360.62074号
[20] Lee,D。;巴尔达萨诺,R.N。;奥特利,A.R。;阿尔伯伯格,L。;格里菲斯,A.M。;Compher,C。;Chen,E.Z。;李,H。;吉尔罗伊,E。;Nessel,L。;Grant,A.,“营养疗法和生物疗法对患有活动性克罗恩病、炎症性肠病的北美儿童的疗效比较,211786-1793(2015)·doi:10.1097/MIB.00000000000426
[21] 刘易斯,J.D。;Chen,E.Z。;巴尔达萨诺,R.N。;奥特利,A.R。;格里菲斯,A.M。;Lee,D。;Bittinger,K。;Bailey,A。;弗里德曼,E.S。;霍夫曼,C。;Albenberg,L.,“炎症、抗生素和饮食是小儿克罗恩病肠道微生物组的环境压力源,细胞宿主和微生物,18,489-500(2015)·doi:10.1016/j.chom.2015.09.008
[22] Liu,W.,“带有错误发现率控制的高斯图形模型估计,《统计年鉴》,41,2948-2978(2013)·Zbl 1288.62094号 ·doi:10.1214/13-AOS1169
[23] 刘伟。;Luo,S.,高维回归模型的假设检验(2014)
[24] 梅塞卡,M。;Spiegel,S.,“炎症疾病中的鞘脂代谢产物,自然,510,58(2014)·doi:10.1038/nature13475
[25] Meier,L。;van de Geer,S。;Bühlmann,P.,“Logistic回归的拉索组,皇家统计学会期刊,B辑,70,53-71(2008)·Zbl 1400.62276号 ·文件编号:10.1111/j.1467-9868.2007.00627.x
[26] 穆克吉,R。;新南威尔士州皮莱。;Lin,X.,“高维稀疏二元回归的假设检验,统计年鉴,43352-381(2015)·Zbl 1308.62094号 ·doi:10.1214/14-AOS1279
[27] 内加班,S。;拉维库马尔,P。;Wainwright,M.J。;s、 B.,带可分解正则化器的M-估计的高维分析统一框架(2010)
[28] Ni,J。;沈天成。;Chen,E.Z。;Bittinger,K。;Bailey,A。;罗吉亚尼,M。;Sirota Madi,A。;弗里德曼,E.S。;周,L。;Lin,A。;Nissim,I.,“细菌尿素酶在肠道疾病和克罗恩病中的作用,科学转化医学,9,eaah6888(2017)·doi:10.1126/scitranslmed.aah6888
[29] 佩尔特科娃,V.D。;温特,R.F。;洛杉矶鲁宾。;阿莫斯,C.I。;黄,Q。;顾,X。;纽曼,B。;Van Oene,M。;塞斯科,D。;格林伯格,G。;Griffiths,A.M.,“OCTN阳离子转运蛋白基因的功能变体与克罗恩病相关”,《自然遗传学》,36,471(2004)·doi:10.1038/ng1339
[30] 平面图,Y。;Vershynin,R.,“稳健的1位压缩传感和稀疏逻辑回归:凸规划方法”,IEEE信息理论汇刊,59482-494(2013)·Zbl 1364.94153号 ·doi:10.1109/TIT.2012.2207945
[31] 任,Z。;张,C.-H。;Zhou,H.H.,“大型伊辛图形模型估计中的渐近正态性”(2016)
[32] Rozenova,K.A。;迪夫斯卡,G.M。;Karakashian,A.A。;Nikolova-Karakashian,M.N.,“酸性鞘氨醇酶和神经酰胺在调节肿瘤坏死因子α(TNFα)转化酶活性和巨噬细胞分泌TNFα中的作用研究”,《生物化学杂志》,28521103-2113(2010)·doi:10.1074/jbc。M109.080671号
[33] 苏厄尔,G.W。;Hannun,Y.A。;韩,X。;Koster,G。;比拉夫斯基,J。;戈斯,V。;Smith,P.J。;拉赫曼,F.Z。;维加,R。;布鲁姆,S.L。;Walker,A.P.,“克罗恩病的脂质谱分析:磷脂酰肌醇的异常,保留神经酰胺、磷脂酰胆碱和磷脂酰丝氨酸组成,国际生物化学与细胞生物学杂志,441839-1846(2012)·doi:10.1016/j.biocel.2012.06.016
[34] Shekhawat,P.S。;Sonne,S。;Carter,A.L。;马特伦,D。;Ganapathy,V.,“小鼠小肠肠上皮细胞表达左旋肉碱生物合成相关酶:对肠道健康的影响”,《克罗恩与结肠炎杂志》,第7期,e197-e205(2013)·doi:10.1016/j.crhns.2012.08.011文件
[35] 苏尔,P。;Candès,E.J.,“高维逻辑回归的现代最大似然理论,美国国家科学院院刊,11614516-14525(2019)·Zbl 1431.62084号 ·doi:10.1073/pnas.1810420116
[36] 苏尔,P。;陈,Y。;Candès,E.J.,“高维Logistic回归中的似然比检验是一个逐步重标度的Chi-Square,概率理论和相关领域,175,487-558(2017)·Zbl 1431.62319号 ·doi:10.1007/s00440-018-00896-9
[37] Tsybakov,A.B.,《非参数估计导论》(2009),纽约:施普林格出版社·Zbl 1176.62032号
[38] van de Geer,S.,“高维广义线性模型和拉索,统计年鉴,36614-645(2008)·Zbl 1138.62323号 ·doi:10.1214/00905360700000929
[39] van de Geer,S。;Bühlmann,P。;Ritov,Y。;Dezeure,R.,“关于高维模型的渐近最优置信区域和测试,统计年鉴,42,1166-1202(2014)·Zbl 1305.62259号 ·doi:10.1214/14-AOS1221
[40] Verzelen,N.,“稀疏回归的最小风险:超高维现象”,《电子统计杂志》,638-90(2012)·Zbl 1334.62120号 ·doi:10.1214/12-EJS666
[41] 夏,Y。;蔡,T。;Cai,T.T.,“测试差分网络及其在基因-基因相互作用检测中的应用,生物特征,102,247-266(2015)·兹比尔1452.62392 ·doi:10.1093/biomet/asu074
[42] 夏,Y。;蔡,T。;Cai,T.T.,“高维线性回归的两样本检验及其在检测相互作用中的应用,统计学,28,63-92(2018)·Zbl 1382.62042号 ·doi:10.5705/ss.202016.0032
[43] 夏,Y。;Cai,T.T。;Li,H.,“高维多元回归中的联合测试和错误发现率控制,生物统计学,105,249-269(2018)·Zbl 07072411号 ·doi:10.1093/biomet/asx085
[44] Yang,Z.、Wang,Z..、Liu,H.、Eldar,Y.C.和Zhang,T.(2015),“稀疏非线性回归:参数估计和渐近推断”,arXiv编号1511.04514。
[45] Zaitsev,A.Y.,“关于S.N.Bernstein不等式条件多维相似条件下卷积的高斯近似,概率论及相关领域,74,535-566(1987)·Zbl 0612.60031号 ·doi:10.1007/BF00363515
[46] 张,C.-H。;Zhang,S.S.,“高维线性模型中低维参数的置信区间”,《皇家统计学会杂志》,B辑,76,217-242(2014)·Zbl 1411.62196号 ·doi:10.1111/rssb.12026
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。