×

用于高维推理的马尔可夫邻域回归。 (英语) Zbl 1506.62106号

摘要:本文提出了一种创新的方法,用于构造高维线性模型统计推断中的置信区间和评估(p)值。该方法成功地将高维推理问题分解为一系列低维推理问题:对于每个回归系数,置信区间和-通过对根据相应变量(X_i)和其他变量之间的条件独立关系选择的变量子集进行回归计算值。由于变量子集在所有变量(X_1,X_2,dots,X_p)组成的马尔可夫网络中形成了一个马尔可夫邻域(X_i),因此该方法被称为马尔可夫邻居回归(MNR)。该方法在高维线性、logistic和Cox回归上进行了测试。数值结果表明,该方法明显优于现有方法。基于MNR,提出了一种学习高维线性模型因果结构的方法,并将其应用于药物敏感基因和癌症驱动基因的识别。使用条件独立关系进行降维的想法很普遍,也可能扩展到其他高维或大数据问题。

理学硕士:

62-08 统计问题的计算方法
62G08号 非参数回归和分位数回归
62H22个 概率图形模型
62页第10页 统计学在生物学和医学中的应用;元分析
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aliferis,C。;Statnikov,A。;沙马尔迪诺斯一世。;马尼,S。;Koutsoukos,X.D.,“用于因果发现和分类特征选择的局部因果和马尔可夫覆盖归纳,第一部分:算法和实证评估”,《机器学习研究杂志》,11,171-234(2010)·Zbl 1242.68197号
[2] 巴雷蒂纳,J。;Caponigro,G。;斯特兰斯基,N。;肯塔基州文凯特桑。;Margolin,A.A。;Kim,S。;Wilson,C.J。;Lehár,J。;Kryukov,G.V。;Sonkin博士。;A.Reddy。;刘,M。;Murray,L。;伯杰,M.F。;莫纳汉,J.E。;Morais,P。;梅尔泽,J。;Korejwa,A。;Jané-Valbuena,J。;马帕,F.A。;Thibault,J。;Bric-Furlong,E。;Raman,P。;Shipwayn,A。;恩格斯,I.H。;Cheng,J。;Yu,G.K。;Yu,J。;Aspesi,P。;德席尔瓦,M。;贾格塔普,K。;医学博士琼斯。;Wang,L。;哈特顿,C。;Palescandolo,E。;古普塔,S。;马汉,S。;Sougnez,C。;奥诺弗里奥,R.C。;利菲尔德,T。;MacConaill,L。;温克勒,W。;Reich,M。;李,N。;梅西洛夫,J.P。;加布里埃尔,S.B。;盖茨,G。;Ardlie,K。;Chan,V。;Myer,V.E。;韦伯,B.L。;波特,J。;Warmuth,M。;菲南,P。;哈里斯,J.L。;Meyerson,M。;Golub,T.R。;莫里西,M.P。;Sellers,W.R。;施莱格尔,R。;Garraway,L.A.,“癌症细胞系百科全书支持抗癌药物敏感性的预测建模,自然,483,603-607(2012)·doi:10.1038/nature11003
[3] 贝洛尼,A。;切尔诺朱科夫,V。;Kato,K.,“最小绝对偏差回归和其他Z估计问题的统一选择后推断,生物特征,102,77-94(2015)·Zbl 1345.62049号 ·doi:10.1093/biomet/asu056
[4] 伯克,R。;布朗,L。;布贾,A。;张凯。;Zhao,L.,“有效的选举后推断,统计年鉴,41,802-837(2013)·Zbl 1267.62080号 ·doi:10.1214/12-AOS1077
[5] 鲍曼,E。;坎贝尔,J。;Druey,K。;Scheschonka,A。;Kehrl,J。;Butcher,E.,“RGS(G蛋白信号调节器)家族成员对趋化性和前粘附性受体反应的调节”,《生物化学杂志》,27328040-28048(1998)·doi:10.1074/jbc.273.43.28040
[6] Bühlmann,P.,“高维线性模型的统计显著性”,伯努利,19,1212-1242(2013)·Zbl 1273.62173号 ·doi:10.3150/12-BEJSP11
[7] Bühlmann,P。;Kalisch,M。;Maathuis,M.,“高维线性模型中的变量选择:部分信度分布和PC-Simple算法”,生物特征,97,261-278(2010)·Zbl 1233.62135号 ·doi:10.1093/biomet/asq008
[8] Bühlmann,P。;van de Geer,S.,《高维数据统计:方法、理论和应用》(2011),纽约:施普林格出版社,纽约·Zbl 1273.62015年
[9] Buzdar,A.,“生物治疗和化疗在激素受体和HER2阳性乳腺癌中的作用,肿瘤学年鉴,20993-999(2009)·doi:10.1093/annonc/mdn739
[10] 查特吉,A。;Lahiri,S.,“自适应LASSO估计对Oracle分布的收敛速度和Bootstrap的高阶改进,统计年鉴,411232-1259(2013)·Zbl 1293.62153号 ·doi:10.1214/13-AOS1106
[11] Cox,D.,“部分可能性,生物特征,62,269-276(1975)·Zbl 0312.62002号 ·doi:10.1093/biomet/62.2.269
[12] Dezeure,R。;Bühlmann,P。;Meier,L。;Meinshausen,N.,“高维推断:置信区间、p值和R软件hdi”,《统计科学》,第30期,第533-558页(2015年)·Zbl 1426.62183号 ·doi:10.1214/15-STS527
[13] Dobra,A.,“全基因组数据的变量选择和依赖网络,生物统计学,10621-639(2009)·Zbl 1437.62444号 ·doi:10.1093/biostatistics/kxp018
[14] 多尔曼,S。;巴拉诺瓦,K。;诺尔,J。;Urquhart,B。;Mariani,G。;Carcangiu,M.(卡康吉乌,M.)。;Rogan,P.,“通过机器学习获得的乳腺癌中紫杉醇和吉西他滨耐药的基因组特征,分子肿瘤学,10,85-100(2016)·doi:10.1016/j.molonc.2015.07.006
[15] 范,J。;郭,S。;Hao,N.,“超高维回归中使用重新拟合交叉验证的方差估计,皇家统计学会期刊,B辑,74,37-65(2012)·Zbl 1411.62199号 ·文件编号:10.1111/j.1467-9868.2011.01005.x
[16] 范,J。;Li,R.,“通过非凹惩罚似然的变量选择及其Oracle特性”,《美国统计协会杂志》,961348-1360(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[17] 范,J。;Lv,J.,“超高维特征空间的确定独立筛选”(含讨论),《皇家统计学会杂志》,B辑,70849-911(2008)·Zbl 1411.62187号 ·doi:10.1111/j.1467-9868.2008.00674.x
[18] 范,J。;Peng,H.,“具有不同参数数的非证实惩罚可能性”,《统计年鉴》,32928-961(2004)·Zbl 1092.62031号 ·doi:10.1214/009053604000000256
[19] 范,J。;Song,R.,“具有NP维的广义线性模型中的确定独立性筛选”,《统计年鉴》,38,3567-3604(2010)·兹比尔1206.68157 ·doi:10.1214/10-AOS798
[20] Fithian,W.、Sun,D.和Taylor,J.(2014),“模型选择后的最佳推断”,arXiv编号1410.2597。
[21] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,“用图形拉索进行稀疏逆协方差估计,生物统计学,9,432-441(2008)·Zbl 1143.62076号 ·doi:10.1093/biostatistics/kxm045
[22] 盖瑟,A。;波特,D。;姚,Y。;Borawski,J。;Yang,G。;多诺万,J。;Sage,D。;斯利兹,J。;Tran,M。;斯特劳布,C。;拉姆齐,T。;尤尔根科,V。;黄,A。;陈,Y。;施莱格尔,R。;拉博,M。;Fawell,S。;Sellers,W。;Zawel,L.,“Smac模拟救援筛选揭示凋亡蛋白抑制剂在肿瘤坏死因子-Alpha信号传导中的作用,癌症研究,6711493-11498(2007)·doi:10.1158/0008-5472.CAN-07-5173
[23] Grünwald,V.公司。;Hidalgo,M.,“开发用于癌症治疗的表皮生长因子受体抑制剂,国家癌症研究所杂志,95,851-867(2003)·doi:10.1093/jnci/95.12.851
[24] 哈德利,K。;Hendricks,D.,“使用NQO1状态作为对17-AAG更敏感的食管鳞癌的选择性生物标记物,BMC癌症,14,1-8(2014)·doi:10.1186/1471-2407-14-334
[25] 汉斯,C。;多布拉,A。;West,M.,“使用多个候选预测因子进行回归的枪式随机搜索,美国统计协会杂志,102507-516(2007)·Zbl 1134.62398号 ·doi:10.1198/0162145000000121
[26] Holm,S.,“简单序贯拒绝多重测试程序”,《斯堪的纳维亚统计杂志》,第6期,第65-70页(1979年)·Zbl 0402.62058号
[27] 爪哇马德,A。;Montanari,A.,“高维回归的置信区间和假设检验”,《机器学习研究杂志》,第15期,第2869-2909页(2014年)·Zbl 1319.62145号
[28] 贾,B。;梁,F。;Shi,R。;Xu,S.(2018)
[29] Lauritzen,S.,《图形模型》(1996),牛津:牛津大学出版社,牛津·Zbl 0907.62001
[30] 劳伦斯,R。;Salgia,R.,“MET分子机制与肺癌治疗”,《细胞粘附与迁移》,第4146-152页(2010年)
[31] Lee,H。;Hanibuchi,M。;Lim,S.-J。;Yu,H。;Kim,M。;He,J。;兰利,R。;Lehembre,F。;美国雷根纳斯。;Fidler,I.,“内皮素受体双重拮抗剂Macitetan与紫杉醇联合治疗小鼠实验性人类乳腺癌和肺癌脑转移,神经肿瘤学,18,486-496(2016)·doi:10.1093/neuonc/now037
[32] Lee,法学博士。;Hastie,T.J.,“学习混合图形模型的结构,计算与图形统计杂志,24,230-253(2015)·doi:10.1080/10618600.2014.900500
[33] Lee,法学博士。;Sun,D.L。;孙,Y。;Taylor,J.E.,“精确的选举后推断,及其在拉索中的应用”,《统计年鉴》,44,907-927(2016)·Zbl 1341.62061号 ·doi:10.1214/15-AOS1371
[34] 梁,F。;宋,Q。;邱,P.,“高维高斯图形模型偏相关系数的等效度量,美国统计协会杂志,110,1248-1265(2015)·Zbl 1373.62287号 ·doi:10.1080/01621459.2015.1012391
[35] 梁,F。;宋,Q。;Yu,K.,“高维广义线性模型的贝叶斯子集建模,美国统计协会杂志,108,589-606(2013)·Zbl 06195963号 ·doi:10.1080/01621459.2012.761942
[36] 梁,F。;Zhang,J.,“使用随机近似估计一般依赖下的FDR,生物统计学,95961-977(2008)·Zbl 1437.62525号 ·doi:10.1093/biomet/asn036
[37] 刘,Y。;Yu,B.,稀疏高维线性回归中Lasso+mLS和Lasso+Ridge的渐近性质,电子统计学杂志,73124-3169(2013)·Zbl 1281.62158号
[38] 罗克哈特。;泰勒,J。;Tibshirani,R。;Tibshirani,B.,“对拉索的重大测试,《统计年鉴》,42413-468(2014)·Zbl 1305.62254号 ·doi:10.1214/13-AOS1175
[39] McCullagh,P。;Nelder,J.A.,《广义线性模型》(1989),伦敦:查普曼和霍尔出版社,伦敦·Zbl 0744.62098号
[40] Meek,C.,《因果推理和背景知识因果解释》,403-410(1995)
[41] Meier,L。;Dezeure,R。;明绍森,N。;Maechler,M。;Buehlmann,P.,“高维推断”(2016)
[42] Meinshausen,N.,“松弛拉索,计算统计与数据分析,52,374-393(2007)·Zbl 1452.62522号
[43] Meinshausen,N.,“组约束:设计上无假设稀疏高维回归中变量组的置信区间”,《皇家统计学会杂志》,B辑,77,923-945(2015)·Zbl 1414.62060号
[44] 明绍森,N。;Bühlmann,P.,“高维图和拉索变量选择,统计年鉴,341436-1462(2006)·Zbl 1113.62082号 ·doi:10.1214/0090536000000281
[45] 明绍森,N。;Meier,L。;Bühlmann,P.,“高维回归的P值,美国统计协会杂志,1041671-1681(2009)·Zbl 1205.62089号 ·doi:10.198/jasa.2009.tm08647
[46] Moriwaki,K。;Bertin,J。;戈夫,P。;奥洛夫斯基,G。;Chan,F.,“RIPK1和RIPK3在肿瘤坏死因子诱导的坏死和化疗药物诱导的细胞死亡、细胞死亡和疾病中的差异作用,6,e1636(2015)
[47] Ooe,A。;加藤,K。;Noguchi,S.,“CCT5、RGS3和YKT6基因在p53突变肿瘤中上调对人类乳腺癌多西紫杉醇耐药的可能参与,乳腺癌研究与治疗,101,305-315(2007)·数字对象标识代码:10.1007/s10549-006-9293-x
[48] Pellet,J.-P。;Elisseeff,A.,“使用马尔可夫毛毯进行因果结构学习”,《机器学习研究杂志》,9,1295-1342(2008)·Zbl 1225.68205号
[49] 萨尔达纳,D。;Feng,Y.,“SIS:超高维统计模型中确定独立性筛选的R包,统计软件杂志,83,1-25(2018)·doi:10.18637/jss.v083.i02
[50] 宋,Q。;Liang,F.,“利用L1-正则化进行高维变量选择,美国统计协会杂志,110,1607-1620(2015)·兹比尔1373.62358 ·doi:10.1080/01621459.2014.984812
[51] 宋,Q。;Liang,F.,“超高维回归的分裂合并贝叶斯变量选择方法”,《皇家统计学会杂志》,B辑,77,947-972(2015)·Zbl 1414.62322号
[52] Spirtes,P。;Glymour,C。;Scheines,R.,因果、预测和搜索(2000),波士顿:麻省理工学院出版社,波士顿·Zbl 0806.62001
[53] Storey,J.,“错误发现率的直接方法”,《皇家统计学会杂志》,B辑,64,479-498(2002)·Zbl 1090.62073号 ·doi:10.1111/1467-9868.00346
[54] Tibshirani,R.,“通过LASSO进行回归收缩和选择,皇家统计学会期刊,B辑,58,267-288(1996)·Zbl 0850.62538号 ·doi:10.1111/j.2517-6161.1996.tb02080.x
[55] Tibshirani,R.J。;泰勒,J。;罗克哈特。;Tibshirani,R.,“序列回归程序的精确选择后推断”,《美国统计协会杂志》,111600-620(2016)·doi:10.1080/01621459.2015.1108848
[56] van de Geer,S。;Bühlmann,P.,“关于用于证明Oracle Lasso结果的条件,电子统计杂志,31360-1392(2009)·Zbl 1327.62425号 ·doi:10.1214/09-EJS506
[57] van de Geer,S。;Bühlmann,P。;Ritov,Y。;Dezeure,R.,“关于高维模型的渐近最优置信区域和测试,统计年鉴,42,1166-1202(2014)·Zbl 1305.62259号 ·doi:10.1214/14-AOS1221
[58] Wasserman,L。;Roeder,K.,“高维变量选择,统计年鉴,372178-2201(2009)·兹比尔1173.62054 ·doi:10.1214/08-aos646
[59] 维滕,D。;弗里德曼,J。;Simon,N.,“图形套索的新见解和更快的计算,计算与图形统计杂志,20892-900(2011)·doi:10.1198/jcgs.2011.11051a
[60] 徐,S。;贾,B。;Liang,F.,“混合数据高维贝叶斯网络构建中的道德图学习,神经计算,311183-1214(2019)·Zbl 1471.92136号 ·doi:10.1162/necoa_01190
[61] 薛,J。;Liang,F.,“超高维数据的稳健无模型特征筛选方法,计算与图形统计杂志,26,803-818(2017)·doi:10.1080/10618600.2017.1328364
[62] Yang,Y.(2017),“通过约束拉索进行高维回归的统计推断”,arXiv编号1704.05098v1。
[63] 袁,M。;Lin,Y.,“高斯图形模型中的模型选择和估计,生物特征,95,19-35(2007)·Zbl 1142.62408号 ·doi:10.1093/biomet/asm018
[64] Zhang,C.-H.,“最小凹板惩罚下的几乎无偏变量选择,统计年鉴,38894-942(2010)·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[65] 张,C.-H。;Zhang,S.S.,“高维线性模型中低维参数的置信区间”,《皇家统计学会杂志》,B辑,76,217-242(2014)·Zbl 1411.62196号 ·doi:10.1111/rssb.12026
[66] 张,X。;Cheng,G.,“高维线性模型的同时推断”,《美国统计协会杂志》,112757-768(2017)·doi:10.1080/016214519.201611661114
[67] Zoppoli,G。;Regairaz,M。;Leo,E。;Reinhold,W。;瓦尔马,S。;巴列斯特罗,A。;多罗肖,J。;Pommier,Y.,“假定的DNA/RNA螺旋酶Schlafenl1(SLFN11)使癌细胞对DNA损伤剂敏感,美国国家科学院学报,10915030-15035(2012)·doi:10.1073/pnas.1205943109
[68] Zou,H.,“适应性套索及其Oracle属性,统计年鉴,38894-942(2006)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。