×

具有错误发现率控制的指数族图形模型的结构学习。 (英语) Zbl 07745477号

摘要:概率图形模型由于能够对随机变量之间的条件依赖关系进行建模,在广泛的领域中广受欢迎。研究了具有错误发现率(FDR)控制的指数族图形模型的结构学习。大多数现有的FDR控制结构学习程序都是为高斯图形模型(GGM)设计的。对于更一般的指数族图形模型,仍然缺乏一种系统的方法。本文介绍了利用对称化数据聚合(SDA)技术,通过样本分割、数据筛选和信息池,通过FDR控制学习指数族图形模型结构的统一过程。我们证明了我们的方法在一些温和的条件下渐近控制FDR。大量仿真结果和两个实际数据示例验证了该方法的有效性。

理学硕士:

62-XX年 统计
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Allen,G.I.和Liu,Z(2012)。从高通量测序数据推断遗传网络的对数线性图形模型。2012年IEEE生物信息学和生物医学国际会议(第1-6页)。电气与电子工程师协会。
[2] 艾伦,GI;Liu,Z.,用于从测序数据推断网络的局部泊松图形模型,IEEE纳米生物科学汇刊,12,3,189-198(2013)
[3] 阿拉巴马州巴拉巴西;Albert,R.,《随机网络中尺度的出现》,《科学》,286,5439,509-512(1999)·Zbl 1226.05223号
[4] 理发师,RF;Candès,EJ,高维选择性推理的仿冒过滤器,《统计年鉴》,47,5,2504-2537(2019)·Zbl 1444.62034号
[5] 理发师,RF;Drton,M.,《利用贝叶斯信息准则进行高维ising模型选择》,《电子统计杂志》,9,1,567-607(2015)·Zbl 1309.62050号
[6] Y.本杰米尼。;Hochberg,Y.,《控制错误发现率:一种实用而有力的多重测试方法》,《皇家统计学会杂志:B辑(方法学)》,57,1,289-300(1995)·Zbl 0809.62014号
[7] Bühlmann,P。;Mandozzi,J.,《高维变量筛选和后续推断中的偏差,以及实证比较》,《计算统计》,29,3,407-430(2014)·Zbl 1306.65035号
[8] 蔡,T。;李,H。;Ma,J.,微分马尔可夫随机场分析及其在检测差异微生物群落网络中的应用,Biometrika,106,2,401-416(2019)·兹比尔1444.62121
[9] 蔡,T。;刘,W。;Luo,X.,稀疏精度矩阵估计的约束\(\ell_1\)最小化方法,美国统计协会杂志,106494594-607(2011)·Zbl 1232.62087号
[10] Cheng,J。;李·T。;Levina,E.,高维混合图形模型,《计算与图形统计杂志》,26,2,367-378(2017)
[11] 陈,X。;Liu,W.,矩阵变量高斯数据的图估计,中国统计,29,1479-504(2019)·兹比尔1412.62103
[12] d'Aspremont,A。;O.班纳吉。;El Ghaoui,L.,稀疏协方差选择的一阶方法,SIAM矩阵分析与应用杂志,30,1,56-66(2008)·Zbl 1156.90423号
[13] 德顿,M。;Maathuis,MH,《图形建模中的结构学习》,《统计及其应用年鉴》,4,365-393(2017)
[14] 德顿,M。;Perlman,MD,《高斯图形模型选择中的多重测试和错误控制》,《统计科学》,22,3,430-449(2007)·Zbl 1246.62143号
[15] Du,L.,Guo,X.,Sun,W.等(2021)。通过对称数据聚合控制一般依赖下的错误发现率。美国统计协会杂志,1-15。
[16] 范,J。;Feng,Y。;Wu,Y.,通过自适应套索和扫描惩罚进行网络探索,应用统计年鉴,3,2,521(2009)·Zbl 1166.62040号
[17] Foygel,R.和Drton,M.(2010年)。高斯图形模型的扩展贝叶斯信息准则。神经信息处理系统进展,23,1-9。
[18] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,用图形套索进行稀疏逆协方差估计,生物统计学,9,3,432-441(2008)·Zbl 1143.62076号
[19] 何毅。;张,X。;Wang,P.,带FDR控制的高维高斯copula图形模型,计算统计与数据分析,113,457-474(2017)·Zbl 1464.62089号
[20] Höfling,H.和Tibshirani,R.(2009)。使用伪似然估计稀疏二元成对马尔可夫网络。机器学习研究杂志,10(4),883-906·Zbl 1245.62121号
[21] Jeon,M。;Jin,IH;Schweinberger,M.,《绘制未观察到的项目反应交互:带有交互图的潜在空间项目反应模型》,《心理测量学》,86,2,378-403(2021)·Zbl 1477.62342号
[22] Keener,R.W.(2010)。理论统计学:核心课程的主题。斯普林格·兹比尔1269.62003
[23] Kouros-Mehr,H。;斯洛拉,EM;Sternlicht,MD,Gata-3维持乳腺管腔细胞命运的分化,细胞,127,51041-1055(2006)
[24] Lam,C。;Fan,J.,大协方差矩阵估计中的稀疏性和收敛速度,《统计年鉴》,37,6,4254(2009)·Zbl 1191.62101号
[25] Lauritzen,S.L.(1996)。图形模型(第17卷)。克拉伦登出版社·Zbl 0907.62001
[26] Lee,JD;Hastie,TJ,学习混合图形模型的结构,《计算与图形统计杂志》,24,1,230-253(2015)
[27] Lee,S。;Sobczyk,P。;Bogdan,M.,具有错误发现率控制的高斯马尔可夫随机场的结构学习,《对称性》,第11、10、1311页(2019年)
[28] Lehmann,E.L.和Casella,G.(2006年)。点估计理论。施普林格科技与商业媒体·Zbl 0916.62017号
[29] 李,J。;Maathuis,MH,GGM仿冒过滤器:高斯图形模型的错误发现率控制,皇家统计学会杂志:B辑(统计方法),83,3,534-558(2021)·Zbl 07555495号
[30] 刘伟,带错误发现率控制的高斯图形模型估计,《统计年鉴》,41,6,2948-2978(2013)·Zbl 1288.62094号
[31] 刘,W。;Shao,QM,大规模(t)测试中的阶段转换和正则引导,错误发现率控制,统计年鉴,42,5,2003-2025(2014)·Zbl 1305.62213号
[32] 刘,H。;Wang,L.,Tiger:优化估计高斯图形模型的调谐敏感方法,《电子统计杂志》,11,1,241-294(2017)·Zbl 1395.62007号
[33] 明绍森,N。;Bühlmann,P.,用套索选择高维图和变量,《统计年鉴》,34,3,1436-1462(2006)·Zbl 1113.62082号
[34] 明绍森,N。;Meier,L。;Bühlmann,P.,高维回归的(P)值,美国统计协会杂志,104,488,1671-1681(2009)·Zbl 1205.62089号
[35] 纳塔利,P。;尼科特拉,M。;Sures,I.,《乳腺癌与c-kit癌基因产物的丢失有关》,国际癌症杂志,52,5713-717(1992)
[36] 拉维库马尔,P。;温赖特,MJ;Lafferty,JD,使用\(\ell_1\)正则化逻辑回归的高维ising模型选择,《统计学年鉴》,38,3,1287-1319(2010)·Zbl 1189.62115号
[37] 拉维库马尔,P。;温赖特,MJ;Raskutti,G.,通过最小化\(l_1\)惩罚对数行列式散度进行高维协方差估计,《电子统计学杂志》,5935-980(2011)·Zbl 1274.62190号
[38] 罗斯-伊内斯,CS;斯塔克·R。;Teschendorff,AE,差异雌激素受体结合与乳腺癌临床结局相关,《自然》,481,7381,389-393(2012)
[39] AJ罗斯曼;PJ Bickel;Levina,E.,稀疏排列不变协方差估计,《电子统计杂志》,2494-515(2008)·Zbl 1320.62135号
[40] Salese,S。;气味,L。;Chazée,L.,Elastin分子老化促进mda-mb-231乳腺癌细胞侵袭,FEBS Open Bio,8,9,1395-1404(2018)
[41] Sun,T。;Zhang,CH,带尺度套索的稀疏矩阵反演,机器学习研究杂志,14,1,3385-3418(2013)·Zbl 1318.62184号
[42] 滕,YHF;Tan,WJ;Thike,AA,三阴性乳腺癌中表皮生长因子受体(EGFR)基因的突变:对靶向治疗的可能影响,乳腺癌研究,13,2,1-9(2011)
[43] 范德格尔,SA;Bühlmann,P.,《关于证明套索预言结果的条件》,《电子统计杂志》,31360-1392(2009)·Zbl 1327.62425号
[44] Wasserman,L。;Roeder,K.,高维变量选择,《统计年鉴》,37,5,2178(2009)·Zbl 1173.62054号
[45] 夏,Y。;蔡,T。;Cai,TT,《测试差分网络及其在基因-基因相互作用检测中的应用》,《生物特征》,102,2,247-266(2015)·Zbl 1452.62392号
[46] 薛,L。;邹,H。;Cai,T.,稀疏ising模型的非凹陷惩罚复合条件似然估计,《统计年鉴》,40,3,1403-1429(2012)·Zbl 1284.62451号
[47] Yang,E.、Allen,G.、Liu,Z.等(2012)。通过广义线性模型的图形模型。神经信息处理系统进展,25,1-9。
[48] Yang,E.,Baker,Y.,&Ravikumar,P.等人(2014)。通过指数族的混合图形模型。《人工智能与统计学》,PMLR(第1042-1050页)。
[49] 杨,E。;拉维库马尔,P。;Allen,GI,通过单变量指数族分布的图形模型,机器学习研究杂志,16,1,3813-3847(2015)·兹比尔1351.62111
[50] 杨,E。;拉维库马尔,PK;Allen,GI,通过单变量指数族的条件随机场,神经信息处理系统进展,26,1-9(2013)
[51] Yu,L.、Kaufmann,T.和Lederer,J.(2021)。生物网络中的错误发现率。在国际人工智能和统计会议上,PMLR(第163-171页)。
[52] 袁,M.,基于线性规划的高维逆协方差矩阵估计,机器学习研究杂志,112261-2286(2010)·Zbl 1242.62043号
[53] 袁,M。;Lin,Y.,高斯图形模型中的模型选择和估计,生物统计学,94,1,19-35(2007)·Zbl 1142.62408号
[54] Zhang,Y。;杜奇,JC;MJ Wainwright,《统计优化的通信高效算法》,《机器学习研究杂志》,14,1,3321-3363(2013)·Zbl 1318.62016号
[55] 张,R。;任,Z。;Celedón,JC,大型修正泊松型图形模型的推断:RNA-SEQ数据在儿童特应性哮喘研究中的应用,应用统计学年鉴,15,2,831-855(2021)·Zbl 1478.62350号
[56] Zhao,T。;Liu,H.,高维椭圆分布的校准精度矩阵估计,IEEE信息理论汇刊,60,12,7874-7887(2014)·兹比尔1359.62194
[57] Zhao,T。;刘,H。;Roeder,K.,《r中高维无向图估计的巨大软件包》,《机器学习研究杂志》,13,1,1059-1062(2012)·Zbl 1283.68311号
[58] 郑,Z。;周,J。;Guo,X.,《通过仿冒品恢复图形结构》,《Procedia Computer Science》,129201-207(2018)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。