刘燕红;张宇豪;李忠华 具有错误发现率控制的指数族图形模型的结构学习。 (英语) Zbl 07745477号 J.韩国统计学会。 52,编号3,554-580(2023). 摘要:概率图形模型由于能够对随机变量之间的条件依赖关系进行建模,在广泛的领域中广受欢迎。研究了具有错误发现率(FDR)控制的指数族图形模型的结构学习。大多数现有的FDR控制结构学习程序都是为高斯图形模型(GGM)设计的。对于更一般的指数族图形模型,仍然缺乏一种系统的方法。本文介绍了利用对称化数据聚合(SDA)技术,通过样本分割、数据筛选和信息池,通过FDR控制学习指数族图形模型结构的统一过程。我们证明了我们的方法在一些温和的条件下渐近控制FDR。大量仿真结果和两个实际数据示例验证了该方法的有效性。 理学硕士: 62-XX年 统计 关键词:结构学习;错误发现率;指数族图形模型;对称数据聚合 软件:测试BMN;巨大的;玻璃制品 PDF格式BibTeX公司 XML格式引用 \textit{Y.Liu}等人,J.Korean Stat.Soc.52,No.3,554--580(2023;Zbl 07745477) 全文: DOI程序 参考文献: [1] Allen,G.I.和Liu,Z(2012)。从高通量测序数据推断遗传网络的对数线性图形模型。2012年IEEE生物信息学和生物医学国际会议(第1-6页)。电气与电子工程师协会。 [2] 艾伦,GI;Liu,Z.,用于从测序数据推断网络的局部泊松图形模型,IEEE纳米生物科学汇刊,12,3,189-198(2013) [3] 阿拉巴马州巴拉巴西;Albert,R.,《随机网络中尺度的出现》,《科学》,286,5439,509-512(1999)·Zbl 1226.05223号 [4] 理发师,RF;Candès,EJ,高维选择性推理的仿冒过滤器,《统计年鉴》,47,5,2504-2537(2019)·Zbl 1444.62034号 [5] 理发师,RF;Drton,M.,《利用贝叶斯信息准则进行高维ising模型选择》,《电子统计杂志》,9,1,567-607(2015)·Zbl 1309.62050号 [6] Y.本杰米尼。;Hochberg,Y.,《控制错误发现率:一种实用而有力的多重测试方法》,《皇家统计学会杂志:B辑(方法学)》,57,1,289-300(1995)·Zbl 0809.62014号 [7] Bühlmann,P。;Mandozzi,J.,《高维变量筛选和后续推断中的偏差,以及实证比较》,《计算统计》,29,3,407-430(2014)·Zbl 1306.65035号 [8] 蔡,T。;李,H。;Ma,J.,微分马尔可夫随机场分析及其在检测差异微生物群落网络中的应用,Biometrika,106,2,401-416(2019)·兹比尔1444.62121 [9] 蔡,T。;刘,W。;Luo,X.,稀疏精度矩阵估计的约束\(\ell_1\)最小化方法,美国统计协会杂志,106494594-607(2011)·Zbl 1232.62087号 [10] Cheng,J。;李·T。;Levina,E.,高维混合图形模型,《计算与图形统计杂志》,26,2,367-378(2017) [11] 陈,X。;Liu,W.,矩阵变量高斯数据的图估计,中国统计,29,1479-504(2019)·兹比尔1412.62103 [12] d'Aspremont,A。;O.班纳吉。;El Ghaoui,L.,稀疏协方差选择的一阶方法,SIAM矩阵分析与应用杂志,30,1,56-66(2008)·Zbl 1156.90423号 [13] 德顿,M。;Maathuis,MH,《图形建模中的结构学习》,《统计及其应用年鉴》,4,365-393(2017) [14] 德顿,M。;Perlman,MD,《高斯图形模型选择中的多重测试和错误控制》,《统计科学》,22,3,430-449(2007)·Zbl 1246.62143号 [15] Du,L.,Guo,X.,Sun,W.等(2021)。通过对称数据聚合控制一般依赖下的错误发现率。美国统计协会杂志,1-15。 [16] 范,J。;Feng,Y。;Wu,Y.,通过自适应套索和扫描惩罚进行网络探索,应用统计年鉴,3,2,521(2009)·Zbl 1166.62040号 [17] Foygel,R.和Drton,M.(2010年)。高斯图形模型的扩展贝叶斯信息准则。神经信息处理系统进展,23,1-9。 [18] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,用图形套索进行稀疏逆协方差估计,生物统计学,9,3,432-441(2008)·Zbl 1143.62076号 [19] 何毅。;张,X。;Wang,P.,带FDR控制的高维高斯copula图形模型,计算统计与数据分析,113,457-474(2017)·Zbl 1464.62089号 [20] Höfling,H.和Tibshirani,R.(2009)。使用伪似然估计稀疏二元成对马尔可夫网络。机器学习研究杂志,10(4),883-906·Zbl 1245.62121号 [21] Jeon,M。;Jin,IH;Schweinberger,M.,《绘制未观察到的项目反应交互:带有交互图的潜在空间项目反应模型》,《心理测量学》,86,2,378-403(2021)·Zbl 1477.62342号 [22] Keener,R.W.(2010)。理论统计学:核心课程的主题。斯普林格·兹比尔1269.62003 [23] Kouros-Mehr,H。;斯洛拉,EM;Sternlicht,MD,Gata-3维持乳腺管腔细胞命运的分化,细胞,127,51041-1055(2006) [24] Lam,C。;Fan,J.,大协方差矩阵估计中的稀疏性和收敛速度,《统计年鉴》,37,6,4254(2009)·Zbl 1191.62101号 [25] Lauritzen,S.L.(1996)。图形模型(第17卷)。克拉伦登出版社·Zbl 0907.62001 [26] Lee,JD;Hastie,TJ,学习混合图形模型的结构,《计算与图形统计杂志》,24,1,230-253(2015) [27] Lee,S。;Sobczyk,P。;Bogdan,M.,具有错误发现率控制的高斯马尔可夫随机场的结构学习,《对称性》,第11、10、1311页(2019年) [28] Lehmann,E.L.和Casella,G.(2006年)。点估计理论。施普林格科技与商业媒体·Zbl 0916.62017号 [29] 李,J。;Maathuis,MH,GGM仿冒过滤器:高斯图形模型的错误发现率控制,皇家统计学会杂志:B辑(统计方法),83,3,534-558(2021)·Zbl 07555495号 [30] 刘伟,带错误发现率控制的高斯图形模型估计,《统计年鉴》,41,6,2948-2978(2013)·Zbl 1288.62094号 [31] 刘,W。;Shao,QM,大规模(t)测试中的阶段转换和正则引导,错误发现率控制,统计年鉴,42,5,2003-2025(2014)·Zbl 1305.62213号 [32] 刘,H。;Wang,L.,Tiger:优化估计高斯图形模型的调谐敏感方法,《电子统计杂志》,11,1,241-294(2017)·Zbl 1395.62007号 [33] 明绍森,N。;Bühlmann,P.,用套索选择高维图和变量,《统计年鉴》,34,3,1436-1462(2006)·Zbl 1113.62082号 [34] 明绍森,N。;Meier,L。;Bühlmann,P.,高维回归的(P)值,美国统计协会杂志,104,488,1671-1681(2009)·Zbl 1205.62089号 [35] 纳塔利,P。;尼科特拉,M。;Sures,I.,《乳腺癌与c-kit癌基因产物的丢失有关》,国际癌症杂志,52,5713-717(1992) [36] 拉维库马尔,P。;温赖特,MJ;Lafferty,JD,使用\(\ell_1\)正则化逻辑回归的高维ising模型选择,《统计学年鉴》,38,3,1287-1319(2010)·Zbl 1189.62115号 [37] 拉维库马尔,P。;温赖特,MJ;Raskutti,G.,通过最小化\(l_1\)惩罚对数行列式散度进行高维协方差估计,《电子统计学杂志》,5935-980(2011)·Zbl 1274.62190号 [38] 罗斯-伊内斯,CS;斯塔克·R。;Teschendorff,AE,差异雌激素受体结合与乳腺癌临床结局相关,《自然》,481,7381,389-393(2012) [39] AJ罗斯曼;PJ Bickel;Levina,E.,稀疏排列不变协方差估计,《电子统计杂志》,2494-515(2008)·Zbl 1320.62135号 [40] Salese,S。;气味,L。;Chazée,L.,Elastin分子老化促进mda-mb-231乳腺癌细胞侵袭,FEBS Open Bio,8,9,1395-1404(2018) [41] Sun,T。;Zhang,CH,带尺度套索的稀疏矩阵反演,机器学习研究杂志,14,1,3385-3418(2013)·Zbl 1318.62184号 [42] 滕,YHF;Tan,WJ;Thike,AA,三阴性乳腺癌中表皮生长因子受体(EGFR)基因的突变:对靶向治疗的可能影响,乳腺癌研究,13,2,1-9(2011) [43] 范德格尔,SA;Bühlmann,P.,《关于证明套索预言结果的条件》,《电子统计杂志》,31360-1392(2009)·Zbl 1327.62425号 [44] Wasserman,L。;Roeder,K.,高维变量选择,《统计年鉴》,37,5,2178(2009)·Zbl 1173.62054号 [45] 夏,Y。;蔡,T。;Cai,TT,《测试差分网络及其在基因-基因相互作用检测中的应用》,《生物特征》,102,2,247-266(2015)·Zbl 1452.62392号 [46] 薛,L。;邹,H。;Cai,T.,稀疏ising模型的非凹陷惩罚复合条件似然估计,《统计年鉴》,40,3,1403-1429(2012)·Zbl 1284.62451号 [47] Yang,E.、Allen,G.、Liu,Z.等(2012)。通过广义线性模型的图形模型。神经信息处理系统进展,25,1-9。 [48] Yang,E.,Baker,Y.,&Ravikumar,P.等人(2014)。通过指数族的混合图形模型。《人工智能与统计学》,PMLR(第1042-1050页)。 [49] 杨,E。;拉维库马尔,P。;Allen,GI,通过单变量指数族分布的图形模型,机器学习研究杂志,16,1,3813-3847(2015)·兹比尔1351.62111 [50] 杨,E。;拉维库马尔,PK;Allen,GI,通过单变量指数族的条件随机场,神经信息处理系统进展,26,1-9(2013) [51] Yu,L.、Kaufmann,T.和Lederer,J.(2021)。生物网络中的错误发现率。在国际人工智能和统计会议上,PMLR(第163-171页)。 [52] 袁,M.,基于线性规划的高维逆协方差矩阵估计,机器学习研究杂志,112261-2286(2010)·Zbl 1242.62043号 [53] 袁,M。;Lin,Y.,高斯图形模型中的模型选择和估计,生物统计学,94,1,19-35(2007)·Zbl 1142.62408号 [54] Zhang,Y。;杜奇,JC;MJ Wainwright,《统计优化的通信高效算法》,《机器学习研究杂志》,14,1,3321-3363(2013)·Zbl 1318.62016号 [55] 张,R。;任,Z。;Celedón,JC,大型修正泊松型图形模型的推断:RNA-SEQ数据在儿童特应性哮喘研究中的应用,应用统计学年鉴,15,2,831-855(2021)·Zbl 1478.62350号 [56] Zhao,T。;Liu,H.,高维椭圆分布的校准精度矩阵估计,IEEE信息理论汇刊,60,12,7874-7887(2014)·兹比尔1359.62194 [57] Zhao,T。;刘,H。;Roeder,K.,《r中高维无向图估计的巨大软件包》,《机器学习研究杂志》,13,1,1059-1062(2012)·Zbl 1283.68311号 [58] 郑,Z。;周,J。;Guo,X.,《通过仿冒品恢复图形结构》,《Procedia Computer Science》,129201-207(2018) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。