×

条件删失图形Lasso估计量。 (英语) Zbl 1452.62518号

摘要:在许多应用领域,如基因组学,不同类型的数据是在同一个系统上收集的,由于使用的测量技术,例如聚合酶链反应和流式细胞仪生成的数据,其中一些数据集受到审查的情况并不罕见。当总体目标是网络推理时,在系统的可能不同层次,来自不同来源和/或不同分析步骤的信息可以通过使用条件图形模型集成到一个模型中。在本文中,我们为条件高斯图形模型开发了一个双重惩罚推理过程,当数据可以进行删失时。随着高效期望最大化算法的开发,在处理高维删失数据时遇到了计算挑战,基于截断高斯分布矩的近似计算,基于适当推导的两步程序,交替使用图形套索和新的块坐标多元套索方法。我们在广泛的模拟研究和RT-qPCR技术生成的基因表达数据上评估了该方法的性能,在该研究中,我们能够将网络推理、差异表达检测和数据规范化集成到一个模型中。

MSC公司:

62J07型 岭回归;收缩估计器(拉索)
62纳米01 审查数据模型
62H22个 概率图形模型
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Augugliaro,L.,Abbruzzo,A.,Vinciotti,V.:惩罚删失高斯图形模型。生物统计学21(2),e1-e16(2020)
[2] 蔡,T。;Liu,W.,稀疏协方差矩阵估计的自适应阈值,美国统计协会,106,494,672-684(2011)·兹比尔1232.62086
[3] 蔡,T。;李,H。;刘伟。;Xie,J.,协方差调整精度矩阵估计及其在遗传基因组学中的应用,生物统计学,100,1139-156(2013)·Zbl 1284.62648号
[4] 陈,M。;任,Z。;赵,H。;Zhou,H.,协变量调整高斯图形模型的渐近正态和有效估计,美国统计协会,111,513,394-406(2016)
[5] Chiquet,J。;Huard,TM公司;Robin,S.,条件高斯图形模型的结构化正则化,统计计算。,27, 3, 789-804 (2017) ·Zbl 1505.62102号
[6] 西勒克,爱沙尼亚;奥兹图尔克,H。;Dedeoglu,BG,《揭示曲妥珠单抗治疗乳腺癌细胞系中miRNA-miRNA介导机制复杂性的miRNA-micRNA网络构建》,PLoS ONE,12,10,e0185558(2017)
[7] 崔,X。;Yu,S。;Tamhane,A。;考西,ZL;Steg,A。;达尼拉,密歇根州;雷诺兹,RJ;Wang,J。;康涅狄格州万泽克;唐奇。;Ledbetter,SS,RT-qPCR低密度阵列数据归一化中校正(Delta c_t)偏差的简单回归,BMC基因组学。,16, 1, 82-93 (2015)
[8] 阿联酋登普斯特;新墨西哥州莱尔德;DB鲁宾,《通过EM算法从不完整数据中获得最大似然》,J.R.Stat.Soc.B,39,1,1-38(1977)·Zbl 0364.62022号
[9] Dervaux,S。;Vandesompele,J。;Hellemans,J.,如何使用实时PCR成功进行基因表达分析,方法,50,4,227-230(2010)
[10] Foygel,R。;德顿,M。;Lafferty,J。;威廉姆斯,C。;肖-泰勒,J。;泽梅尔,R。;Culott,A.,《高斯图形模型的扩展贝叶斯信息标准》,《神经信息处理系统进展》23,604-612(2010),温哥华:Curran Associates Inc.,Vancouver
[11] JH弗里德曼;哈斯蒂,T。;Tibshirani,R.,用图形套索进行稀疏逆协方差估计,生物统计学,9,3,432-441(2008)·兹比尔1143.62076
[12] JH弗里德曼;哈斯蒂,T。;Tibshirani,R.,通过坐标下降广义线性模型的正则化路径,J.Stat.Softw。,33, 1, 1-22 (2010)
[13] Friedman,J.H.,Hastie,T.,Tibshirani,R.:glasso:图形套索-高斯图形模型的估计(2018)
[14] 郭杰。;莱维纳,E。;Michailidis,G。;Zhu,J.,有序数据的图形模型,J.计算。图表。Stat.,24,1,183-204(2015)
[15] 北卡罗来纳州古铁雷斯。;马萨诸塞州萨拉斯克特。;Misiewicz-Krzeminska,I。;德尔加多,M。;里瓦斯,JDL;蒂科纳,F。;费米南,E。;Martín-Jiménez,P。;奇隆,C。;Risueño,A。;埃尔南德斯,J。;加西亚·桑斯,R。;González,M。;Miguel,JS,多发性骨髓瘤不同基因亚型中microRNA表达的解除调控及与基因表达谱的相关性,白血病,24,3,629-637(2010)
[16] 黄,F。;Chen,S.,学习动态条件高斯图形模型,IEEE Trans。知识。数据工程,30,4,703-716(2018)
[17] 黄,F。;陈,S。;黄,S-J,多条件高斯图形模型的联合估计,IEEE Trans。神经网络。学习。系统。,29, 7, 3034-3046 (2018)
[18] 易卜拉欣,JG;朱,H。;Tang,N.,使用EM算法解决缺失数据问题的模型选择标准,美国统计协会,103,484,1648-1658(2008)·Zbl 1286.62082号
[19] 凯尔,RA;Rajkumar,VS,多发性骨髓瘤,血液,111,6,2962-2972(2008)
[20] Lafferty,J.、McCallum,A.、Pereira,F.C.:条件随机场:分割和标记序列数据的概率模型。摘自:《2001年第18届国际机器学习会议论文集》(ICML 2001),第282-289页(2001)
[21] Lauritzen,SL,《图形模型》(1996),牛津:牛津大学出版社,牛津·Zbl 0907.62001
[22] Lee,W。;Liu,Y.,通过惩罚高斯最大似然进行同步多响应回归和逆协方差矩阵估计,J.Multivar。分析。,111, 241-255 (2012) ·Zbl 1259.62043号
[23] Li,B。;Chun,H。;Zhao,H.,条件图形模型的稀疏估计及其在基因网络中的应用,美国统计协会,107,497,152-167(2012)·Zbl 1261.62049号
[24] 莱奥内蒂,M。;比亚西奥洛,M。;阿涅利,L。;托多尔蒂,K。;莫斯卡,L。;Fabris,S。;销售额,G。;Deliliers,G。;比奇亚托,S。;伦巴第,L。;Bortoluzzi,S。;Neri,A.,《多发性骨髓瘤不同分子群中microRNA表达模式的识别和microRNA/mRNA调节网络的定义》,《血液》,114,25,e20-6(2009)
[25] 小,RJA;鲁宾,DB,《数据缺失的统计分析》(2002),霍博肯:威利,霍博肯·Zbl 1011.62004号
[26] 明尼苏达州麦考尔;人力资源部麦克默里;土地,H。;Almudevar,A.,关于qPCR数据中的非检测,生物信息学,30,16,2310-2316(2014)
[27] 麦克拉克伦,G。;Krishnan,T.,EM算法和扩展(2008),霍博肯:威利,霍博肯·Zbl 1165.62019号
[28] Misiewicz-Krzeminska,I。;马萨诸塞州萨拉斯克特;Quwaider,D。;Krzeminski,P。;蒂科纳,F。;Paíno,T。;德尔加多,M。;艾利斯,A。;欧西奥,EM;加西亚·桑斯,R。;圣米格尔,JF;Gutiérrez,NC,通过积极调节P53和抑制DNA复制,恢复microRNA-214表达减少骨髓瘤细胞的生长,血液学,98,4,640-648(2013)
[29] 管道工,P。;克莱门特,L。;维尼克,M。;Hellemans,J。;Vandesompele,J。;Thas,O.,qPCR差异基因表达分析的统一删失正态回归模型,PLoS ONE,12,8,e0182832(2017)
[30] AJ罗斯曼;莱维纳,E。;朱,J.,具有协方差估计的稀疏多元回归,J.Compute。图表。Stat.,19,4,947-962(2010年)
[31] Seckinger,A。;梅纳,T。;Moreaux,T。;贝内斯,V。;Hillengass,J。;卡斯托尔迪,M。;齐默尔曼,J。;Ho,A。;Jauch,A。;Goldschmidt,H。;克莱因,B。;Hose,D.,多发性骨髓瘤中的miRNA——一种与生存相关的基因表达复杂调节因子,肿瘤靶点,6,3639165-39183(2015)
[32] Sohn,K.-A.,Kim,S.:通过反方差正则化对多输出回归中的结构稀疏性和输出结构进行联合估计。收录于:Lawrence,N.D.,Girolma,M.,(编辑)《第十五届国际人工智能与统计会议论文集》,《机器学习研究论文集》第22卷,第1081-1089页,加那利群岛拉帕尔马,第21-23页(2012)。PMLR公司
[33] 北卡罗来纳州施特勒。;Bühlmann,P.,缺失值:稀疏逆协方差估计和稀疏回归的扩展,统计计算。,22219-235(2012年)·Zbl 1322.62115号
[34] Tibshirani,R.,《通过套索进行回归收缩和选择》,J.R.Stat.Soc.B,58,1,267-288(1996)·Zbl 0850.62538号
[35] Tseng,P.,不可微极小化块坐标下降法的收敛性,J.Optim。理论应用。,109, 3, 475-494 (2001) ·Zbl 1006.65062号
[36] Wang,J.,稀疏多元回归与条件图形模型的联合估计,《统计中国》,25,3,831-851(2015)·Zbl 1415.62051号
[37] 维滕,DM;JH弗里德曼;Simon,N.,《图形套索的新见解和更快的计算》,J.Compute。图表。统计,20,4,892-900(2011)
[38] Wytock,M.,Kolter,Z.:稀疏高斯条件随机场:算法、理论和在能源预测中的应用。收录于:Dasgupta,S.、McAllester,D.(eds)《第三十届机器学习国际会议论文集》,第28卷,第1265-1273页(2013)
[39] 袁,M。;Lin,Y.,《分组变量回归中的模型选择和估计》,J.R.Stat.Soc.B,68,1,49-67(2006)·Zbl 1141.62030号
[40] 尹,J。;Li,H.,遗传基因组数据分析的稀疏条件高斯图形模型,Ann.Appl。统计,5,4,2630-2650(2011)·Zbl 1234.62151号
[41] 尹,J。;Li,H.,通过(ell_1)惩罚法调整稀疏精度矩阵估计中的高维协变量,J.Multivar。分析。,116, 365-381 (2013) ·Zbl 1277.62146号
[42] 袁,M。;Lin,Y.,高斯图形模型中的模型选择和估计,生物统计学,94,1,19-35(2007)·Zbl 1142.62408号
[43] 元,XT;Zhang,T.,偏高斯图形模型估计,IEEE Trans。《信息论》,60,3,1673-1687(2014)·兹比尔1360.62284
[44] 张,L。;Kim,S.,使用eQTL数据集学习SNP扰动下的基因网络,PLoS Compute。生物,10,2,1-20(2014)
[45] Zhao,T.,Li,X.,Liu,H.,Roeder,K.,Lafferty,J.,Wasserman,L.:巨大:高维无向图估计。R包版本1.2.7(2015)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。