×

评估弥漫性大B细胞淋巴瘤基因表达数据集网络meta分析的共同协方差矩阵。 (英语) Zbl 1405.62159号

摘要:基因表达协方差矩阵的估计在癌症系统生物学中有许多应用。然而,许多基因表达研究因样本量低而受到阻碍,因此通过收集研究中的基因表达数据来增加样本量已成为一种流行做法。受使用随机效应模型的传统荟萃分析的启发,我们提出了一个分层随机协方差模型,并将其用于11个弥漫性大B细胞淋巴瘤(DLBCL)大规模基因表达研究的基因相关网络的荟萃分析。我们建议对潜在的公共协方差矩阵使用最大似然估计,并引入EM算法进行估计。通过仿真实验,比较了通过cophenetic相关和Kullback-Leibler散度估计的协方差矩阵,表明所建议的估计量的性能优于或不劣于简单的混合估计量。在对DLBCL数据的估计共同协方差矩阵进行事后分析时,我们能够识别具有预后价值的特征基因的新的具有生物学意义的基因相关网络。总之,当多个特征被测量并被认为共享一个被研究相关噪声掩盖的共同协方差矩阵时,该方法似乎为荟萃分析提供了一个普遍适用的框架。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62甲12 多元分析中的估计
92立方厘米 系统生物学、网络
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Agnelli,L.,Forcato,M.,Ferrari,F.,Tuana,G.,Todoerti,K.,Walker,B.A.,Morgan,G.J.,Lombardi,L..,Bicciato,S.和Neri,A.(2011)。转录网络的重建揭示了影响多发性骨髓瘤临床结局的关键基因。临床。癌症研究17 7402–7412。
[2] Bilgrau,A.E.(2014)。correlateR:快速、高效和稳健的部分相关性。R包版本0.1。可在http://github.com/AEBilgrau/correlateR。
[3] Bilgrau,A.E.、Bröndum,R.F.、Eriksen,P.S.、DybkR,K.和Bögsted,M.(2018年)。对“评估弥漫性大B细胞淋巴瘤基因表达数据集网络荟萃分析的共同协方差矩阵”的补充。DOI:10.1214/18-AOAS1136SUPPA。
[4] Borenstein,M.、Hedges,L.V.、Higgins,J.P.和Rothstein,H.R.(2010年)。元分析中固定效应和随机效应模型的基本介绍。Res.合成。方法197-111。
[5] Cheng,P.、Corzo,C.A.、Luetteke,N.、Yu,B.、Nagaraj,S.、Bui,M.M.、Ortiz,M.、Nacken,W.、Sorg,C.、Vogl,T.等人(2008年)。S100A9蛋白对肿瘤中树突状细胞分化和髓源性抑制细胞积聚的抑制作用进行调节。《实验医学杂志》,2005年,2235–2249。
[6] Choi,J.K.,Yu,U.,Kim,S.和Yoo,O.J.(2003)。结合多个微阵列研究和建模研究间变异。生物信息学19 i84–i90。
[7] Clarke,C.、Madden,S.F.、Doolan,P.、Aherne,S.T.、Joyce,H.、O'Driscoll,L.、Gallagher,W.M.、Hennessy,B.T.、Moriarty,M.、Crown,J.、Kennedy,S.和Clynes,M.(2013)。转录网络与乳腺癌生存率的相关性:一项大规模共表达分析。致癌34 2300–2308。
[8] Compagno,M.,Lim,W.K.,Grunn,A.,Nandula,S.V.,Brahmachary,M..,Shen,Q.,Bertoni,F.,Ponzoni,M.、Scandurra,M.和Califano,A.等人(2009年)。在弥漫性大B细胞淋巴瘤中,多基因突变导致NF-κB的失调。自然459 717–721。
[9] Dai,M.,Wang,P.,Boyd,A.D.,Kostov,G.,Athey,B.,Jones,E.G.,Bunney,W.E.,Myers,R.M.,Speed,T.P.,Akil,H.,Watson,S.J.和Meng,F.(2005)。进化中的基因/转录定义显著改变了基因芯片数据的解释。核酸研究33 e175。
[10] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977年)。通过EM算法从不完整数据中获得最大似然。J.罗伊。统计师。Soc.序列号。B39 1–38·Zbl 0364.62022号
[11] DerSimonian,R.和Laird,N.(1986年)。临床试验的荟萃分析。控制。临床。试验7 177–188。
[12] Dybkr,K.,Bógsted,M.,Falgreen,S.,Bödker,J.S.,Kjeldsen,M.K.,Schmitz,A.,Bilgrau,A.E.,Xu-Monette,Z.Y.,Li约翰森,H.E.(2015)。弥漫性大B细胞淋巴瘤分类系统,将正常B细胞亚群表型与预后联系起来。临床杂志。Oncol.33 1379–1388年。
[13] Eddelbuettel,D.和François,R.(2011年)。Rcpp:无缝的R和C++集成。《美国法律总汇》第40卷第1–18页。
[14] Friedman,J.、Hastie,T.和Tibshirani,R.(2008)。用图形套索进行稀疏逆协方差估计。生物统计9 432–441·兹比尔1143.62076 ·doi:10.1093/生物统计学/kxm045
[15] Fulmer,T.(2008)。抑制抑制器。科学BX1(38)。DOI:10.1038/scibx.2008.914。
[16] Galili,T.(2015)。dendextend:一个用于可视化、调整和比较层次聚类树的R包。生物信息学31 3718–3720。
[17] Gautier,L.、Cope,L.,Bolstad,B.M.和Irizarry,R.A.(2004)。affy-在探针水平上分析affymetrix基因芯片数据。生物信息学20 307–315。
[18] Horvath,S.(2011)。加权网络分析:在基因组学和系统生物学中的应用。施普林格,柏林。
[19] Hummel,M.、Bentink,S.、Berger,H.、Klapper,W.、Wessendorf,S.,Barth,T.F.、Bernd,H.-W.、Cogliatti,S.B.、Dierlamm,J.、Feller,A.C.等人(2006年)。从转录和基因组分析对Burkitt淋巴瘤的生物学定义。北英格兰。《医学杂志》354 2419–2430。
[20] 国际淋巴瘤研究小组(1997年)。非霍奇金淋巴瘤国际淋巴瘤研究组分类的临床评估。血液89 3909–3918。
[21] Irizarry,R.A.、Hobbs,B.、Collin,F.、Beazer-Barclay,Y.D.、Antonellis,K.J.、Scherf,U.和Speed,T.P.(2003)。高密度寡核苷酸阵列探针水平数据的探索、规范化和总结。生物统计249–264·Zbl 1141.62348号 ·doi:10.1093/biostatistics/4.2.249
[22] Jima,D.D.、Zhang,J.、Jacobs,C.、Richards,K.L.、Dunphy,C.H.、Choi,W.W.W、Au,W.Y.、Srivastava,G.、Czader,M.B.、Rizzieri,D.A.等人(2010年)。对正常和恶性人类B细胞的小RNA转录组进行深度测序,确定数百种新的微RNA。Blood116 e118–e127。
[23] Johnson,W.E.、Li,C.和Rabinovic,A.(2007年)。使用经验贝叶斯方法调整微阵列表达数据中的批量效应。生物统计8 118–127·Zbl 1170.62389号 ·doi:10.1093/biostatistics/kxj037
[24] Lee,J.A.、Dobbin,K.K.和Ahn,J.(2014)。基因表达数据中批量效应的协方差调整。Stat.Med.33 2681–2695。
[25] Lenz,G.、Wright,G.W.、Emre,N.T.、Kohlhammer,H.、Dave,S.S.、Davis,R.E.、Carty,S.、Lam,L.T.,Shaffer,A.、Xiao,W.等人(2008年)。弥漫性大B细胞淋巴瘤的分子亚型由不同的遗传途径引起。程序。国家。阿卡德。科学。美国105 13520–13525。
[26] Mattiussi,V.、Tumminello,M.、Iori,G.和Mantegna,R.N.(2011年)。通过Kullback–Leibler散度比较相关矩阵估值器。预印,DOI:10.2139/ssrn.1966714。
[27] Meinshausen,N.和Bühlmann,P.(2006)。高维图和用套索选择变量。《统计年鉴》34 1436–1462·Zbl 1113.62082号 ·doi:10.1214/0090536000000281
[28] Monti,S.、Chapuy,B.、Takeyama,K.、Rodig,S.J.、Hao,Y.、Yeda,K.T.、Inguilizian,H.、Mermel,C.、Currie,T.、Dogan,A.等人(2012年)。综合分析揭示了弥漫性大B细胞淋巴瘤中p53和细胞周期失调的结果相关和可靶向模式。癌细胞22 359–372。
[29] Phipson,B.和Smyth,G.K.(2010年)。排列\(p\)-值不应为零:当随机绘制排列时,计算精确的\(p\)-值。统计应用程序。遗传学。分子生物学9第39、14条·Zbl 1304.92098号 ·数字对象标识代码:10.2202/1544-6115.1585
[30] R核心团队(2012年)。R: 统计计算语言和环境。奥地利维也纳R统计计算基金会,ISBN 3-900051-07-0。
[31] Reimand,J.、Arak,T.、Adler,P.、Kolberg,L.、Reisberg,S.、Peterson,H.和Vilo,J.(2016)。g: Profiler——用于基因列表功能解释的web服务器(2016年更新)。核酸研究44 W83–W89。
[32] Salaverria,I.、Philipp,C.、Oschlies,I.,Kohler,C.W.、Kreuz,M.、Szczepanowski,M.,Burkhardt,B.、Trautmann,H.、Gesk,S.、Andrusewicz,M.等人(2011年)。激活IRF4的易位基因识别了一种主要影响儿童和年轻人的生发中心衍生B细胞淋巴瘤亚型。血液118 139–147。
[33] Shrout,P.E.和Fleiss,J.L.(1979年)。类内相关性:用于评估评分员的可靠性。精神病。牛86 420–428。
[34] Sokal,R.R.和Rohlf,F.J.(1962年)。用客观方法比较树状图。出租车11 33–40。
[35] Stroncek,D.F.、Butterfield,L.H.、Cannarile,M.A.、Dhodapkar,M.V.、Greten,T.F.、Grivel,J.C.、Kaufman,D.R.、Kong,H.H.,Korangy,F.、Lee,P.、Marnicola,F.,Rutella,S.、Siebert,J.C、Trinchieri,G.和Seliger,B.(2017)。免疫调节和调节的系统评估。免疫学杂志。癌症5 21。
[36] van Wieringen,W.N.和Peeters,C.F.W.(2016)。高维数据中逆协方差矩阵的岭估计。计算。统计师。数据分析103 284–303·兹比尔1466.62204 ·doi:10.1016/j.csda.2016.05.012
[37] Visco,C.、Li,Y.、Xu-Monette,Z.Y.、Miranda,R.N.、Green,T.M.、Tzankov,A.、Wen,W.、Liu,W.,Kahl,B.、d'Amore,E.等人(2012年)。全面的基因表达谱分析和免疫组织化学研究支持免疫表型算法在弥漫性大B细胞淋巴瘤分子亚型分类中的应用:一份来自国际DLBCL Rituximab-CHOP联盟项目研究的报告。白血病26 2103–2113。
[38] Williams,P.M.、Li,R.、Johnson,N.A.、Wright,G.、Heath,J.-D.和Gascoyne,R.D.(2010年)。一种新的扩增FFPET-衍生RNA的方法能够用微阵列准确地进行疾病分类。摩尔诊断杂志12 680–686。
[39] 谢毅(2013)。带有R和Kniter的动态文档。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。