×

EB二聚体:检测联合差异表达和甲基化并对样本进行分类的经验贝叶斯方法。 (英文) Zbl 1445.92115号

摘要:DNA甲基化和基因表达是相互依赖的,两者都与癌症的发展和进展有关,发现了许多单独的生物标记物。对这两种数据类型的联合分析可能会产生单独分析无法发现的生物学见解。为了最佳地利用联合数据来识别受干扰的基因并对临床癌症样本进行分类,准确建模这两种数据类型之间的相互作用非常重要。这里,我们介绍EB二聚体用于联合鉴定差异表达和甲基化,并对样本进行分类。通过开发以下内容,将当前差异表达方法中广泛用于经验贝叶斯先验的调节t检验推广到多元环境中:(1)具有不等方差的均值相等的调节Welch t检验;(2) 方差相等的调节F检验;(3)方差相等的均值相等的多元检验。这导致参数模型具有参数的先验分布,从而允许快速评估和稳健分析小数据集。EB二聚体模拟数据以及TCGA的大型乳腺癌(BRCA)队列都证明了这一点。我们表明,使用经验贝叶斯先验和稳健测试对小数据集尤其有效。

MSC公司:

92C40型 生物化学、分子生物学
92 C50 医疗应用(通用)
62页第10页 统计学在生物学和医学科学中的应用;元分析
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aryee,M.J.、A.E.Jaffe、H.Corrada-Bravo、C.Ladd-Acosta、A.P.Feinberg、K.D.Hansen和R.A.Irizarry(2014):“Minfi:用于分析Infinium DNA甲基化微阵列的灵活而全面的生物导体包”,《生物信息学》,第30期,第1363-1369页。;Aryee,M.J。;杰菲,A.E。;Corrada-Bravo,H。;Ladd-Acosta,C。;范伯格,A.P。;Hansen,K.D。;Irizarry,R.A.,Minfi:用于分析Infinium DNA甲基化微阵列的灵活而全面的生物导体包,生物信息学,301363-1369(2014)
[2] Bailer-Jones,C.和K.Smith(2011):组合概率。数据处理与分析协会(DPAS),GAIA-C8-TN-MPIA-CBJ-053。;Bailer-Jones,C。;Smith,K.,《组合概率》。数据处理与分析协会(DPAS)(2011年)
[3] Bibikova,M.,B.Barnes,C.Tsan,V.Ho,B.Klotzle,J.M.Le,D.Delano,L.Zhang,G.P.Schroth,K.L.Gunderson,J.B.Fan和R.Shen(2011):“具有单个CpG位点分辨率的高密度DNA甲基化阵列”,《基因组学》,98,288-295。;比比科娃,M。;巴恩斯,B。;Tsan,C.等人。;Ho,V。;Klotzle,B。;Le,J.M。;德拉诺,D。;张,L。;施罗思,G.P。;Gunderson,K.L。;Fan,J.B。;Shen,R.,具有单个CpG位点分辨率的高密度DNA甲基化阵列,基因组学,98,288-295(2011)
[4] Breiman,L.、A.Cutler、A.Liaw和M.Wiener(2006):“随机森林:分类和回归的Breiman和Cutler随机森林。”;布雷曼,L。;卡特勒,A。;Liaw,A。;Wiener,M.,《随机森林:分类和回归的Breiman和cutler随机森林》(2006)
[5] Brenet,F.、M.Moh、P.Funk、E.Feierstein、A.J.Viale、N.D.Socci和J.M.Scandura(2011):“第一外显子的DNA甲基化与转录沉默紧密相关”,《公共科学图书馆·综合》,第6期,第14524页。;布伦特,F。;莫,M。;Funk,P。;Feierstein,E。;维亚尔,A.J。;新墨西哥州索契。;Scandura,J.M.,第一外显子的DNA甲基化与转录沉默紧密相关,《公共科学图书馆·综合》,6(2011)
[6] Bullard,J.H.,E.Purdom,K.D.Hansen和S.Dudoit(2010):“mRNA-Seq实验中归一化和差异表达的统计方法评估”,BMC生物信息学,11,94。;Bullard,J.H。;Purdom,E。;Hansen,K.D。;Dudoit,S.,《mRNA-Seq实验中归一化和差异表达统计方法的评估》,BMC生物信息学,11,94(2010)
[7] Dedeuwaerder,S.、M.Defrance、E.Calonne、H.Denis、C.Sotiriou和F.Fuks(2011):“无限甲基化450k技术的评估”,表观基因组学,3771-784。;德德瓦尔德,S。;Defrance,M。;Calonne,E。;丹尼斯,H。;Sotiriou,C。;Fuks,F.,《无限甲基化450k技术评估》,表观基因组学,3771-784(2011)
[8] Demissie,M.、B.Mascialino、S.Calza和Y.Pawitan(2008年):“微阵列数据分析中的不均匀组方差”,生物信息学,24,1168-1174。;德米西,M。;Mascialino,B。;卡尔扎,S。;Pawitan,Y.,微阵列数据分析中的不均匀组方差,生物信息学,241168-1174(2008)
[9] Ding,J.、M.K.McConechy、H.M.Horlings、G.Ha、F.C.Chan、T.Funnell、S.C.Mullaly、J.Reimand、A.Bashasati、G.D.Bader、D.Huntsman、S.Aparicio、A.Condon和S.P.Shah(2015):“影响12种肿瘤类型基因表达的体细胞突变的系统分析”,《国家通讯》。,6, 8554.; 丁,J。;McConechy,M.K。;霍林斯,H.M。;哈,G。;Chan,F.C。;Funnell,T。;南卡罗来纳州穆拉利。;雷曼德,J。;巴沙沙提,A。;巴德,G.D。;亨茨曼,D。;阿帕里西奥,S。;Condon,A。;Shah,S.P.,《影响12种肿瘤基因表达的体细胞突变的系统分析》,Nat.Commun,68554(2015)
[10] Dixon,W.J.和J.W.Tukey(1968):“Winsorized t(修剪/Winsorized 2)分布的近似行为”,Technometrics,1083-98。;Dixon,W.J。;Tukey,J.W.,“Winsorized t分布的近似行为(修剪/winsorization 2)”,《技术计量学》,第1083-98页(1968年)
[11] Du,P.,X.Zhang,C.-C.Huang,N.Jafari,W.A.Kibbe,L.Hou和S.M.Lin(2010):“通过微阵列分析量化甲基化水平的Beta值和M值方法的比较”,BMC生物信息学。,11, 587.; 杜,P。;张,X。;黄,C.-C。;北卡罗来纳州贾法里。;Kibbe,W.A。;Hou,L。;Lin,S.M.,通过微阵列分析量化甲基化水平的β值和M值方法的比较,BMC生物信息学,11587(2010)
[12] Esteller,M.(2008):《癌症的表观遗传学》,《新英格兰》。《医学杂志》,3581148-1159。;Esteller,M.,《癌症的表观遗传学》,N.Engl。《医学杂志》,3581148-1159(2008)
[13] Fisher,R.A.(1932):《研究人员的统计方法》,爱丁堡奥利弗和博伊德出版社。;Fisher,R.A.,《研究人员的统计方法》(1932年)
[14] Gelman,A.(2011):手臂:使用回归和多级/层次模型进行数据分析。http://cran。r项目。org/web/packages/arm。;Gelman,A.,Arm:使用回归和多级/层次模型进行数据分析(2011年)
[15] Grossman,R.L.、A.P.Heath、V.Ferretti、H.E.Varmus、D.R.Lowy、W.A.Kibbe和L.M.Staudt(2016年):“实现癌症基因组数据的共享愿景”,《新英格兰》。《医学杂志》,3751109-1112。;格罗斯曼,R.L。;Heath,A.P。;费雷蒂,V。;Varmus,H.E。;罗伊·D·R。;Kibbe,W.A。;Staudt,L.M.,《走向癌症基因组数据的共同愿景》,N.Engl。《医学杂志》,3751109-1112(2016)
[16] Huber,P.和E.Ronchetti(2009):稳健统计,John Wiley&Sons,Inc.,Hoboken,NJ,USA。;Huber,P。;Ronchetti,E.,稳健统计(2009)·兹比尔1276.62022
[17] Jeong,J.,L.Li,Y.Liu,K.P.Nephew,T.H.M.Huang和C.Shen(2010):“抗雌激素抵抗乳腺癌中基因表达和甲基化特征的经验贝叶斯模型”,BMC Med.Genomics,3,55。;Jeong,J。;李,L。;刘,Y。;侄子,K.P。;黄,T.H.-M。;Shen,C.,抗雌激素抵抗乳腺癌基因表达和甲基化特征的经验贝叶斯模型,BMC医学基因组学,3,55(2010)
[18] Jjingo,D.,A.B.Conley,V.Y.Soojin,V.V.Lunyak和I.K.Jordan(2012):“关于人类基因体DNA甲基化的存在和作用”,《肿瘤靶点》,3462-474。;Jjingo,D。;康利,A.B。;Soojin,V.Y。;伦亚克,V.V。;Jordan,I.K.,《关于人类基因体DNA甲基化的存在和作用》,肿瘤靶点,3462-474(2012)
[19] Jones,P.A.(2012):“DNA甲基化的功能:岛屿、起始位点、基因体及其他”,《自然评论遗传学》。,13, 484.; Jones,P.A.,《DNA甲基化的功能:岛屿、起始位点、基因体及其以外》,《自然遗传学评论》。,13, 484 (2012)
[20] Jones,P.A.和S.B.Baylin(2007):“癌症的表观基因组学”,《细胞》,128,683-692。;Jones,P.A。;Baylin,S.B.,《癌症的表观基因组学》,《细胞》,128,683-692(2007)
[21] Karatzoglou,A.、A.Smola和K.Hornik(2013):“Kernlab:基于内核的机器学习实验室Eumetopias ju-batus)分布及其环境”,J.Theor。生物学,1-10。;卡拉佐格鲁,A。;Smola,A。;Hornik,K.,Kernlab:基于内核的机器学习实验室(Eumetopias ju-batus)分布及其环境,J.Theor。生物,1-10(2013)
[22] Kass,S.U.,N.Landsberger和A.P.Wolffe(1997):“DNA甲基化指导转录起始的时间依赖性抑制”,Curr。生物学,7,157-165。;Kass,美国。;兰斯伯格,N。;Wolffe,A.P.,DNA甲基化指导转录起始的时间依赖性抑制,Curr。《生物学》,第7期,第157-165页(1997年)
[23] Kristensen,V.N.,O.C.Lingjrde,H.G.Russnes,H.K.M.Vollan,A.Frigessi和A.-L.Börresen-Dale(2014):“癌症综合基因组分析的原理和方法”,《国家癌症评论》,第14期,第299-313页。;Kristensen,V.N。;俄亥俄州林吉德。;Russnes,H.G。;Vollan,香港特别行政区。;弗里格西,A。;Börresen-Dale,A.-L.,《癌症综合基因组分析的原理和方法》,《国家癌症杂志》,第14期,第299-313页(2014年)
[24] Kuhn,M.(2015):“插入符号:分类和回归训练,天体物理学源代码库”。;Kuhn,M.,Caret:分类和回归训练,天体物理学源代码库(2015)
[25] Levenson,V.V.(2010):“DNA甲基化作为一种通用生物标记物”,专家。修订摩尔诊断。,10, 481-488.; Levenson,V.V.,DNA甲基化作为通用生物标记物,专家。修订摩尔诊断。,10,481-488(2010年)
[26] List,M.,A.-C.Hauschild,Q.Tan,T.A.Kruse,J.Baumbach和R.Batra(2014):通过结合基因表达和DNA甲基化数据对乳腺癌亚型进行分类,“J.Integr.Bioninform.,11,1-14.<pub-id pub-id type=“doi”>10.1515/jib-2014-236;<element-citation publication-type=“journal”publication-format=“print”>列表,M.Hauschild,A.C.Tan,Q.Kruse,T.A.Baumbach,J.Batra,R.2014通过结合基因表达和DNA甲基化数据对乳腺癌亚型进行分类J。集成。生物信息11114
[27] Love,M.I.、W.Huber和S.Anders(2014):“利用DESeq2对RNA-seq数据的折叠变化和离散度进行适度估计”,《基因组生物学》。,15550页。;爱,M.I。;Huber,W。;Anders,S.,利用DESeq2对RNA-seq数据的倍数变化和离散度进行适度估计,基因组生物学。,15, 550 (2014)
[28] Ma,K.,B.Cao和M.Guo(2016):“人类食管鳞癌DNA甲基化的检测、预后和预测价值”,临床。表观遗传学,8,43。;马凯(Ma,K.)。;曹,B。;Guo,M.,人类食管鳞癌DNA甲基化的检测、预后和预测价值,临床遗传学,8,43(2016)
[29] McCarthy,D.J.,Y.Chen和G.K.Smyth(2012):“生物变异方面多因子RNA-Seq实验的差异表达分析”,《核酸研究》,40,4288-4297。;麦卡锡,D.J。;陈,Y。;Smyth,G.K.,关于生物变异的多因子RNA-Seq实验的差异表达分析,核酸研究,40,4288-4297(2012)
[30] Mendizabal,I.、J.Zeng、T.E.Keller和S.V.Yi(2017):“人体低甲基化人类基因具有广泛的基因内转录活性,容易发生癌症相关的失调,”核酸研究,45,4390-4400。;蒙迪萨巴尔,I。;曾杰。;Keller,T.E。;Yi,S.V.,人体低甲基化人类基因具有广泛的基因内转录活性,容易发生癌症相关的失调,核酸研究,45,4390-4400(2017)
[31] Meyer,D.、E.Dimitriadou、K.Hornik、A.Weingessel和F.Leich(2016):e1071:统计部门的杂项功能,概率理论小组(原名:e1071),图温,2015,R包版本,第1-6页。;梅耶,D。;Dimitriadou,E。;霍尼克,K。;Weingessel,A。;Leisch,F.,e1071:概率论小组统计系杂项功能(原名:e1071),图温,2015,R包版本,1-6(2016)
[32] Morris,T.J.,L.M.Butcher,A.Feber,A.E.Teschendorff,A.R.Chakravarthy,T.K.Wojdacz和S.Beck(2013):“ChAMP:450k芯片分析甲基化管道”,生物信息学,30428-430。;莫里斯·T·J。;Butcher,L.M。;Feber,A。;Teschendorff,A.E。;查克拉瓦尔蒂,A.R。;Wojdacz,T.K。;Beck,S.,ChAMP:450k芯片分析甲基化管道,生物信息学,30428-430(2013)
[33] R核心团队(2017):R:统计计算语言和环境,R统计计算基金会,奥地利维也纳。;R: 统计计算语言和环境(2017)
[34] Ritchie,M.E.,B.Phipson,D.Wu,Y.Hu,C.W.Law,W.Shi和G.K.Smyth(2015):“limma为RNA测序和微阵列研究提供差异表达分析”,《核酸研究》,43,e47。;里奇,M.E。;Phipson,B。;Wu,D。;胡,Y。;劳,C.W。;Shi,W。;Smyth,G.K.,limma为RNA测序和微阵列研究提供差异表达分析,核酸研究,43,e47(2015)
[35] Scott,W.D.(2008):《多元密度估计:理论、实践和可视化》,John Wiley&Sons,Inc.,美国新泽西州霍博肯。;Scott,W.D.,《多变量密度估计:理论、实践和可视化》(2008)·Zbl 0850.62006号
[36] Smyth,Gordon K.(2004):“微阵列实验中评估差异表达的线性模型和经验贝叶斯方法”,《统计应用》。遗传学。分子生物学。,3, 1-25.; Smyth,Gordon K.,微阵列实验中评估差异表达的线性模型和经验贝叶斯方法,遗传学和分子生物学中的统计应用,3,1,1-25(2004)·Zbl 1038.62110号
[37] Smith,Z.D和A.Meissner(2013):“DNA甲基化:在哺乳动物发育中的作用”,《国家遗传学评论》。,14, 204-220.; Z.D.史密斯。;Meissner,A.,《DNA甲基化:哺乳动物发育中的作用》,《自然评论遗传学》。,14, 204-220 (2013)
[38] Smith,A.D.,D.Roda和T.A.Yap(2014):“肿瘤学中现代生物标志物和药物开发的策略”,血液学杂志。Oncol.公司。,7, 70.; A.D.史密斯。;罗达,D。;Yap,T.A.,《现代生物标记物和肿瘤药物开发战略》,J.Hematol。Oncol.公司。,7, 70 (2014)
[39] Strand,S.H.、T.F.Orntoft和K.D.Sorensen(2014):“前列腺癌的预后DNA甲基化标记物”,《国际分子科学杂志》。,15, 16544-16576.; 钢绞线,S.H。;Orntoft,T.F。;Sorensen,K.D.,前列腺癌的预后DNA甲基化标记物,国际分子科学杂志。,15, 16544-16576 (2014)
[40] Świtnicki,M.P.,M.Juul,T.Madsen,K.D.Sörensen和J.S.Pedersen(2016):“PINCAGE:扰动基因识别和样本分类的癌症基因组数据的概率整合”,生物信息学,32,1353-1365。;Ś威特尼基,M.P。;Juul,M。;Madsen,T。;瑟伦森,K.D。;Pedersen,J.S.,PINCAGE:癌症基因组数据的概率整合,用于扰动基因识别和样本分类,生物信息学,321353-1365(2016)
[41] Weinstein,J.N.,E.A.Collisson,G.B.Mills,K.R.M.Shaw,B.A.Ozenberger,K.Ellrott,I.Shmulevich,C.Sander和J.M.Stuart(2013):“癌症基因组图谱泛癌分析项目”,《自然遗传学》。,45, 1113-1120.; 韦恩斯坦,J.N。;Collisson,E.A。;米尔斯,G.B。;Shaw,K.R.M。;Ozenberger,B.A。;Ellrott,K。;施穆列维奇,I。;Sander,C.公司。;Stuart,J.M.,《癌症基因组图谱泛癌分析项目》,《自然遗传学》。,45, 1113-1120 (2013)
[42] Wu,D.,J.Gu和M.Q.Zhang(2013):“FastDMA:一个infinium humanmethylation450芯片分析仪”,PloS One,8,e74275。;Wu,D。;顾J。;Zhang,M.Q.,《FastDMA:an infinium humanmethylation450芯片分析仪》,《公共科学图书馆·综合》,第8期(2013年)
[43] Yang,X.,H.Han,D.D.De Carvalho,F.D.Lay,P.A.Jones和G.Liang(2014):“基因体甲基化可以改变基因表达,是癌症的治疗靶点”,《癌症细胞》,26,577-590。;杨,X。;Han,H。;德卡瓦略医学博士。;铺设,F.D。;Jones,P.A。;Liang,G.,《基因体甲基化可以改变基因表达,是癌症的治疗靶点》,《癌症细胞》,26,577-590(2014)
[44] Zhong,D.和H.Cen(2017):“肝细胞癌患者异常启动子甲基化特征及其与生存的关系”,OncoTargets Ther。,102501。;钟,D。;Cen,H.,肝细胞癌患者异常启动子甲基化特征及其与生存的关系,OncoTargets Ther。,10, 2501 (2017)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。