×

转录组时间进程数据的经验Bayes变点模型。 (英语) Zbl 1475.62268号

摘要:时间过程实验通常用于捕捉时间变化。检测是否随时间发生任何变化通常很有趣,我们将其定义为检测问题。如果发生了更改,那么了解更改的时间是有意义的,我们将其定义为标识问题。在应用测试程序检测或识别这些变化时,通常需要将I类错误率控制在标称水平。已经提出了许多分析方法。大多数现有方法旨在解决检测问题或最近的识别问题。在这里,我们建议使用基于经验Bayes变点模型的统一多重测试框架来解决这两个问题。我们的模型提供了一个灵活的框架,可以解释复杂的时间基因表达模式。我们证明了我们的测试过程是有效的,并且在拒绝最大数量的空假设的意义上是渐近最优的,而贝叶斯错误发现率(FDR)可以控制在预定义的标称水平上。仿真研究和对真实转录组时间进程数据的应用表明,我们提出的模型是一种灵活而强大的方法,可以捕获时间进程数据分析中的各种时间模式。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62M10个 统计学中的时间序列、自相关、回归等(GARCH)
62G10型 非参数假设检验
92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abadi,M.,Barham,P.,Chen,J.,Cheng,Z.,Davis,A.,Dean,J.、Devin,M.、Ghemawat,S.、Irving,G.等人(2016年)。TensorFlow:一个用于大规模机器学习的系统。12年内第届USENIX操作系统设计与实现研讨会(OSDI公司16) 265-283. 美国佐治亚州萨凡纳USENIX协会。
[2] Allaire,J.和Tang,Y.(2020)。tensorflow:“tensorflow”的R接口。R软件包版本2.0.0。
[3] Arbeitman,M.N.,Furlong,E.E.,Imam,F.,Johnson,E.,Null,B.H.,Baker,B.S.,Krasnow,M.A.,Scott,M.P.,Davis,R.W.等人(2002年)。果蝇生命周期中的基因表达。科学类297 2270-2275.
[4] Bar-Joseph,Z.、Gitter,A.和Simon,I.(2012年)。利用时间序列基因表达数据研究和建模动态生物过程。Nat.Rev.基因。13 552-564. ·doi:10.1038/nrg3244
[5] Barry,D.和Hartigan,J.A.(1992年)。变更点问题的产品划分模型。安。统计师。20 260-279. ·Zbl 0780.62071号 ·doi:10.1214/aos/1176348521
[6] Barry,D.和Hartigan,J.A.(1993年)。变点问题的贝叶斯分析。J.Amer。统计师。协会。88 309-319. ·Zbl 0775.62065号
[7] Benjamini,Y.和Hochberg,Y.(1995年)。控制错误发现率:一种实用且强大的多重测试方法。J.罗伊。统计师。Soc.序列号。B类57 289-300. ·Zbl 0809.62014号
[8] Calvano,S.E.、Xiao,W.、Richards,D.R.、Felciano,R.M.、Baker,H.V.、Cho,R.J.、Chen,R.O.、Brownstein,B.H.、Cobb,J.P.等人(2005年)。基于网络的人类全身炎症分析。自然437 1032-1037.
[9] Denison,D.G.T.、Holmes,C.C.、Mallick,B.K.和Smith,A.F.M.(2002)。非线性分类和回归的贝叶斯方法.概率统计中的威利级数奇切斯特的威利·Zbl 0994.62019号
[10] Diggle,P.J.、Heagerty,P.J、Liang,K.-Y.和Zeger,S.L.(2002)。纵向数据分析,第2版。牛津统计科学系列25.牛津大学出版社,牛津。
[11] Efron,B.(2010年)。大尺度推断:估计、测试和预测的经验贝叶斯方法.数理统计研究所(智能弹药系统)专题论文1.剑桥大学出版社,剑桥·Zbl 1277.62016年 ·doi:10.1017/CBO9780511761362
[12] Efron,B.、Tibshirani,R.、Storey,J.D.和Tusher,V.(2001)。微阵列实验的经验贝叶斯分析。J.Amer。统计师。协会。96 1151-1160. ·兹比尔1073.62511 ·doi:10.1198/016214501753382129
[13] Gautier,L.、Cope,L.,Bolstad,B.M.和Irizarry,R.A.(2004)。探针级Affymetrix基因芯片数据的aff-分析。生物信息学20 307-315.
[14] Irizarry,R.A.、Hobbs,B.、Collin,F.、Beazer-Barclay,Y.D.、Antonellis,K.J.、Scherf,U.和Speed,T.P.(2003)。高密度寡核苷酸阵列探针水平数据的探索、规范化和总结。生物统计学4 249-264. ·Zbl 1141.62348号 ·doi:10.1093/biostatistics/4.2.249
[15] Kalaitzis,A.A.和Lawrence,N.D.(2011年)。通过高斯过程回归对差异表达基因表达时间进程进行排序的简单方法。BMC生物信息。12 180. ·doi:10.1186/1471-2105-12-180
[16] Kendziorski,C.、Newton,M.、Lan,H.和Gould,M.(2003)。关于使用复制基因表达谱比较多组的参数经验贝叶斯方法。统计医学。22 3899-3914.
[17] Kimeldorf,G.S.和Wahba,G.(1970年)。随机过程的贝叶斯估计与样条平滑之间的对应。安。数学。斯达。41 495-502. ·Zbl 0193.45201号 ·doi:10.1214/aoms/1177697089
[18] Kingma,D.P.和Ba,J.(2014)。亚当:一种随机优化方法。预印本。可在arXiv:1412.6980购买。
[19] Law,C.W.、Chen,Y.、Shi,W.和Smyth,G.K.(2014)。Voom:精确权重解锁RNA-seq读取计数的线性模型分析工具。基因组生物学。15 1.
[20] Lönnstedt,I.、Grant,S.、Begley,G.和Speed,T.(2005)。两种相互作用治疗的微阵列分析:线性模型和随时间变化的表达趋势。
[21] Love,M.I.、Huber,W.和Anders,S.(2014)。使用DESeq2对RNA-seq数据的倍数变化和分散度进行适度估计。基因组生物学。15 550. ·doi:10.1186/s13059-014-0550-8
[22] Murphy,K.P.(2007年)。高斯分布的共轭贝叶斯分析。定义。1 16.
[23] Newton,M.A.、Kendziorski,C.M.、Richmond,C.S.、Blattner,F.R.和Tsui,K.W.(2001)。关于表达比率的差异可变性:改进微阵列数据中关于基因表达变化的统计推断。J.计算。生物。8 37-52·doi:10.1089/106652701300099074
[24] Robinson,M.D.、McCarthy,D.J.和Smyth,G.K.(2010年)。edgeR:用于数字基因表达数据差异表达分析的Bioconder软件包。生物信息学26 139-140.
[25] Smyth,G.K.(2005)。limma:微阵列数据的线性模型。使用R和生物导体的生物信息学和计算生物学解决方案397-420. 纽约州纽约州施普林格。
[26] 孙文伟(2011)。模式识别的多重测试,应用于微阵列时间进程实验。J.Amer。统计师。协会。106 73-88. ·Zbl 1396.62261号 ·doi:10.1198/jasa.2011.ap09587
[27] Tai,Y.C.和Speed,T.P.(2005)。DNA微阵列。第章20:微阵列时间历程数据的统计分析CRC出版社/CRC,纽约。
[28] Tai,Y.C.和Speed,T.P.(2006)。重复微阵列时间进程数据的多元经验贝叶斯统计。安。统计师。34 2387-2412. ·Zbl 1106.62008号 ·doi:10.1214/009053600000759
[29] Tian,T.、Cheng,R.和Wei,Z.(2021a)。补充“转录组时间进程数据的经验贝叶斯变化点模型”https://doi.org/10.1214/20-AOAS1403SUPA网站
[30] Tian,T.,Cheng,R.和Wei,Z.(2021b)。源代码为“转录组时间进程数据的经验贝叶斯变化点模型”https://doi.org/10.1214/20-AOAS1403SUPB网站
[31] Tian,B.、Nowak,D.E.和Brasier,A.R.(2005)。振荡NF-(κB)控制下的TNF-诱导基因表达程序。BMC基因组学6 1.
[32] Wang,Z.、Gerstein,M.和Snyder,M.(2009年)。RNA-Seq:转录组学的革命性工具。Nat.Rev.基因。10 57-63. ·doi:10.1038/nrg2484
[33] Wang,W.,Wei,Z.和Li,H.(2014)。通过下一代RNA测序鉴定3'UTR转换的变化点模型。生物信息学30 2162-2170.
[34] Xie,J.、Cai,T.T.、Maris,J.和Li,H.(2011)。相关数据的最佳错误发现率控制。统计接口4 417-430. ·Zbl 1245.62091号 ·doi:10.4310/SII.2011.v4.n4.a1
[35] X.Xuan和K.Murphy(2007)。多变量时间序列中变化依赖结构的建模。会议记录24第十届国际机器学习会议1055-1062. 纽约ACM。
[36] Yang,J.、Penfold,C.A.、Grant,M.R.和Rattray,M.(2016)。从生物时程数据推断扰动时间。生物信息学32 2956-2964.
[37] Yuan,M.和Kendziorski,C.(2006)。多种生物条件下微阵列时间进程数据的隐马尔可夫模型。J.Amer。统计师。协会。101 1323-1332. ·Zbl 1171.62359号 ·doi:10.1198/0162145005000394
[38] Zhang,J.和Wei,Z.(2016)。通过下一代RNA测序识别\[{3^{prime}}和\[{5^{primer}}选择性剪接的经验Bayes变点模型。生物信息学32 1823-1831.
[39] Zhao,L.P.,Prentice,R.和Breeden,L.(2001)。大型微阵列数据集的统计建模,以识别刺激-反应曲线。程序。国家。阿卡德。科学。美国98 5631-5636. ·Zbl 0990.62093号
[40] Zhao,Z.,Wang,W.和Wei,Z.(2013)。一种用于检测下一代测序数据分析中变异的经验贝叶斯测试程序。附录申请。斯达。7 2229-2248 ·Zbl 1283.62011年 ·doi:10.1214/13-AOAS660
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。