×

用于检测基因表达杂种优势的RNA-seq数据的经验Bayes分析。 (英语) Zbl 1329.62447号

摘要:杂种优势的一种重要类型,即杂种优势,是指杂种后代相对于其近交亲本的表型增强。尽管杂交优势在农业中得到了广泛的应用,但其分子基础仍基本未知。为了在分子水平上理解表型杂种优势,研究人员正在使用RNA测序(RNA-seq)技术测量亲本自交系及其杂交后代中数千个基因的转录物丰度水平。由此得到的数据使研究人员能够寻找基因表达杂种优势作为农业重要性状杂种优势潜在分子机制的证据。基因表达杂种优势测试中最感兴趣的零假设是复合零假设,难以用RNA-seq分析的标准统计方法进行测试。为了解决这些缺点,我们开发了一个分层负二项模型,并使用易于计算的经验贝叶斯方法进行推理。我们通过一个基于玉米实验的模拟研究来证明替代方法的改进,然后用我们新提出的方法分析玉米实验。

MSC公司:

第62页第12页 统计在环境和相关主题中的应用
62C12号机组 经验决策程序;经验贝叶斯程序
2015年1月62日 贝叶斯推断
65C60个 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 分析,R.(2014)。doMC:多核包的Foreach并行适配器。R软件包版本1.3.3。
[2] Bell,G.D.、Kane,N.C.、Rieseberg,L.H.和Adams,K.L.(2013)。RNA-seq分析等位基因特异性表达、杂交效应和杂种与自然群体亲本的调控差异。基因组生物学与进化51309-1323·doi:10.1093/gbe/evt072
[3] 陈振杰(2013)。对杂种优势分子基础的基因组和表观遗传学见解。《自然评论》遗传学14,471-482·doi:10.1038/nrg3503文件
[4] 达尔文,C.(1876)。蔬菜王国中杂交和自交受精的影响。约翰·默里(John Murray)。
[5] Datta,S.和Nettleton,D.(2014)。下一代测序数据的统计分析。斯普林格·Zbl 1296.92001号
[6] Gelman,A.和Rubin,D.B.(1992年)。使用多序列的迭代模拟推断。统计科学7,457-472·Zbl 1386.65060号 ·doi:10.1214/ss/117701136
[7] Gentleman,R.C.,Carey,V.J.,Bates,D.M.等人(2004年)。生物导体:用于计算生物学和生物信息学的开放式软件开发。基因组生物学5,R80·doi:10.1186/gb-2004-5-10-r80
[8] Hallauer,A.和Miranda,F.(1981年)。玉米育种中的数量遗传学。爱荷华州艾姆斯市爱荷华圣大学出版社。
[9] Hallauer,A.R.、Carena,M.J.和Miranda Filho,J.(2010年)。玉米育种中的数量遗传学,第6卷。斯普林格·Zbl 1303.62077号
[10] Hans,C.(2009年)。贝叶斯套索回归。生物特征96835-845·Zbl 1179.62038号 ·doi:10.1093/biomet/asp047
[11] Hardcastle,T.J.(2012)。baySeq:计数数据中差异表达模式的经验贝叶斯分析。R软件包版本2.0.50。
[12] Hardcastle,T.J.和Kelly,K.A.(2010年)。baySeq:识别序列计数数据中差异表达的经验贝叶斯方法。BMC生物信息11422·doi:10.1186/1471-2105-11-422
[13] Ji,T.、Liu,P.和Nettleton,D.(2014)。基因表达杂种优势的估计和测试。农业、生物和环境统计杂志19,319-337·Zbl 1303.62077号 ·文件编号:10.1007/s13253-014-0173-2
[14] Neal,R.(2011)。使用哈密顿动力学的MCMC。在《马尔可夫链蒙特卡罗手册》第2卷第113-162页。查普曼和霍尔/CRC·Zbl 1229.65018号
[15] Park,T.和Casella,G.(2008)。贝叶斯套索。《美国统计协会杂志》103,681-686·Zbl 1330.62292号 ·doi:10.1198/016214500000037
[16] Paschold,A.、Jia,Y.、Marcon,C.、Lund,S.、Larson,N.B.、Yeh,C.-T.、Ossowski,S.,Lanz,C.、Nettleton,D.、Schnable,P.S.等人(2012年)。互补导致玉米(Zea mays L.)杂种相对于其近交亲本的转录组复杂性。基因组研究22,2445-2454·doi:10.101克/克138461.112
[17] R核心团队(2014)。R: 统计计算语言和环境。R统计计算基金会,奥地利维也纳。
[18] Robinson,M.和Oshlack,A.(2010年)。RNA-seq数据差异表达分析的标度归一化方法。基因组生物学11,R25·doi:10.1186/gb-2010-11-3-r25
[19] Robinson,M.D.、McCarthy,D.J.和Smyth,G.K.(2010年)。edgeR:用于数字基因表达数据差异表达分析的Bioconder软件包。生物信息学26139-40·doi:10.1093/bioinformatics/btp616
[20] Robinson,M.D.和Smyth,G.K.(2007年)。用于评估标记丰度差异的适度统计测试。生物信息学23,-6。
[21] Rue,H.、Martino,S.和Chopin,N.(2009年)。利用集成嵌套拉普拉斯近似对潜在高斯模型进行近似贝叶斯推断。英国皇家统计学会杂志:B辑(统计方法)71,319-392·Zbl 1248.62156号 ·doi:10.1111/j.1467-9868.2008.00700.x
[22] Springer,N.和Stupar,R.(2007年)。玉米中的等位基因变异和杂种优势:如何使两半大于一个整体?基因组研究17,264-275·doi:10.101克/克5347007
[23] Stan开发团队(2014a)。RStan:Stan的R接口,版本2.5.0。
[24] Stan开发团队(2014b)。Stan:一个用于概率和抽样的C++库,版本2.5.0。
[25] Swanson-Wagner,R.、Jia,Y.、DeCook,R.,Borsuk,L.、Nettleton,D.和Schnable,P.(2006年)。在玉米f1杂交种及其自交亲本的基因表达的全球比较中,观察到了所有可能的基因作用模式。《国家科学院院刊》103,6805-6810·doi:10.1073/pnas.0510430103
[26] van de Wiel,M.A.、Neerincx,M.、Buffart,T.E.、Sie,D.和Verheul,H.M.(2014)。ShrinkBayes:一个通用的R包,用于分析复杂研究设计中基于计数的测序数据。BMC生物信息学15,116·doi:10.1186/1471-2105-15-116
[27] Wei,X.和Wang,X.(2013)。识别玉米中等位基因特异表达和表观遗传修饰的计算工作流程。基因组学、蛋白质组学和生物信息学11,247-252·doi:10.1016/j.gpb.2013.05.006
[28] Wickham,H.(2011)。拆分应用合并策略进行数据分析。统计软件杂志40,1-29。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。