×

近交系和杂交基因型RNA-seq实验的层次建模和差异表达分析。 (英语) Zbl 1329.62443号

摘要:自交系和杂种基因型的表现在植物育种和遗传学中具有重要意义。RNA高通量测序(RNA-seq)已被证明是研究自交系和杂种对环境胁迫的分子遗传反应的有用工具。常用的实验设计和测序方法导致了复杂的数据结构,需要在数据分析中仔细注意。我们对来自裂区设计的RNA-seq数据进行了分析,其中包括对两个自交系基因型和由自交系间杂交形成的两个杂种施加干旱胁迫。我们的广义线性建模策略将随机效应纳入了全槽实验单元,并使用负二项式分布来考虑分裂槽实验单元计数响应的过度分散。基因长度和碱基含量的变化,以及不同实验单元之间测序强度的差异,也被解释。采用经过深思熟虑的参数化和预先规范的分层建模允许跨基因借用信息,以改进对主要关注的分散参数、基因型效应、治疗效应和交互效应的估计。

MSC公司:

62页第12页 统计在环境和相关主题中的应用
62J12型 广义线性模型(逻辑模型)
62C12号机组 经验决策程序;经验贝叶斯程序
2015年1月62日 贝叶斯推断
92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Anders,S.和Huber,W.(2010),“序列计数数据的差异表达分析”,《基因组生物学》,11(10),R106。
[2] Benjamini,Y.和Speed,T.P.(2012),“总结和纠正高通量测序中的GC含量偏差”,核酸研究,P.gks001。
[3] Dillies,M.-A.,Rau,A.,Aubert,J.,Hennequet-Anier,C.,Jeanmougin,M.,Servant,N.,Keime,C.,Marot,G.,Castel,D.,Estelle,J.等人(2013),“Illumina高通量RNA测序数据分析归一化方法的综合评估”,《生物信息学简报》,14(6),671-683。
[4] Hardcastle,T.J.和Kelly,K.A.(2010),“baySeq:识别序列计数数据中差异表达的经验贝叶斯方法”,BMC生物信息学,11(1),422。
[5] Law,C.W.、Chen,Y.、Shi,W.和Smyth,G.K.(2014),“Voom:精确权重解锁RNA-seq读取计数的线性模型分析工具”,《基因组生物学》,15(2),R29。
[6] Lewin,A.、Bochkina,N.和Richardson,S.(2007),“差异基因表达的完全贝叶斯混合模型:模拟和模型检查”,《遗传学和分子生物学的统计应用》,6(1)·兹比尔1276.92090
[7] Li,J.和Tibshirani,R.(2013),“发现一致模式:识别RNA-seq数据差异表达的非参数方法”,《医学研究统计方法》,22(5),519-536。
[8] Lorenz,D.J.、Gill,R.S.、Mitra,R.和Datta,S.(2014),“使用RNA-seq数据检测差异表达基因”,《下一代测序数据的统计分析》,施普林格出版社,第25-49页。
[9] Love,M.I.、Huber,W.和Anders,S.(2014),“利用DESeq2对RNA-seq数据的折叠变化和离散度进行适度估计”,《基因组生物学》,15(12),550。
[10] Lund,S.P.、Nettleton,D.等人(2012年),“不同建模策略对微阵列数据分层模型中基因和基因特异性治疗效果的重要性”,《应用统计学年鉴》,6(3),1118-1133·Zbl 1454.62357号
[11] McCarthy,D.J.、Chen,Y.和Smyth,G.K.(2012),“生物变异方面多因子RNA-Seq实验的差异表达分析”,核酸研究,40(10),4288-4297。
[12] Nettleton,D.(2014),“RNA测序实验的设计”,载于《下一代测序数据的统计分析》,第93-113页·Zbl 1296.92001号
[13] Oshlack,A.、Wakefield,M.J.等人(2009年),“RNA-seq数据中的转录长度偏差混淆了系统生物学”,《生物直接》,4(1),14。
[14] Riebler,A.、Robinson,M.D.和van de Wiel,M.A.(2014),“使用集成嵌套拉普拉斯近似(INLA)分析下一代测序数据”,《下一代序列数据统计分析Springer》,第75-91页。
[15] Robinson,M.D.、McCarthy,D.J.和Smyth,G.K.(2010),“edgeR:数字基因表达数据差异表达分析的生物导体包”,生物信息学,26(1),139-140。
[16] Robinson,M.D.、Oshlack,A.等人(2010年),“RNA-seq数据差异表达分析的尺度归一化方法”,《基因组生物学》,11(3),R25。
[17] Rue,H.、Martino,S.和Chopin,N.(2009),“使用综合嵌套拉普拉斯近似法对潜在高斯模型进行近似贝叶斯推断”,《皇家统计学会杂志:B辑(统计方法)》,71(2),319-392·Zbl 1248.62156号
[18] Smyth,G.K.(2005),“Limma:微阵列数据的线性模型”,《使用R和生物导体Springer的生物信息学和计算生物学解决方案》,第397-420页。
[19] van de Wiel,M.A.、Leday,G.G.、Pardo,L.、Rue,H.、van Der Vaart,A.W.和van Wieringen,W.N.(2013),“通过估计多重收缩先验对RNA测序数据进行贝叶斯分析”,生物统计学,14(1),113-128。
[20] Ventrucci,M.、Scott,E.M.和Cocchi,D.(2011),“标准化死亡率的多重测试:FDR估计的贝叶斯层次模型”,《生物统计学》,12(1),51-67·Zbl 1437.62641号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。