跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https公司

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2011年12月;21(12):2213-23.
doi:10.1101/gr.124321.111。 Epub 2011年9月8日。

RNA-seq的差异表达:深度问题

附属公司

RNA-seq的差异表达:一个深度问题

索尼娅·塔拉桑纳等。 基因组研究. 2011年12月.

摘要

下一代测序(NGS)技术正在革新基因组研究,尤其是其在转录组学(RNA-seq)中的应用越来越多地被用于基因表达谱分析,以取代微阵列。然而,RNA-seq数据的属性尚未完全确定,需要进一步研究来了解这些数据如何响应差异表达分析。在这项工作中,我们开始通过研究这项技术的一个重要参数:测序深度来深入了解RNA-seq数据分析的特点。我们分析了测序深度如何影响转录物的检测及其差异表达的鉴定,从转录物生物型、长度、表达水平和折叠变化等方面进行了研究。我们评估了可用于RNA-seq分析的不同算法,并提出了一种新的方法——NOISeq,它不同于现有方法,因为它是数据自适应和非参数的。我们的结果表明,大多数现有方法都严重依赖差分表达式调用的测序深度,这会导致大量误报,并随着读取次数的增加而增加。相比之下,我们提出的方法根据实际数据对噪声分布进行建模,因此可以更好地适应数据集的大小,并且在控制错误发现率方面更有效。这项工作讨论了RNA-seq在研究低表达范围调控方面的真正潜力、RNA-seque数据中的噪声以及复制问题。

PubMed免责声明

数字

图1。
图1。
饱和度曲线显示了由五个以上的唯一映射读取检测到的基因数量,作为三个数据集中每个实验条件的测序深度的函数(左y-轴)。垂直条表示每百万次额外读取(NDR,对y-轴)。
图2。
图2。
MAQC数据的特征检测和排序深度。(A类)每个转录生物型的检测百分比。灰色条表示基因组百分比;条纹色条是样本相对于基因组检测到的百分比;而实色条是生物型在样本中检测到的特征总数中所占的百分比。垂直线分隔以左边对y-轴刻度。(B类)测序深度增加时,每个转录生物型在总检测中的百分比(大脑样本)。(C类)蛋白质编码、lincRNA和snoRNA的饱和曲线和NDR条(D类)中位转录长度与蛋白质编码、假基因、加工转录物和lincRNA生物型的测序深度有关。考虑到中位转录长度>150核苷酸的基因,计算每个生物型的中位全局长度。
图3。
图3。
NOISeq方法:描述和性能。(A类)NOISeq方法的示意图。M(M)-D类噪声(黑色)、信号(绿色)和差异表达基因(红色)中的分布。两个轴比例都已修剪,以提高可视化效果。(B类)将RT-PCR结果作为金标准,在MAQC数据集上比较差异表达方法的精确重新调用曲线和假发现率。
图4。
图4。
根据每个数据集和方法的测序深度差异表达基因。没有对数据进行基因长度校正。
图5。
图5。
基因长度与折叠变化的关系M(M)MAQC数据集中每种方法的差异表达基因的表达水平和使用的车道数。未对数据进行长度校正。卢比是条件中的读取次数每百万读,即,公式图像.
图6。
图6。
真阳性(TP)和假阳性(FP)数量与测序深度之间的关系。在MAQC数据集上应用不同的统计方法获得TP和FP,并将结果与RT-PCR阳性和阴性基因进行比较。
图7。
图7。
使用RT-PCR数据作为金标准,根据基因长度校正方法的测序深度,在MAQC数据集中进行差异表达。(A类)真正的积极因素。(B类)假阳性。

类似文章

引用人

工具书类

    1. 安德斯S 2010。Htseq:使用python分析高通量测序数据。http://www-huber.embl.de/users/anders/HTSeq/-项目管理委员会-公共医学
    1. Anders S,Huber W,2010年。序列计数数据的差分表达式分析。基因组生物学11:R106 doi:10.1186/gb-2010-11-10-R106-项目管理委员会-公共医学
    1. 安德森J 2005。RNA周转:被跟踪的意外后果。当前生物量15:R635–R638-公共医学
    1. Argout X、Salse J、Aury J、Guiltinan M、Droc G、Gouzy J、Allegre M、Chaparro C、Legavre T、Maximova S等人,2010年。可可树的基因组。《自然遗传学》43:101–108-公共医学
    1. Blencowe BJ、Ahmad S、Lee LJ,2009年。当前一代高通量测序:深化对哺乳动物转录组的认识。基因Dev 23:1379–1386-公共医学

出版物类型