跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

网站是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2010;11(5):R50。
doi:10.1186/gb-2010-11-5-r50。 Epub 2010年5月11日。

RNA-Seq数据中短读速率的非均匀性建模

附属公司

RNA-Seq数据中短读速率的非均匀性建模

李军(Jun Li)等。 基因组生物学. 2010.

摘要

映射后,RNA-Seq数据可以通过一系列读取计数进行汇总,这些读取计数通常被建模为每个转录本上具有恒定速率的泊松变量,这实际上与数据很不匹配。我们建议对不同位置使用可变速率,并提出两个模型来基于局部序列预测这些速率。这些模型解释了50%以上的变异,可以改进对Illumina和Applied Biosystems数据的基因和亚型表达的估计。

PubMed免责声明

数字

图1
图1
基因读取数阿波在Wold数据的不同组织中. ()大脑(b条)肝脏(c(c))骨骼肌。每条垂直线代表从该位置开始的读取计数。灰色线是UTR区域的计数,再加上100 bp。在这里,内含子被删除,外显子连接成一个整体。只显示了一条基因链上的计数;另一条链上的计数在不同组织中显示出相似性。Nt:核苷酸。
图2
图2
不同数据集中泊松线性模型的系数当我们将周围序列视为读取第一个核苷酸之前的40个核苷酸和之后的40个核酸时,八个子数据集中泊松线性模型的系数。位置-1、0、1分别表示read的第一个核苷酸之前的核苷酸、read的首个核苷酸和read的第二个核苷酸。核苷酸的颜色编码:红色,T;绿色,A;蓝色,C;黑色,G。核苷酸T(红色)的系数是基本水平,所以它们总是零。()沃尔德数据中的系数。子数据集的形状编码:矩形,大脑;三角形,肝脏;圆形,骨骼肌。(b条)伯格数据中的系数。子数据集的形状编码:矩形,组1;三角形,第2组;圆,第3组。(c(c))Grimmond数据中的系数。子数据集的形状编码:矩形,EB;下面是如何读取这些系数的示例。在沃尔德大脑数据中,读取的第一个核苷酸((a)中位置0处的蓝色矩形)中的C系数为0.82。这意味着如果核苷酸T被C取代,那么测序偏好将增加到e(电子)0.82=2.27倍。Nt:核苷酸。
图3
图3
配件数量阿波基因黑色垂直线表示沿阿波基因(UTR和另外100个核苷酸被截断)。()沃尔德大脑数据中的读取次数(真值)。这与图1a的中心部分(黑色垂直线)相同。(b条)使用泊松线性模型的拟合读数计数。我们使用前100个基因中的其他99个基因来训练线性模型,然后用它来预测阿波。此预测具有(交叉验证)R(右)2= 0.54. (c(c))使用MART的拟合读数计数。我们使用前100个基因中的其他99个基因来训练MART,然后用它来预测阿波。此预测具有(交叉验证)R(右)2= 0.69.
图4
图4
的箱线图R(右)2世界大脑数据中的独特基因根据RPKMs,我们将至少有一个读码的基因分为六组:<1、1-5、5-15、15-30、30-100和>100;每组分别包含4205、3320、2807、1330、1094和383个基因。请注意,在这些数据中,1 RPKM代表平均每核苷酸0.034读,RPKM>30的基因被认为是相对丰富的,RPKM<1的基因即使用于转录检测也不可靠[7]。
图5
图5
RefSeq基因的四种亚型Clta公司在鼠标中。此图是使用CisGenome浏览器生成的[36]。顶部显示了小鼠4号染色体中的碱基位置和外显子的灰色块。底部显示四种亚型,外显子放大。第一种亚型的外显子1的尾部比其他三种亚型少6 bp。第二个亚型有7个外显子,而第三个亚型同时缺失了外显子5(54 bp)和外显子6(36 bp),第四个亚型缺失了外隐子6。

类似文章

引用人

  • RNA测序中逆转录反应的人为因素和偏差。
    Verwill J、Mestdagh P、Vandesompele J。 Verwill J等人。 RNA。2023年7月;29(7):889-897。doi:10.1261/rna.079623.123。Epub 2023年3月29日。 RNA。2023 PMID:36990512 免费PMC文章。 审查。
  • 纳米孔显微镜通过结构颜色识别RNA亚型。
    BoškovićF,Keyser UF。 BoškovićF等人。 国家化学。2022年11月;14(11):1258-1264. doi:10.1038/s41557-022-01037-5。Epub 2022年9月19日。 国家化学。2022 PMID:36123450
  • Polee:使用近似似然进行RNA-Seq分析。
    Jones DC,Ruzzo WL公司。 Jones DC等人。 NAR Genom Bioninform公司。2021年5月25日;3(2):lqab046。doi:10.1093/nargab/lqab046。eCollection 2021年6月。 NAR Genom Bioninform公司。2021 PMID:34056596 免费PMC文章。
  • 多次冻融循环导致富含聚(a)的RNA序列的一致性丧失。
    Kellman BP、Baghdasarian HM、Pramparo T、Shamie I、Gazestani V、Bezzati A、Li S、Nalabolu S、Murray S、Lopez L、Pierce K、Courchesne E、Lewis NE。 Kellman BP等人。 BMC基因组学。2021年1月21日;22(1):69. doi:10.1186/s12864-021-07381-z。 BMC基因组学。2021 PMID:33478392 免费PMC文章。
  • 目的:注释辅助的高精度异构体发现。
    李伟伟,李斯,童X,邓L,施H,李JJ。 李伟伟等。 基因组研究2019年12月;29(12):2056-2072. doi:10.1101/gr.251108.119。Epub 2019年11月6日。 2019年基因组研究。 PMID:31694868 免费PMC文章。

工具书类

    1. Okoniewski MJ,Miller CJ。短寡核苷酸微阵列中探针之间的杂交相互作用导致虚假相关性。BMC生物信息学。2006年;7:276. doi:10.1186/1471-2105-7-276。-内政部-项目管理咨询公司-公共医学
    1. Royce TE、Rozowsky JS、Gerstein MB。走向通用微阵列:通过最近邻探针序列鉴定预测基因表达。核酸研究2007;35:e99。doi:10.1093/nar/gkm549。-内政部-项目管理咨询公司-公共医学
    1. Wang Z,Gerstein M,Snyder M.RNA-Seq:转录组学的革命性工具。自然资源部Genet。2009;10:57–63. doi:10.1038/nrg2484。-内政部-项目管理咨询公司-公共医学
    1. Holt RA,Jones SJ。流式细胞测序的新范式。基因组研究2008;18:839–846. doi:10.1101/gr.073262.107。-内政部-公共医学
    1. Nagalakshmi U,Wang Z,Waern K,Shou C,Raha D,Gerstein M,Snyder M。通过RNA测序确定的酵母基因组转录图谱。科学。2008;320:1344–1349. doi:10.1126/science.1158441。-内政部-项目管理咨询公司-公共医学

出版物类型

LinkOut-更多资源