跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

网站是安全的。
这个https://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2013年1月1日;29(1):15-21.
doi:10.1093/bioinformatics/bts635。 Epub 2012年10月25日。

STAR:超快速通用RNA-seq对准器

附属公司

STAR:超快速通用RNA-seq对准器

亚历山大·多宾等。 生物信息学. .

摘要

动机:高通量RNA-seq数据的精确比对是一个具有挑战性但尚未解决的问题,因为测序技术的转录结构不连续,读取长度相对较短,吞吐量不断增加。目前可用的RNA-seq比对仪存在定位错误率高、定位速度慢、读取长度限制和定位偏差等问题。

结果:为了对齐我们的大型(>800亿读取数)ENCODE转录组RNA-seq数据集,我们基于之前未描述的RNA-seqalignment算法开发了拼接转录组对齐到参考(STAR)软件,该算法使用未压缩后缀数组中的顺序最大可映射种子搜索,然后执行种子聚类和缝合程序。STAR在绘图速度上优于其他比对器50倍以上,与普通12核服务器上每小时5.5亿个2×76 bp配对读取的人类基因组一致,同时提高了比对灵敏度和精确度。除了对规范连接进行无偏见的从头检测外,STAR还可以发现非规范剪接和嵌合(融合)转录物,并能够绘制全长RNA序列。使用Roche 454逆转录聚合酶链反应扩增子测序,我们实验验证了1960种新的基因间剪接连接,成功率为80-90%,证实了STAR定位策略的高精度。

可用性和实施:STAR是作为一个独立的C++代码实现的。STAR是根据GPLv3许可发布的免费开源软件,可从以下网址下载http://code.google.com/p/rna-star/。

PubMed免责声明

数字

图1。
图1。
STAR算法中用于检测的最大可映射前缀搜索的示意图()拼接接头(b)不匹配和(c(c))尾部
图2。
图2。
STAR、TopHat2、GSNAP、RUM和MapSplice模拟RNA-seq数据的真阳性率与假阳性率(ROC曲线)
图3。
图3。
实验RNA-seq数据中拼接接头检测的各种精度指标。制图员的颜色编码方案在所有绘图中都是相同的。X(X)-绘图中的轴(), (b), (d日)和(e(电子))是指检测阈值,定义为在每个连接处映射的读取数,即具有X(X)-的值N个表示至少由N个读取给定对齐器映射的内容。(a) 检测到的接头总数,带注释(实线)和未带注释(虚线);(b) 注释的检测到的连接的百分比;(c(c))伪ROC曲线:检测到的所有注释连接的百分比与未注释的检测连接的百分比;(d) 由至少两个映射器检测到的未标记连接数(实线)和仅由一个映射器独家检测到的无标记连接数;(e) 仅由一个映射器和((f))伪ROC曲线:至少由两个映射器检测到的未标记连接的百分比与仅由一个映射器唯一检测到的已检测未标记连接百分比

类似文章

  • 基于学习散列方法,将RNA-seq读取有效映射到转录体。
    于X、刘X。 Yu X等人。 计算机生物医学。2020年1月;116:103539. doi:10.1016/j.compbiomed.2019.103539。Epub 2019年11月13日。 《计算生物医学》,2020年。 PMID:31765913 审查。
  • 利用STAR优化RNA-Seq映射。
    Dobin A,Gingeras TR公司。 Dobin A等人。 方法分子生物学。2016;1415:245-62. doi:10.1007/978-1-4939-3572-713。 方法分子生物学。2016 PMID:27115637
  • 用STAR映射RNA-seq读数。
    Dobin A,Gingeras TR公司。 Dobin A等人。 当前协议生物信息学。2015年9月3日;51:11.14.1-11.14.19. doi:10.1002/0471250953.bi1114s51。 当前协议生物信息学。2015 PMID:26334920 免费PMC文章。 审查。
  • RNA-Seq比对算法与RNA-Seq-统一映射器(RUM)的比较分析。
    Grant GR、Farkas MH、Pizarro AD、Lahens NF、Schug J、Brunk BP、Stoeckert CJ、Hogenesch JB、Pierce EA。 Grant GR等人。 生物信息学。2011年9月15日;27(18):2518-28. doi:10.1093/bioinformatics/btr427。Epub 2011年7月19日。 生物信息学。2011 PMID:21775302 免费PMC文章。
  • Supersplat——拼接RNA-seq比对。
    Bryant DW Jr、Shen R、Priest HD、Wong WK、Mockler TC。 Bryant DW Jr等人。 生物信息学。2010年6月15日;26(12):1500-5. doi:10.1093/bioinformatics/btq206。Epub 2010年4月21日。 生物信息学。2010 PMID:20410051 免费PMC文章。

引用人

  • IPEC-J2细胞生长过程中的生长行为和mRNA表达谱。
    Binder ARD、Mussack V、Kirchner B、Pfaffl MW。 粘合剂ARD等。 BMC Res注释。2024年6月5日;17(1):154. doi:10.1186/s13104-024-06812-w。 BMC Res注释。2024 PMID:38840260 免费PMC文章。
  • 紫绀型先天性心脏病婴儿代谢适应的性别差异。
    芬德利TO、巴利AC、赵KS、赵Z、石C、马哈詹G、科诺AF、萨拉查J、麦卡洛L。 芬德利·TO等人。 《儿科研究》2024年6月5日。doi:10.1038/s41390-024-03291-4。打印前在线。 儿科研究2024。 PMID:38839995
  • mRNA编码的Cas13可用于治疗小鼠的登革热感染。
    Basu M、Zula C、Auroni TT、Vanover D、Chaves LCS、Sadhwani H、Pathak H、Basu R、Beyersdorf JP、Amuda OO、Elsharkawy A、Mosur V、Arthur RA、Claussen H、Sasser LE、Wroe JA、Peck HE、Kumar M、Brinton MA、Santangelo PJ。 Basu M等人。 自然微生物。2024年6月5日。doi:10.1038/s41564-024-01726-6。打印前在线。 自然微生物。2024 PMID:38839984
  • 巨细胞病毒依赖性的高分辨率病毒编码筛查。
    Finkel Y、Nachshon A、Aharon E、Arazi T、Simonovsky E、DobešováM、Saud Z、Gluck A、Fisher T、Stanton RJ、Schwartz M、Stern-Ginosar N。 Finkel Y等人。 自然。2024年6月;630(8017):712-719. doi:10.1038/s41586-024-07503-z.Epub 2024六月5。 自然。2024 PMID:38839957
  • MYCT1控制人类造血干细胞的环境感应。
    Aguadé-GorgorióJ、Jami Alahmadi Y、Calvanese V、Kardouh M、Fares I、Johnson H、Rezek V、Ma F、Magnusson M、Wang Y、Shin JE、Nance KJ、Goodridge HS、Liebscher S、Schenke Layland K、Crooks GM、Wohlschlegel JA、Mikkola HKA。 Aguadé-GorgorióJ等人。 自然。2024年6月;630(8016):412-420. doi:10.1038/s41586-024-07478-x。电子出版2024年6月5日。 自然。2024 PMID:38839950 免费PMC文章。

工具书类

    1. Au KF等人,通过剪接映射从成对末端RNA-seq数据中检测剪接连接。核酸研究2010;38:4570–4578.-项目管理咨询公司-公共医学
    1. Darling AC等人。Mauve:保守基因组序列与重排的多重比对。基因组研究2004;14:1394–1403.-项目管理咨询公司-公共医学
    1. Darling AE等人,《渐进性损伤:基因获得、丢失和重排的多基因组比对》。公共科学图书馆一号。2010;5:e11147。-项目管理咨询公司-公共医学
    1. De Bona F等人。短序列读取的最佳拼接对齐。生物信息学。2008;24:i174–180。-公共医学
    1. Delcher AL等人,《全基因组比对》。1999年《核酸研究》;27:2369–2376.-项目管理咨询公司-公共医学

出版物类型

关联数据