STAR公司 swMATH ID: 2515 软件作者: Alexander Dobin、Carrie A.Davis、Felix Schlesinger、Jorg Drenkow、Chris Zaleski、Sonali Jha、Philippe Batut、Mark Chaisson、Thomas R.Gingeras 描述: STAR:超快通用RNA-seq对准器。动机:高通量RNA-seq数据的精确比对是一个具有挑战性但尚未解决的问题,因为转录本结构不连续,读取长度相对较短,测序技术的吞吐量不断增加。目前可用的RNA-seq比对仪存在定位错误率高、定位速度慢、读取长度限制和定位偏差等问题。结果:为了对齐我们的大型(>80亿读取)ENCODE转录组RNA-seq数据集,我们开发了拼接转录对齐到参考(STAR)基于先前未描述的RNA-seq比对算法的软件,该算法在未压缩后缀数组中使用顺序最大可映射种子搜索,然后执行种子聚类和缝合程序。STAR在绘图速度上优于其他比对器50倍以上,与普通12核服务器上每小时5.5亿个2×76 bp配对读取的人类基因组一致,同时提高了比对灵敏度和精确度。除了对规范连接进行无偏见的从头检测外,STAR还可以发现非规范剪接和嵌合(融合)转录物,并能够绘制全长RNA序列。使用Roche 454逆转录聚合酶链反应扩增子测序,我们实验验证了1960年新的基因间剪接连接,其中80–90 主页: http://bioinformatics.oxfordjournals.org/content/29/1/15.short 相关软件: 对;顶帽;边缘R;生物导体;香皂;快速质量控制;KEGG公司;银河;HT序列;HISAT公司;GATK公司;事实矿工;MapSplice(贴图拼接);RSEM(RSEM);Samtools公司;ggplot2;俾斯麦;鲑鱼;蝴蝶结2;系统管道R 引用于: 15文件 全部的 前5名被50位作者引用 2 阿库尼亚,维森特 2 意大利朱塞佩·弗朗西斯科 2 法国玛丽·萨戈 2 布莱里娜·西奈梅里 1 阿卡林,阿尔图纳 1 卡鲁戈语、奥利维埃罗语 1 肖恩·戴维斯。 1 弗兰克·艾森哈伯 1 沙赫拉·费萨尔 1 冯子丁 1 弗朗西斯科·费尔南德斯(Francisco E.jun Fernandes)。 1 亚历山大·弗朗西斯科。 1 佛兰德·弗兰克 1 傅蓉 1 Adi F.加兹达尔。 1 罗伯托·格罗西 1 萨米尔·哈纳什。 1 斯雷拉姆·坎南 1 利马,莱安德罗·R.F。 1 林,吉米 1 柳州,江南 1 马卫平 1 毛顺福 1 数学,埃维 1 索海尔·穆罕默德 1 埃内斯托·皮卡迪 1 坎南Ramachandran 1 任静立 1 罗密欧·里兹 1 乔纳森·罗宁 1 古斯塔沃·萨科莫托 1 卢卡·佩佩·西亚里亚 1 沈,卡罗尔 1 沈,托尼 1 奥尔·肖姆罗尼 1 孙玉彤 1 阿育木田口 1 陶艺文 1 安德烈亚·索菲亚·特谢拉 1 谢国忠,David N.C。 1 格哈德·图茨(Gerhard E.Tutz)。 1 博拉·乌亚尔 1 王培 1 亚历山大·沃尔夫 1 黄志宏 1 张玲祥 1 张,清 1 钟,华 1 周,清华 1 朱怀平 全部的 前5名8篇连载文章中引用 三 分子生物学方法 1 生物计量学 1 算法 1 国际计算机科学基础杂志 1 非线性科学杂志 1 统计论文 1 遗传学和分子生物学中的统计应用 1 查普曼和霍尔/CRC计算生物学系列 全部的 前5名在9个字段中引用 13 生物学和其他自然科学(92-XX) 6 统计学(62-XX) 4 计算机科学(68至XX) 1 总体主题;集合(00-XX) 1 组合数学(05-XX) 1 常微分方程(34-XX) 1 动力系统和遍历理论(37至XX) 1 数值分析(65-XX) 1 博弈论、经济学、金融学以及其他社会和行为科学(91-XX) 按年份列出的引文