沙尔格斯

SARCGS是一种快速、精确的从头测序基因组测序新算法。DNA测序领域的最新革命是由自动测序仪的发展带来的,这些自动测序仪能够快速且低成本地生成千兆碱基对数据集。由于生成的读取的短小,这种技术的应用似乎仅限于重新排序和转录发现。为了扩展应用到从头测序的领域,我们开发了SARCGS算法,以高精度和高速度组装短读取(25—40 MeR)数据。在三个真核生物、两个酵母染色体上和两个细菌基因组(流感嗜血杆菌、大肠杆菌)上对BACC插入物进行了SARCGS的效率测试。我们发现,30个MER的BAC组件具有N50大小>20 kbp的果蝇和拟南芥和超过4 kbp的人在模拟中缺少读取和错误的基础呼叫考虑。我们组装了949974个长度大于50 bp的重叠群,并且只有一个单一的重叠群不能对齐参考序列。我们在Illumina 1G测序仪上产生了36个对Acdiodio螨属基因组的阅读,并组装了937个重叠群,覆盖了98%个基因组,N50大小为3.7 kbp。除了五个重叠群在1至4个位置相对于参考序列不同,所有的重叠群都匹配基因组无差错。因此,SARCGS是一种合适的工具,用于充分利用新的测序技术,通过装配具有高置信度的序列重叠群,并通过在速度和精度方面优于现有的装配算法。

ZBMaCT中的参考文献(7篇文章中引用)

显示结果1至7的7。
按年份排序(引文

  1. Rodr Guez EZPELeta,Naiara(ED);哈肯伯格,米迦勒(ED);Aransay,Ana M.(ED):高通量测序的生物信息学(2012)
  2. 普罗斯佩里,Mat蒂亚C.F.;普罗斯佩里,卢西亚诺;Bruselles,Alessandro;阿巴特,伊莎贝拉;Rozera,加布里埃;VunSimi,DoaTaela;索尔蒙,Maria Carmela;Capobianchi,Pipe;ULIVI,Y:组合分析和使用下一代测序的准种重建算法(2011)伊波尔特
  3. Kingsford,卡尔;Schatz,Michael C.;POP,米哈伊:使用短阅读的原核基因组组装复杂度(2010)伊波尔特
  4. Schmieder,罗伯特;林,Yan Wei;Rohwer,林;爱德华兹,罗伯特:Tagcleaner:从基因组和宏基因组数据集识别和去除标签序列(2010)伊波尔特
  5. 杰克逊,Benjamin G.;Snabebe,Patrick S.;Aluru,SrimVas:转录序列的平行短序列组装(2009)伊波尔特
  6. 小Douglas W. Bryant,Wong,翁敏锐;莫克勒,Todd C.:QSRA——一个质量价值导向的TeXTyDeNotoScript Read汇编程序(2009)伊波尔特
  7. 王,Wendi;张,Peiheng;刘,Xinchun:短片段DNA片段锚定算法(2009)伊波尔特