西姆洛德

SimLoRD:长读取数据的模拟。第三代测序方法比第二代测序方法提供更长的读取时间,并且具有明显的错误特征。虽然存在许多用于第二代数据的读取模拟器,但是对于第三代数据的选择非常有限。结果:我们分析了来自太平洋生物科学(PacBio)SMRT测序的公共数据,建立了一个错误模型,并在一个名为SimLoRD的新的read模拟器上实现了它。它提供了选择读取长度分布和根据通过序列器的传递次数对错误概率建模的选项。新的误差模型使SimLoRD成为最现实的SMRT读模拟器。可用性和实现:SimLoRD在http://bitbuck.org/genomeinformatics/SimLoRD/上是开放源码的,可以通过Bioconda安装(http://Bioconda.github.io)