PBSIM卡

PacBio读取模拟器-朝向精确的基因组组装。动机:PacBio测序仪产生两种类型的特征读取(连续长读取:长错误率和高错误率;循环一致性测序:短错误率和低错误率),这两种类型都可以用于基因组的从头组装。目前,还没有针对特定一代PacBio库的可用模拟器。结果:我们对13个PacBio数据集的分析显示了PacBio读取的特征(如PacBio读取长度服从对数正态分布)。我们开发了一个读模拟器PBSIM,它使用基于模型或基于采样的方法捕捉这些特性。利用PBSIM,我们对PacBio读取进行了几次混合纠错和组装测试,结果表明,连续长读覆盖深度至少为15,循环共识测序覆盖深度至少为30,可以获得广泛的组装结果。可用性:PBSIM可以通过gnugplv2许可证(http://code.google.com/p/PBSIM/)从web上免费获得。