LSC公司

通过短读对齐提高PacBio长读精度。第三代测序(TGS)的最新发展产生了比第二代测序(SGS)更长的读取时间,从而为解决单靠SGS难以研究的问题提供了机会。然而,大多数原始技术的固有缺点是读取率较高。本文提出了一种计算方法LSC,用SGS短读(SR)对TGS长读(LR)进行纠错。为了降低TGS主平台PacBio®RS,LSC采用均聚物压缩(HC)转换策略,以提高SR-LR对准的灵敏度,而不会降低对准精度。我们将LSC应用于人脑小脑RNA序列数据的10万个PacBio长的读取,以及6400万个单端75bp的人脑RNA序列数据的读取。实验结果表明,LSC可以纠正PacBio的长读操作,使错误率降低3倍以上。这种精确度的提高大大有利于后续分析,如RNA序列研究中的定向基因亚型检测。与另一种混合校正工具相比,LSC的灵敏度和特异性都提高了一倍以上。