SHARCGS公司 swMATH ID: 29573 软件作者: Dom,J.C.、Lottaz,C.、Borodina,T。 描述: SHARCGS是一种快速、高精度的新基因组测序短读汇编算法。DNA测序领域的最新革命是由能够快速、低成本生成千兆碱基对数据集的自动测序器的开发带来的。由于生成的读取数很短,这类技术的应用似乎仅限于重新排序和转录发现。为了将应用领域扩展到从头测序,我们开发了SHARCGS算法,以高精度和高速度组装短读(25–40-mer)数据。SHARCGS的效率在三种真核生物的BAC插入物、两条酵母染色体和两个细菌基因组(流感嗜血杆菌、大肠杆菌)上进行了测试。我们表明,在考虑到缺失读取和错误的基调用的模拟中,30个基于mer的BAC组件的N50大小对于果蝇和拟南芥>20 kbp,对于人类>4 kbp。我们收集了949974个长度大于50 bp的连续序列,只有一个连续序列不能与参考序列无误地对齐。我们在Illumina 1G测序仪上对不动杆菌基因组进行了36米的读取,并组装了937个覆盖98个 主页: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2045152/ 相关软件: 天鹅绒;所有路径;SSAKE公司;阿拉伯;布拉特;QSRA公司;ABySS公司;美洲开发银行;PE-装配器;IDBA-UD公司;SOAPdenovo公司;SPAdes系列;仪表;DEGseq公司;星形底座;BSMAP公司;烤面包;拼接接头;DWE公司;CLIPZ公司 引用于: 2文件 全部的 前5名6位作者引用 1 阿兰塞(Ana M.Aransay)。 1 迈克尔·哈肯伯格 1 吉恩·盖拉尔丁 1 安德烈亚·拉杜列斯库 1 罗德里格斯-埃兹佩列塔,奈亚拉 1 伊雷娜·鲁苏 0连载引用 在3个字段中引用 2 生物学和其他自然科学(92-XX) 1 总体主题;集合(00-XX) 1 计算机科学(68至XX) 按年份列出的引文