草地 swMATH ID: 12609 软件作者: A.A.Gritsenko、J.F.Nijkamp、M.J.T.Reinders、D.de Ridder 描述: GRASS:构建下一代测序程序集的通用算法。动机:第二代高通量测序(HTS)技术的日益普及引发了人们对从头测序的兴趣。这反过来又推动了从短读测序数据中获取高质量基因组草图的可靠方法的需求。HTS实验中通常涉及的数以百万计的读取首先被组装成称为contigs的较长片段,然后对其进行支架化,即使用附加信息进行排序和定向,以生成称为支架的更长序列。HTS基因组组装的大多数现有支架工不适合使用配对读取以外的信息来进行支架。他们使用这些有限的信息来建造脚手架,当面临权衡时,往往更喜欢脚手架的长度而不是精度。结果:我们提出了GRASS(GeneRic ASembly Scaffolder)——一种构建第二代测序组件的新算法,能够使用不同的信息源。GRASS提供了连续脚手架问题的混合整数规划公式,该公式将连续顺序、距离和方向组合在一个单一的优化目标中。使用期望最大化程序和原始问题的无约束二元二次规划近似解来求解由此产生的优化问题。我们使用Illumina对三个细菌基因组进行配对读取,将GRASS与现有的HTS支架进行了比较。我们的算法构建了相当数量的支架,但错误较少。当使用以相关基因组序列形式提供的额外数据时,这一结果会得到进一步改善。可用性:GRASS源代码可从免费获得http://code.google.com/p/tud-scaffolding/。 主页: http://bioinformatics.oxfordjournals.org/content/28/11/1429.short 相关软件: SCARPA公司;SOPRA公司;班布斯2;最佳;ScaffMatch(扫描匹配);天鹅绒;DBG2OLC公司;皮隆牌手表;ALLMAPS公司;OMGS公司;github;ABySS公司;SOAPdenovo公司;码头;艺术;古罗比;布瓦;Samtools公司;拉古特 引用于: 5文件 全部的 前5名13位作者引用 三 安妮城堡 三 鲁道夫·吉卢杜 2 马蒂亚斯·韦勒 1 鲁门·A·安多诺夫。 1 克莱门·达拉德 1 汤姆·达沃特 1 赫里斯托·尼科洛夫·吉杰耶夫 1 塞巴斯蒂安·弗朗索瓦 1 姜涛 1 多米尼克·拉维尼耶 1 斯特凡诺·洛纳尔迪 1 潘伟华 1 多琳·塔巴里 2篇连载文章中引用 1 理论计算机科学 1 算法 在4个字段中引用 4 生物学和其他自然科学(92-XX) 三 运筹学、数学规划(90-XX) 2 计算机科学(68至XX) 1 组合数学(05-XX) 按年份列出的引文