d2_群集 swMATH ID: 28788 软件作者: Burke,J.、Davison,D.、Hide,W。 描述: d2_cluster:一种有效的EST和全长cDNA序列聚类方法。目前正在通过聚类或组装的方式大规模浓缩单读表达序列标签(EST)和全长转录数据。这些项目的一个目标是构建基因索引,其中转录物被划分为索引类(或簇),使得它们被放入同一索引类,当且仅当它们代表同一基因时。准确的基因索引有助于通过组装EST来进行基因表达研究和廉价早期的部分基因序列发现,EST源自尚未通过基因组测序进行定位克隆或直接获得的基因。我们描述了d2_cluster,这是一种聚合算法,用于根据最小链接或“传递闭包”规则对序列进行聚类,从而快速准确地将转录数据库划分为索引类。然后,我们评估了d2_cluster相对于其他集群工具的相对效率。UniGene因其高质量和广泛接受而被选中进行比较。结果表明,尽管d2_cluster和UniGene产生的结果介于83之间 主页: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC310833/ 相关软件: 莫菲;菲利普;彩虹;幻灯片排序;马什;紧身胸衣;石斑鱼;科根(Cogent);LSC公司;最小值2;副帆;SimLoRD公司;易集群2;星号;MMseqs2型;DNACLUST公司;MeShClust公司;是ONclust;github;Cd命中 引用于: 5文件 全部的 前5名9位作者引用 三 米丽亚姆·鲁思·坎托罗维茨 2 康拉德·约翰·伯顿 2 苏珊·R·威尔逊。 1 达明达州阿拉哈库恩 1 苏珊·贝丁菲尔德(Susan E.Bedingfield)。 1 Hilary S.布斯。 1 乌普里·古纳辛格 1 保罗·梅德韦杰夫 1 克里斯托弗·萨林 4篇连载文章中引用 1 应用概率杂志 1 统计学和概率论字母 1 应用概率年鉴 1 理论生物学杂志 在4个字段中引用 4 生物学和其他自然科学(92-XX) 三 概率论与随机过程(60-XX) 1 统计学(62-XX) 1 计算机科学(68至XX) 按年份列出的引文