×

MeShClust公司

swMATH ID: 28770
软件作者: 詹姆斯,B.T.,卢扎克,B.B.,吉尔吉斯,H.Z。
描述: MeShClust:一种用于聚类DNA序列的智能工具。序列聚类是分析DNA序列的基本步骤。用于序列聚类的广泛使用的软件工具使用贪婪的方法,这些方法不能保证产生最佳结果。这些工具对决定簇中序列之间相似性的一个参数很敏感。通常,生物学家可能不知道确切的序列相似性。因此,如果提供的参数不准确,则这些工具生成的簇可能与包含数据的真实簇不匹配。为了克服这一局限性,我们采用了均值漂移算法,这是一种无监督机器学习算法,在图像处理和计算机视觉等领域已经成功使用了数千次。与贪婪方法不同,meanshift算法背后的理论可以保证收敛到模式,例如聚类中心。这里我们描述了均值偏移算法在DNA序列聚类中的首次应用。MeShClust是均值漂移算法在生物信息学中的少数应用之一。此外,我们使用无对齐方法,应用监督机器学习预测全局对齐产生的身份分数。我们证明了MeShClust能够高精度地聚类DNA序列,即使用户提供的序列相似性参数不是很准确。
主页: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6101578/
相关软件: d2_群集;彩虹;幻灯片排序;土豆泥;紧身胸衣;石斑鱼;科根(Cogent);液化石油气;最小值2;遮阳伞;SimLoRD公司;易集群2;星号;MMseqs2系列;DNACLUST公司;是ONclust;github;Cd命中
引用于: 1文件

0连载引用

按年份列出的引文