×

ProClust公司

swMATH ID: 35761
软件作者: Pipenbacher P.、Schliep A.、Schneckener S.、Schonhuth A.、Schomburg D.、Schrader R。
描述: ProClust:使用扩展的基于图形的方法改进蛋白质序列的聚类。结果:我们扩展了一种基于图的聚类算法,该算法使用非对称距离度量,根据比较的蛋白质序列的长度缩放相似值。此外,对齐分数的重要性被考虑在内,并用于算法中的过滤步骤。提出了基于轮廓HMM合并更多簇的后处理方法。SCOP序列及其超家族级分类被用作一个测试集,用我们的方法对包含SCOP和SWISS-PROT的联合数据集进行聚类计算。请注意,联合数据集包括所有多域蛋白质,其中包含SCOP域,这些域是错误链接的潜在来源。我们的方法与PSI-Blast相比具有很高的特异性,后者可能是寻找远程同源物最广泛使用的工具。我们证明,对多达十二个中间序列使用及物性对于实现这一性能水平至关重要。此外,通过对误报的分析,我们得出结论,我们的方法似乎正确地限制了所使用的及物性程度。该分析也为选择参数提供了明确的指导。非对称距离度量的启发式方法既没有从理论上解决多域问题,也没有避免我们在实际数据中观察到的所有类型的问题。然而,与现有方法相比,它们确实提供了实质性的改进。可用性:根据GNU通用公共许可证(GPL),所有用户都可以从免费获得完整的软件源http://www.bioinformatik.uni-koeln.de/proclust/下载/
主页: https://academic.oup.com/bioinformatics/article/18/suppl_2/S182/190674
相关软件: 爆炸PSI-爆炸通用汽车公司算法457贝叶斯先生集群CMEGA公司菲利普帕杰克BWA公司蝴蝶结2k平均值++光谱网细胞景观ARPACK公司集群记分员肌肉扇区ClustalW公司
引用于: 4文件

按年份列出的引文