ProClust公司 swMATH ID: 35761 软件作者: Pipenbacher P.、Schliep A.、Schneckener S.、Schonhuth A.、Schomburg D.、Schrader R。 描述: ProClust:使用扩展的基于图形的方法改进蛋白质序列的聚类。结果:我们扩展了一种基于图的聚类算法,该算法使用非对称距离度量,根据比较的蛋白质序列的长度缩放相似值。此外,对齐分数的重要性被考虑在内,并用于算法中的过滤步骤。提出了基于轮廓HMM合并更多簇的后处理方法。SCOP序列及其超家族级分类被用作一个测试集,用我们的方法对包含SCOP和SWISS-PROT的联合数据集进行聚类计算。请注意,联合数据集包括所有多域蛋白质,其中包含SCOP域,这些域是错误链接的潜在来源。我们的方法与PSI-Blast相比具有很高的特异性,后者可能是寻找远程同源物最广泛使用的工具。我们证明,对多达十二个中间序列使用及物性对于实现这一性能水平至关重要。此外,通过对误报的分析,我们得出结论,我们的方法似乎正确地限制了所使用的及物性程度。该分析也为选择参数提供了明确的指导。非对称距离度量的启发式方法既没有从理论上解决多域问题,也没有避免我们在实际数据中观察到的所有类型的问题。然而,与现有方法相比,它们确实提供了实质性的改进。可用性:根据GNU通用公共许可证(GPL),所有用户都可以从免费获得完整的软件源http://www.bioinformatik.uni-koeln.de/proclust/下载/ 主页: https://academic.oup.com/bioinformatics/article/18/suppl_2/S182/190674 相关软件: 爆炸;PSI-爆炸;通用汽车公司;算法457;贝叶斯先生;集群C;MEGA公司;菲利普;帕杰克;BWA公司;蝴蝶结2;k平均值++;光谱网;细胞景观;ARPACK公司;集群;记分员;肌肉;扇区;ClustalW公司 引用于: 4文件 全部的 前5名11位作者引用 1 詹姆斯·布鲁赫(James R.Broach)。 1 戴,齐 1 Christodoulos Achilleus弗洛达斯 1 嘿,克劳斯 1 阿恩·库兹纳 1 刘晓庆 1 萨布林·马利克 1 Wady Naanaa 1 谭孟彪 1 姚玉华 1 赵福坤 3篇连载文章中引用 2 理论生物学杂志 1 全球优化杂志 1 组合优化期刊 在4个字段中引用 2 运筹学、数学规划(90-XX) 2 生物学和其他自然科学(92-XX) 1 统计学(62-XX) 1 博弈论、经济学、金融和其他社会和行为科学(91-XX) 按年份列出的引文