PFRES公司

PFRES:利用进化信息和预测的二级结构进行蛋白质折叠分类。动机:蛋白质家族的数量估计只有1000个。最近的研究表明,沉积在PDB中的新结构的发现和SCOP类别的相关增长率正在放缓。这表明蛋白质结构空间将很快被覆盖,因此我们可以利用已知的折叠模式来获得大部分剩余结构。现有的三级结构预测方法在预测同源结构时表现良好,但在没有同源模板的情况下预测结果较差。同时,一些具有曙光区序列特征的蛋白质可以形成类似的折叠。因此,在没有序列相似性的情况下确定结构相似性将有助于三级构造的预测。结果:所提出的PFRES方法从低同源性(<35%)序列进行蛋白质折叠自动分类,两个测试集的准确率分别为66.4%和68.4%。PFRES的准确度比现有方法提高了6.3-12.4%。PFRES的预测精度在统计学上明显优于竞争方法。我们的方法采用了精心设计的基于集成的分类器和新颖、紧凑和定制设计的特征表示,与最精确的竞争方法(36对283)相比,包含的特征减少了近90%。该方法利用基于PSI-BLAST剖面的合成向量和从PSI-PRED预测的二级结构中提取的信息,结合进化信息。