莫夫雷德

一种基于短序列的蛋白质预测和预测工具。动机:分子识别特征(MORF)是位于较长的内在无序区域内的短结合区域,通过无序到有序的转变与蛋白质伴侣结合。morf参与包括信号传递和调节在内的重要过程。然而,只有有限数量的实验验证的morf是已知的,这推动了从蛋白质链预测morf的计算方法的发展。结果:我们引入了一个新的MoRF预测因子MoRFpred,它可以识别所有MoRF类型(α、β、coil和complex)。我们开发了一个包含注释的morf的综合数据集来构建和实证比较我们的方法。MoRFpred采用了一种新的设计方法,将序列比对生成的注释与支持向量机(SVM)生成的预测进行融合,支持向量机使用一组定制的序列衍生特征集。这些特征提供了有关进化概况、氨基酸的某些理化性质、预测的无序性、溶剂可及性和B因子的信息。对多个数据集的经验评估表明,MoRFpred优于相关方法:预测α-MoRF的α-MoRF-Pred和发现与球状伙伴结合时变得有序的无序区域的锚定方法。我们证明我们预测的(新的)MoRF区域与本地MoRF具有非随机序列相似性。我们利用这一观察结果,以及更高概率的预测更准确地识别假定的MoRF区域。我们还发现了一些由序列衍生的MoRFs特征。它们的特点是无序预测中的dips和与相邻(链中)残基相比具有更高的疏水性和稳定性。可用性:http://biomine.ece.ualberta.ca/MoRFpred/;http://biomine.ece.ualberta.ca/MoRFpred/Supplement.pdf