PSICOV公司

PSICOV:在大型多序列比对中使用稀疏逆协方差估计的精确结构接触预测。动机:准确预测残基-残基接触,对于维持蛋白质的天然折叠至关重要,仍然是结构生物信息学领域的一个开放性问题。随着算法的改进和序列族规模的迅速增长,人们对这一长期存在的问题的兴趣与日俱增。进展可能对结构和功能预测产生重大影响,但有两个好处。基于序列的接触预测通常是通过识别多序列比对(MSAs)中的相关突变来实现的,最常见的是通过信息论方法计算蛋白质中成对位点之间的相互信息。这些预测往往是不准确的,因为在MSA中真正的共变信号往往被许多辅助的间接耦合或系统发育效应的偏差所掩盖。本文提出了一种新的方法PSICOV,它将稀疏逆协方差估计引入到蛋白质接触预测问题中。我们的方法建立在先前已经证实的系统发育和熵相关噪声校正工作的基础上,并且允许在MSA中准确区分直接和间接耦合突变相关性。结果:PSICOV的平均精度明显优于性能最好的归一化互信息法和贝叶斯网络。对于150个靶点中的118个,长程接触(序列分离>23)的L/5(即长度为L的蛋白质的top-L/5预测)精度≥0.5,这表明这一改进足以对蛋白质结构预测或模型质量评估产生显著益处。可用性:PSICOV源代码可从http://bioinf.cs.ucl.ac.uk/downloads/PSICOV下载