脊柱-D

SPINE-D:通过基于单个神经网络的方法精确预测短和长无序区域。蛋白质的短无序区和长无序区对不同的氨基酸残基有不同的偏好。不同的方法常常需要训练来分别预测它们。在这项研究中,我们开发了一种称为SPINE-D的单一神经网络技术,它首先进行三态预测(在短无序区域和长无序区域中无序残基),然后将其简化为两状态预测。SPINE-D在不同的集合上进行测试,这些集合由不同的不匹配注释的蛋白质和直接来自PDB的蛋白质的组合组成,这些蛋白质通过X射线确定的结构中的坐标缺失而被注释为无序。而根据证伪和X射线的方法,紊乱的注释是不同的,SPINE-D的预测精度和预测无序的能力相对独立于方法的训练方式和使用的注释类型,但强烈依赖于测试集中短无序区域和长无序区域有序和无序残基相对总体的平衡。在短无序区和长无序区检测残留的总体特异性均大于85%,在有序残基为56.5%的平衡测试数据集中,长无序区的残留更容易预测为81%的灵敏度,但在有序残基为90%的测试数据集中更具挑战性(灵敏度为65%)。与其他11种方法相比,SPINE-D在329个蛋白质的独立测试集中,曲线下面积(AUC)最高,基于残基预测的Mathews相关系数最高,预测蛋白质无序含量的均方误差最小。特别是,SPINE-D在预测长无序区的无序残基方面与meta预测因子相当,在短无序区则优于meta预测因子。SPINE-D参与了casp9盲预测,是官方排名中排名靠前的服务器之一。此外,在一些案例研究中,SPINE-D被用来预测功能性分子识别基序。服务器和数据库位于http://sparks.informatics.iupui.edu/。