扎恩

Sann:用最近邻法预测蛋白质的溶剂可及性。我们提出了一种预测蛋白质溶剂可及性的方法,该方法基于应用于序列轮廓的最近邻方法。利用该方法可以得到连续的实值预测以及两态和三态离散预测。该方法利用特征向量空间中距离测度的z值估计k近邻之间的相对贡献,以预测离散和连续溶剂可达性。溶剂可及性数据库是由从双鱼座剔除服务器中提取的5717个蛋白质组成,其序列同源性为25%。采用最优参数,预测精度(离散预测)为78.38%(阈值为25%的二态预测)、65.1%(阈值为9和36%的三态预测),对CASP8指标进行了独立的基准检验,结果表明该方法优于现有方法。预测精度为80.89%(二态预测,阈值为25%),67.58%(三态预测),皮尔逊相关系数为0.727(连续预测),平均绝对误差为0.148。我们还研究了增加数据库大小对预测精度的影响,在这种情况下,随着数据库大小的增加,预测精度会进一步提高。SANN web服务器的网址是http://lee.kias.re.kr/newton/SANN/。

此软件的关键字

这里的任何内容都将在支持canvas元素的浏览器上被替换