埃斯普里茨

ESpritz:蛋白质紊乱的准确和快速预测。动机:本质上无序的区域是许多蛋白质功能的关键,而现有的实验注释很少表明存在不同的无序风味。虽然需要有效的预测来注释整个基因组,但大多数现有的方法需要序列轮廓来进行无序预测,这使得它们对于高通量应用来说非常麻烦。结果:在这项工作中,我们提出了一组蛋白质紊乱预测因子,称为ESpritz。这些是基于双向递归神经网络和训练三种不同类型的紊乱,包括一个新的核磁共振灵活性预测。ESpritz可以产生快速而准确的序列预测,在单个处理器内核上以小时的顺序注释整个基因组。或者,使用序列配置文件的速度较慢但稍微更精确的ESpritz变体可用于需要最大性能的应用程序。两个级别的预测置信度允许最大化合理的疾病检测或将预期的假阳性限制在5%。ESpritz在最近的CASP9数据上表现良好,Sw测量值达到54.82,接收器-操作员曲线下的面积为0.856。快速预测比大多数公开的CASP9方法快4个数量级,仍然优于大多数公开的CASP9方法,因此它是基因组规模预测的理想选择。结论:ESpritz以两种不同的假阳性率预测了三种类型的疾病,要么是快速的,要么是较慢的,并且稍微更准确。鉴于其最先进的性能,它对于高吞吐量应用尤其有用。可用性:用于高吞吐量分析的web服务器和ESpritz的Linux可执行版本可从以下站点获得:http://protein.bio.unipd.it/espritz/