PseDNA专业版

PseDNA-Pro:结合周氏PseAAC和理化距离转换鉴定DNA结合蛋白。DNA结合蛋白在细胞的各种过程中起着至关重要的作用,因此DNA结合蛋白的鉴定是生物医学研究中的一个重要问题。目前,机器学习方法以不同的特点实现了最先进的性能。提高这些方法性能的一个关键步骤是寻找合适的蛋白质表达形式。在这项研究中,我们提出了一个由三种基于序列的特征组成的特征向量,包括总体氨基酸组成、周提出的伪氨基酸组成(PseAAC)和物理化学距离变换。这些特征不仅考虑了蛋白质的序列组成,而且包含了蛋白质中氨基酸的序列顺序信息。将特征向量输入支持向量机(SVM)进行DNA结合蛋白识别。该方法称为psednapro。在严格的基准数据集和独立的测试数据集上,用Jackknife测试表明,PseDNA-Pro可以达到80%以上的准确率,优于dnabider、DNA-Prot和iDNA-Prot等几种最新的方法。这些结果表明,结合各种特征进行DNA结合蛋白预测是一种比较合适的方法,蛋白质残基之间的序列顺序信息具有相对性。在实际应用中,建立了psednapro的web服务器,可从http://bioinformatics.hitsz.edu.cn/PseDNA-Pro/获取。