民进党PseAAC

DPP-PseAAC:一个基于周氏广义PseAAC的DNA结合蛋白预测模型。DNA结合蛋白(DNA-BP)是一种能与DNA结合并相互作用的蛋白质。用实验方法鉴定DNA BPs既费时又昂贵。因此,人们寻求快速而准确的计算方法来预测蛋白质是否能与DNA结合。在这篇论文中,我们致力于建立一个新的计算模型,以有效和准确地识别DNA碱基。我们的模型直接从蛋白质序列中提取有意义的信息,而不依赖于功能域或结构信息。在特征提取后,采用随机森林模型对特征进行排序。然后,我们使用递归特征消除(RFE)方法提取一组最优的特征集,并用线性核的支持向量机(SVM)训练出一个预测模型。我们所提出的方法称为{it-DNA结合蛋白预测模型,使用Chou的通用PseAAC(DPP-PseAAC)},与标准基准数据集上的最新预测值相比,具有更好的性能。DPP-PseAAC在10倍交叉验证试验、刀切试验和独立试验中的准确度分别为93.21%、95.91%和77.42%。DPP-PseAAC的源代码,以及相关的数据集和详细的实验结果,可以在url上找到{https://github.com/srautonu/DNABinding}. 还建立了一个可公开访问的web界面:url{http://77.68.43.135:8080/DPP-PseAAC/}。