自行车

CyclinPred:一种基于支持向量机的细胞周期蛋白序列预测方法。蛋白质序列的功能注释是后基因组时代计算生物学的一大挑战。细胞周期蛋白(cyclin protein,cyclin)蛋白家族曾经是一个重要的蛋白质家族,它由低序列相似性的序列组成,这使得发现新的细胞周期蛋白和建立细胞周期蛋白之间的同源关系成为一项艰巨的任务。目前已鉴定的细胞周期蛋白基序和细胞周期蛋白相关结构域并不代表所有已识别和特征化的细胞周期蛋白序列。我们描述了一种基于支持向量机(SVM)的分类器CyclinPred,它可以高效地预测cyclin序列。利用细胞周期蛋白和非细胞周期蛋白序列的特征对支持向量机分类器进行训练。蛋白质序列的训练特征包括氨基酸组成、二肽组成、二级结构组成和PSI-BLAST生成的位置特异性评分矩阵(PSSM)图谱。通过Leave-One-Out交叉验证或jackknife检验、自一致性检验和holdout检验,证明了用PSSM轮廓特征训练的SVM分类器比单独使用其它特征或这些特征的混合特征训练的SVM分类器更准确。基于PSSM轮廓训练的支持向量机模型,建立了一个周期蛋白预测服务器CyclinPred。周期预测结果表明,该方法可以作为一种周期蛋白预测工具,与传统的细胞周期蛋白预测方法相补充。