iSS Hyb mRMR

“iSS-Hyb-mRMR”:利用伪三核苷酸和伪四核苷酸组成的杂交空间鉴定剪接位点。背景与目的:基因剪接是蛋白质多样性的重要来源。由于外显子通常被内含子打断,完全消除内含子和连接外显子是真核基因表达的重要任务。通过实验技术鉴定剪接位点是一项复杂而耗时的工作。随着后基因组时代产生的基因组序列的雪崩,开发一种自动、健壮、可靠的计算方法来快速有效地识别剪接位点仍然是一项复杂而富有挑战性的任务。方法:本研究提出一种“iSS-Hyb-mRMR”混合模型,用于快速、准确地识别剪接位点。采用伪三核苷酸组成(PseTNC)和伪四核苷酸组成(psetranc)两种样本表示方法从DNA序列中提取数字描述符。通过连接PseTNC和psetranc建立混合模型。在混合特征空间中采用最小冗余最大相关算法来选择高分辨特征。利用K-最近邻、概率神经网络、广义回归神经网络和拟合网络等多种分类算法对这些特征表示方法的性能进行了测试。分别在S1和S2两个基准数据集上对其性能进行了评价。结果:本研究提出的预测因子对S1的准确率为93.26%,敏感性为88.77%,特异性为97.78%,S2的准确率为94.12%,敏感性为87.14%,特异性为98.64%。结论:与文献中已有的方法相比,本文提出的模型性能更高,在RNA剪接机理等方面的研究将取得丰硕的成果。