×

型号_4mc

swMATH ID: 40010
软件作者: 哈桑·祖勒菲卡尔;Khan,Rida Sarwar;哈桑(Farwa Hassan);Hippe,Kyle;卡桑德拉·亨特;丁慧;宋晓明;曹仁智
说明: 用机器学习方法计算鉴定小鼠基因组中的N4-甲基胞嘧啶位点。N4-甲基胞嘧啶(4mC)是一种DNA修饰,可以调节多种生物过程。正确识别基因组序列中的4mC位点可以提供关于其遗传作用的精确知识。本研究旨在建立一个集成模型来预测小鼠基因组中的4mC位点。在该模型中,DNA序列由k-mer编码,增强的核酸组成和k-间隔的核酸对组成。随后,通过使用最小冗余最大相关性(mRMR)、增量特征选择(IFS)和五倍交叉验证对这些特征进行优化。将获得的最优特征输入到随机森林分类器中,用于区分小鼠体内的4mC位点和非4mC位点。在独立数据集上,我们的模型可以获得85.41的总体精度
主页: http://www.aimspress.com/article/doi/10.3934/mbe.2021167
源代码:  https://github.com/linDing-groups/model_4mc
关键词: DNA修饰;特征提取;特征选择;N4-甲基胞嘧啶;随机森林
相关软件: BioSeq分析;国际MRM;i4mC鼠标;XG-PseU公司;DNA4mC-LIP公司;4mC红色;靶向抗Angio;DeepTorrent深激流;ACP红色;github;国际BLP;深度4mC;iDNA-MS公司;PSAC公司;折叠Rec-C2C;iTerm-PseKNC;RAAC手册;Raac徽标;iCircDA-MF公司;Meta-iPVP公司
引用于: 1文件

按年份列出的引文