×

金属-6mA

swMATH ID: 37446
软件作者: 哈桑,M.M。;巴西思,S。;Khatun,M.S。;Lee,G。;马纳瓦兰,B。;H.库拉塔。
描述: Meta-i6mA:一种种间预测因子,用于在综合机器学习框架中利用信息特征识别植物基因组的DNA N6-甲基腺嘌呤位点。DNA N6-甲腺嘌呤(6mA)代表重要的表观遗传修饰,负责各种细胞过程。精确鉴定6mA位点是基因组分析中具有挑战性的任务之一,这有助于了解其生物学功能。迄今为止,已经提出了几个基于物种特定机器学习(ML)的模型,但大多数模型并没有对其他物种进行测试。因此,它们在其他植物物种中的实际应用非常有限。在本研究中,我们探索了10种不同的特征编码方案,目的是捕获6mA位点周围的关键特征。我们选择了五种基于物理化学和位置特定信息的特征编码方案,它们具有很高的识别能力。生成的特征集被输入到六种常用的ML方法中(随机森林、支持向量机、极端随机树、逻辑回归、朴素贝叶斯和AdaBoost)。采用蔷薇科基因组训练上述分类器,生成30个基线模型。为了整合他们的个人力量,提出了Meta-i6mA,它使用Meta-predictor方法组合了基线模型。在广泛的独立测试中,Meta-i6mA在蔷薇科、水稻和拟南芥上分别显示出0.918、0.827和0.635的高Matthews相关系数值,并且优于现有的预测因子。我们预计Meta-i6mA可以应用于不同的植物物种。此外,我们还开发了一个在线用户友好的web服务器,可在http://kurata14.bio.kyutech.ac.jp/Meta-i6mA/。
主页: http://kurata14.bio.kyutech.ac.jp/Meta-i6mA/
引用于: 0个文档