MantaID:基于机器学习的自动识别工具生物数据库ID

生物数据库的数量正在迅速增长,但不同的数据库使用不同的ID来引用同一生物实体。ID的不一致性阻碍了各种类型的生物数据的集成。为了解决这个问题,我们开发了“MantaID”,这是一种基于机器学习的数据驱动方法,可以大规模自动识别ID。“MantaID”模型的预测准确率被证明为99%,它在两分钟内正确有效地预测了100000条ID条目。”MantaID支持从大量数据库中发现和利用ID模式。(例如,多达542个生物数据库)。还为“MantaID”开发了一个易于使用的免费开源软件R包、一个用户友好的web应用程序和API,以提高适用性。据我们所知,“MantaID”是第一个能够自动、快速、准确和全面识别大量ID的工具,因此可以作为一个起点,促进不同数据库中生物数据的复杂同化和聚合。

版本: 1.0.4
取决于: R(≥4.4.0),生物反应器,插入符号,珊瑚礁,mlr3调谐,mlr3号机组
进口: ggplot2,数据表,马格里特,字符串,易怒的,第三年,潮汐选择,ggcorrplot图,重新整形2,浮渣,悖论,R彩色啤酒,呜呜声,数字播放器
建议: mlr3超宽带,mlr3学习者,护林员,r零件,xgboost公司
出版: 2024-09-09
内政部: 10.32614/CRAN.包装。曼塔ID
作者: 曾正鹏ORCID标识[aut、cre、ctb],毛龙飞ORCID标识[自动,cph],冯宇ORCID标识[aut],胡佳敏ORCID标识【ctb】,王希廷(Xiting Wang)ORCID标识【ctb】
维护人员: 曾正鹏<foxmail.com上的molison>
许可证: GPL(≥3)
网址: https://molaison.github.io/MantaID/
需要编译:
引用: MantaID引文信息
CRAN检查: MantaID结果

文档:

参考手册: 曼塔ID.pdf

下载内容:

包源: 曼塔ID_1.0.4.tar.gz
Windows二进制文件: r-devel公司:MantaID_1.0.4.zip文件,r版本:MantaID_1.0.4.zip文件,r-oldrel:无法使用的
macOS二进制文件: r释放(arm64):曼塔ID_1.0.4.tgz,r-oldrel(arm64):不可用,r-release(x86_64):曼塔ID_1.0.4.tgz,r-oldrel(x86_64):不可用
旧来源: MantaID存档

链接:

请使用规范形式https://CRAN.R-project.org/package=MantaID链接到此页面。