注册打开对于生物20247月24-26日

GenProSeq软件

用深度生成模型生成蛋白质序列


生物导体版本:释放(3.19)

蛋白质工程的生成模型是解决合成生物学、医学和材料科学基本问题的关键。机器学习使我们能够在各种尺度上生成有用的蛋白质序列。生成模型是一种机器学习方法,它寻求对数据的分布进行建模,从而生成与模型训练时具有相似属性的新样本。蛋白质的生成模型可以学习对各种下游任务有帮助的生物学意义的表示。此外,他们还可以学习生成以前未观察到的蛋白质序列,并为满足所需标准的蛋白质序列分配更高的概率。在这个包中,蛋白质序列的常见深层生成模型,如可变自动编码器(VAE)、生成对抗网络(GAN)、,并且自回归模型是可用的。在VAE和GAN中,Word2vec用于嵌入。变压器编码器应用于蛋白质序列的自回归模型。

作者:郑东敏[cre,aut]

维护人员:郑东敏(Dongmin Jung)<dmdmjung at gmail.com>

引文(从R中输入引文(“GenProSeq”)):

安装

要安装此软件包,请启动R(版本“4.4”)并输入:

如果(!require(“BiocManager”,悄悄地=TRUE))install.packages(“BiocManager”)BiocManager::安装(“GenProSeq”)

对于R的旧版本,请参阅相应的生物导体释放.

文档

要查看系统中安装的此软件包版本的文档,请启动R并输入:

浏览幻影(“GenProSeq”)
GenProSeq软件 HTML格式 R脚本
参考手册 PDF格式
新闻 文本

细节

生物视图 蛋白质组学,软件
版本 1.8.0
在生物导体中 生物柴油3.15(R-4.2)(2年)
许可证 艺术-2.0
取决于 珊瑚礁,麦克卢斯特,R(>=4.2)
进口 张量流,单词2vec,深PINCS,ttgsea公司,猫编码器,网状的,统计信息
系统要求
统一资源定位地址
查看更多
建议 VAExprs公司,字符串主义者,针织物,测试那个,rmarkdown公司
链接到
增强功能
取决于我
导入我
建议我
指向我的链接
生成报告 生成报告

程序包档案

跟随安装在R会话中使用此包的说明。

源程序包 GenProSeq_1.8.0.tar.gz公司
Windows二进制 GenProSeq_1.8.0.zip软件
macOS二进制(x86_64) GenProSeq_1.8.0.tgz系列
macOS二进制(arm64) GenProSeq_1.8.0.tgz系列
源码库信息 git克隆https://git.bioconductor.org/packages/GenProSeq
源存储库(开发人员访问) git克隆git@git.bioconductor.org:软件包/GenProSeq
Bioc软件包浏览器 https://code.bioconductor.org/browse/GenProSeq网站/
包短Url https://bioductor.org/packages/GenProSeq/
软件包下载报告 下载统计信息