跳到内容

郑克文/gdsfmt

存储库文件导航

gdsfmt:R核心阵列基因组数据结构(GDS)文件接口

LGP版本3 GNU宽松通用公共许可证,LGPL-3

可利用性 生命周期中的年份 R(右)

特征

此软件包为CoreArray Genomic Data Structure(GDS)数据文件提供了一个高级R接口,这些数据文件可以跨平台移植,具有层次结构,以存储多个具有元数据信息的可扩展的面向阵列的数据集。它适用于大规模数据集,尤其是远大于可用随机访问内存的数据。gdsfmt包提供了专门为小于8位的整数设计的高效操作,因为二倍体基因型,如单核苷酸多态性(SNP),通常占用的位少于一个字节。数据压缩和解压缩可以通过相对高效的随机访问实现。还允许与包并行支持的多个R进程并行读取GDS文件。

生物导体:

发行版本:v1.38.1

http://www.bioconductor.org/packages/release/bioc/html/gdsfmt.html

帮助文档

新闻

包装小品

http://bioconductor.org/packages/release/bioc/vignettes/gdsfmt/inst/doc/gdsfmd.html

引文

Zheng X、Levine D、Shen J、Gogarten SM、Laurie C、Weir BS(2012)。用于SNP数据的相关性和主成分分析的高性能计算工具集。生物信息学.内政部:10.1093/bioinformatics/bts606.

Zheng X、Gogarten S、Lawrence M、Stilp A、Conomos M、Weir BS、Laurie C、Levine D(2017)。SeqArray——用于WGS变量调用的高效存储高性能数据格式。生物信息学.DOI:10.1093/bioinformatics/btx145.

机组维护人员

郑秀文博士(zhengxwen@gmail.com)

统一资源定位地址

https://bioconductor.org/packages/gdsfmt

https://github.com/zhengxwen/gdsfmt

安装

  • 生物导体储存库:
如果(requireNamespace(必需命名空间)("生物技术经理",安静地=真的))安装.包("生物技术经理")生物技术经理::安装("gdsfmt公司")
  • Github的开发版本(仅适用于开发人员/测试人员):
图书馆("开发工具")安装github("郑克文/gdsfmt")

这个安装github()该方法要求您从源代码构建,即。制作和编译器必须安装在您的系统上--请参阅R常见问题适用于您的操作系统;您可能还需要手动安装依赖项。

版权声明

  • CoreArray C++库,LGPL-3许可证,2007-2021,郑秀文
  • zlib,zlib许可证,1995-2017,Jean-loup Gailly和Mark Adler
  • LZ4,BSD 2语言许可证,2011-2019,Yann Collet
  • liblzma,公共领域,2005-2018,Lasse Collin和其他xz贡献者
  • 自述文件

GDS命令行工具

在R环境中,

安装.包("获得选择权",回购="http://cran.r-project.org")安装程序包("optparse(操作程序)",回购="http://cran.r-project.org")安装.包("蜡笔",回购="http://cran.r-project.org")如果(requireNamespace(必需命名空间)("生物技术经理",安静地=真的))安装.包("生物技术经理")生物技术经理::安装("gdsfmt公司")

查看更多。。。

视图gds

视图gds是用R编写的shell脚本(viewgds(视图)。R(右)),以查看GDS文件的内容。R包gdsfmt公司,获得选择权optparse(操作程序)应在运行前安装视图gds、和包蜡笔是可选的。

用法:viewgds[options]file

使用命令行进行安装,

卷曲-Lhttps://raw.githubusercontent.com/zhengxwen/Documents/master/Program/viewgds.R>视图gdschmod+x视图##或者wget-qO---无检查证书https://raw.githubusercontent.com/zhengxwen/Documents/master/Program/viewgds.R>视图gdschmod+x视图

diffgds(差异)

diffgds(差异)是用R编写的shell脚本(差异gds。R(右)),比较两个文件GDS文件。R包gdsfmt公司,获得选择权optparse(操作程序)应在运行前安装diffgds(差异).

用法:diffgds[options]file1 file2

使用命令行安装,

卷曲-Lhttps://raw.githubusercontent.com/zhengxwen/Documents/master/Program/diffgds.R>diffgds(差异)chmod+x差异##或者wget-qO--无证书https://raw.githubusercontent.com/zhengxwen/Documents/master/Program/diffgds.R>diffgds(差异)chmod+x差异

示例

图书馆(gdsfmt公司)#创建GDS文件
(f) <-创建fn.gds("测试.gds")添加gdsn((f),"整数",val值=1:10000)添加.gdsn((f),"双重的",val值=序列号(1,1000,0.4))添加gdsn((f),"性格",val值=c(c)("整数","双重的","符合逻辑的","因素"))添加gdsn((f),"符合逻辑的",瓦尔=代表(c)(真的,错误的,),50))添加gdsn((f),"因素",val值=as系数(c(,"AA公司","科科斯群岛")))添加gdsn((f),"位2",瓦尔=样品(0:,1000,代替=真的),存储="位2")#列表和data.frame添加gdsn((f),"列表",val值=列表(X(X)=1:10,=序列号(1,10,0.25)))添加gdsn((f),"数据帧",val值=数据帧(X(X)=1:19,=序列号(1,10,0.5)))文件夹 <-添加文件夹.gdsn((f),"文件夹")添加gdsn(文件夹,"整数",val值=1:1000)添加gdsn(文件夹,"双重的",val值=序列号(1,100,0.4))#显示内容
(f)

#关闭GDS文件关闭fn.gds((f))
文件:test.gds(1.1K)+    [  ]|--+整数{整数32 10000,39.1K}|--+双精度{Float64 2498,19.5K}|--+字符{Str8 4,26B}|--+逻辑{Int32,逻辑150,600B}*|--+因子{Int32,因子3,12B}*|--+比特2{比特2 1000、250B}|--+列表[列表]*||--+X{整数32 10,40B}|\--+Y{浮点64 37,296B}|--+数据帧[数据帧]*||--+X{整数32 19,76B}|\-+Y{浮动64 19、152B}\--+文件夹[]|--+整数{整数32 1000,3.9K}\--+双{Float64 248,1.9K}

另请参见

侏儒:核心阵列基因组数据结构(GDS)文件的Python接口

jugds.jl:核心阵列基因组数据结构(GDS)文件的Julia接口