下载GEO数据

GEO中的所有数据都可以使用各种机制以各种格式下载。以下信息列出了下载选项和格式。

下载原始GEO记录全部展开

系列记录上的链接

各种格式和补充文件的实验系列下载链接在每个GEO系列记录的底部提供。这些文件使用gzip(.gz或.tgz扩展名)进行压缩。要解压缩和读取这些文件,请使用WinZip或7-拉链.

FTP下载

所有GEO记录和原始数据文件均可从我们的FTP站点。请参阅我们的自述文件有关目录结构和文件格式的详细信息。然而,GEO现在拥有如此大量的提交,以至于一些父目录由于超时错误,无法再使用web浏览器访问。在这种情况下,需要绕过父目录,直接转到目标目录,例如,对于GSE1000系列:

ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE1nnn/GSE1000/matrix公司/

请注意,FTP站点上的大多数文件都是使用gzip(.gz或.tgz扩展名)进行压缩的。要解压缩和读取这些文件,请使用WinZip或7-拉链.或者,如果您有UNIX,请使用tar和gunzip命令来解压缩文件,例如。,

命令行: $tar-xf GSExxxx_RAW.tar
$gunzip*gz

提供了有关访问NCBI FTP服务器和优化批量FTP传输的更多一般信息在这里.

如果您计划执行大量下载,您可能会考虑高吞吐量文件传输使用Aspera Connect-请联系我们geo@ncbi.nlm.nih.gov了解详细信息。

登录显示栏

这个登录显示栏位于每个GEO记录的顶部并可用于下载或查看完整或部分记录或相关平台,样品和系列记录。这个范围该功能允许显示单个登录号(Self)或与该加入相关的任何(平台、样本或系列)或所有(系列)记录。数量指示显示的数据量,选项仅包括元数据(Brief),元数据和数据表的前20行(快速),仅数据表(数据),或完整元数据/数据表记录(完整)。格式控制记录是以HTML、SOFT(纯文本)还是MINiML(XML)格式显示。

构造URL

使用上述访问显示栏的另一种方法是构造一个URL来检索数据。URL的格式如下:

https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?符合=gpl96&防水布=自身&看法=简短&形式=文本

此URL将检索包含登录GPL96“简要”视图的文本文件。

每个组件的可能值为:

  • 符合=有效的GEO加入,即gplxxx、gsmxxx或gsexxx
  • 防水布=自身、gsm、gpl、gse或全部
  • 看法=简短、快速、数据或完整
  • 形式=文本、html或xml

请注意,当选择html格式进行特别大的检索时,浏览器可能会超时。或者,如果您有perl,可以使用此机制检索数据,如下所示:

$perl-MLWP::Simple-e“getprint”https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSM313800&targ=self&view=full&form=text'"

编程访问

可以使用一套称为Entrez编程实用程序(E-Utils),请参阅更多信息。。。

Entrez GEO DataSet查询下载

可以使用Entrez GEO数据集接口。通过将页面顶部的工具栏设置为“发送到:文件”,可以导出结果。

下载精心策划的数据集和配置文件全部展开

数据集记录上的链接

链接到DataSet SOFT文件可以在每个数据集记录的“下载”按钮下找到。这些文件使用gzip(.gz或.tgz扩展名)进行压缩。要解压缩并读取这些文件,请使用WinZip或7-拉链.

FTP下载

所有GEO数据集记录都可以从我们的FTP站点.这些文件使用gzip(.gz扩展名)进行压缩。要解压缩和读取这些文件,请使用WinZip或7-拉链. 或者,如果您有UNIX,请使用gunzip命令解压缩文件,例如。,

命令行: $gunzip*gz

编程访问

可以使用一套称为Entrez编程实用程序(E-Utils),请参阅更多信息。。。

配置文件值下载

使用顶部的“下载配置文件数据”按钮Entrez GEO配置文件检索页下载查询中找到的基因的表达值。

Entrez-GEO DataSet和Entrez-GEO Profiles查询下载

可以导出Entrez GEO数据集Entrez GEO配置文件文档摘要(按设置)将页面顶部的工具栏设置为“发送到:文件”。

上次修改日期:2024年2月22日