在本地计算机上安装UCSC基因组浏览器(“镜像”)

目录

安装基因组浏览器前的注意事项
使用GBiC安装程序在本地安装基因组浏览器
Docker安装说明
手动安装说明
使用UDR加速下载
基因组镜像邮件列表

安装基因组浏览器前的注意事项

像大多数网络服务器一样,在您的机构运行基因组浏览器安装,即使对于您自己的部门,也需要Unix机器、磁盘空间(hg19为6TB)和资源来定期更新站点和底层操作系统。你可以考虑一下在服务器上直接安装完整的UCSC Genome Browser之前,请选择其他选项。有关在云中操作的信息,请访问云数据和软件资源帮助页面。

  1. 在网页中嵌入基因组浏览器图形

    如果您只想在您的网页中包含基因组浏览器视图已经存在的基因组,您可以使用<iframe>标签并将其指向http://genome.ucsc.edu/cgi-bin/hg渲染支架,它将只显示主浏览器图形,而不显示任何装饰。

    然后,您可以使用各种参数使此图形适应您的用例(例如,设置显示位置、打开/关闭轨道或用颜色突出显示范围),查看我们的手册页面用于列表的参数。

  2. 使用装配轮毂

    装配轮毂:装配中心允许您准备任何FASTA文件、添加注释和使用基因组浏览器来可视化它。你所需要的只是一个网络服务器保存索引的基因组序列和文件以进行注释,例如在BAM中,bigBed或bigWig格式。

    • 赞成的意见:
      • 无需安装,无需更新,无需长期UNIX支持。
      • 多年来一直稳定,连接到装配中心的链接可以放在手稿中。
      • 对于商业用户,不需要许可证。
    • 欺骗:
      • 您需要访问公共Web服务器来存储文件。
      • 数据在UCSC渲染。私人数据可以是密码保护,通过https加载,仅限于UCSCIP地址,但必须位于网络上并可由UCSC Web服务器。
      • 对于基因组中的BLAT搜索,您必须启动BLAT在Unix服务器上自行安装服务器。
      • 如果您的中心包含大量注释文件或HAL(多重对齐)文件,位于远处来自Santa Cruz的组装集线器的显示性能可能比本地镜像慢。这个问题可以通过使用靠近部件的UCSC镜像进行解析集线器(例如,将genome-euro.ucsc.edu用于位于欧洲服务器上的装配集线器,或基因组-亚洲.ucsc.edu)。或者,您可以提高性能通过将中心数据移动到Web空间靠近Santa Cruz的提供商或使用内容分发网络,其中所有内容都被镜像,最近的位置由提供商选择。
  3. 在框中使用基因组浏览器

    盒子中的基因组浏览器(GBiB):是一个完全配置的虚拟机,包括Apache和MariaDB,并且具有与UCSC网站相同的行为。GBiB实时从UCSC下载服务器加载基因组数据。每两周自动应用一次网站和数据更新。默认情况下,GBiB使用VirtualBox虚拟化软件,因此可以在任何操作系统、Windows、OSX和Linux。它不需要VirtualBox,虚拟机映像可以轻松转换为VMWare或HyperV。为了增加隐私,您可以下载基因组和注释跟踪您需要的GBiB,甚至可以在笔记本电脑上离线使用。

    • 赞成的意见:
      • 安装相对简单:下载并双击。
      • 默认情况下,软件和数据更新由UCSC通过每周运行的更新脚本远程管理。
      • 渲染本地BAM/bigWig/bigBed文件时的最佳性能。
      • 无需Unix Web服务器,可在任何操作系统上运行。
      • 对于商业用户:与完整的多座位手动许可相比,点击式许可更容易。
    • 欺骗:
      • 需要免费的VirtualBox软件或商业虚拟化系统。
      • 默认情况下,需要为MariaDB打开至少三个到UCSC的传出端口,Rsync下载并在防火墙中BLAT。下载所有数据后,不需要打开端口。
      • 为了获得最大的浏览速度,可能需要高达2-6TB的容量来存储所有基因组注释轨迹,就像手动本地安装一样。
  4. 使用基因组浏览器安装脚本(GBIC)进行本地安装

    只有当以上选项都不满足您的需求时,我们才建议您这样做。我们的GBIC安装脚本将安装UCSC网站的完整本地镜像,对于您选择的程序集。我们支持及时安装镜像站点允许并拥有世界范围内基因组浏览器的许多功能镜像。对于详细信息,请参见下面的部分.

    • 赞成的意见:
      • 在虚拟机或云实例上安装相对简单:只需运行脚本即可。
      • 渲染本地BAM/bigWig/bigBed文件时的最佳性能。
      • 对于商业用户:与完整的多座位手动许可相比,点击式许可更容易。
    • 欺骗:
      • 为了跟上基因组浏览器中的变化,您必须安装linux包和将来自己更新linux发行版并使用“update”命令运行安装脚本利用基因组浏览器中的新功能。
      • 最好在其他情况下不使用的linux服务器上运行。
      • 默认情况下,需要为UCSC打开至少三个传出端口MariaDB和BLAT在您的防火墙中。下载所有数据并BLAT后本地设置,不再需要打开的端口。
      • 要获得最大浏览速度,可能需要高达2-6TB的容量来存储所有基因组注释轨迹。
  5. 按照安装说明手动安装

    我们确实提供逐步说明书对于本地安装,但如果其他系统适合您,则不建议这样做。互联网上也有各种带有说明的页面,但这些页面经常被删除日期为,以后可能会导致问题。有关手动说明的详细信息,请参阅这个下面的部分.

    • 赞成的意见:
      • 您将了解基因组浏览器的完整设置。
      • 对于商业用户:可以根据您的需要定制许可协议。
    • 欺骗:
      • 即使对于经验丰富的Unix管理员来说,设置也不容易。
      • 可能需要通过基因组镜邮件列表。
      • 要跟上基因组浏览器中的变化,您必须在中安装linux包并自己更新linux发行版使用rsync或MariaDB表加载自行更新未来和应用UCSC数据
      • 我们这边的配置更改可能会破坏您的设置。
      • 要获得最大浏览速度,可能需要高达2-6TB的容量来存储所有基因组注释轨迹。
      • 对于商业用户:许可协议谈判需要更长时间,无需点击许可。

基因组的商业下载和/或安装需要许可证浏览器二进制文件和源代码。学术、非营利、,和个人使用。要购买许可证,请参阅我们的许可证说明或访问基因组浏览器存储.

使用GBiC安装程序在本地安装基因组浏览器

如果您不想使用我们准备好的虚拟机Genome-Browser-in-a-Box,我们提供了一个云中基因组浏览器(GBiC)安装程序在所有主流Linux上建立一个功能齐全的镜像分配。

它已经在Ubuntu 18和20、RedHat/CentOS 7和8、,和Fedora 20。最好在全新的Linux上执行安装安装,因为它会停用Apache中的默认站点配置文件并用大量数据库填充MariaDB目录。实现这一点的最简单方法是在新的虚拟机中运行Cloud程序中的Genome Browser。该程序也适用于Docker和云计算虚拟机,并已在亚马逊、微软和谷歌。

与GBiB一样,GBiC安装的镜像可以从UCSC加载注释数据或本地数据库副本。如果从UCSC加载数据并使用云计算提供商,建议您在美国西部运行实例海岸/旧金山湾区或圣何塞数据中心;否则,数据加载可能是非常慢。

要运行安装程序,请参阅GBiC用户指南.

Docker安装说明

将Dockerfile下载到新目录并构建docker映像。这适用于Windows、OSX和Linux,只要安装了Docker:

mkdir浏览器驳接器&&cd浏览器驳接程序wget公司https://raw.githubusercontent.com/ucscGenomeBrowser/kent/master/src/product/installer/docker/Dockerfiledocker构建-t GB图像

然后可以在守护程序模式(-d)下运行刚刚构建为新容器的gbimage映像,并将其端口导出到localhost:

docker run-d--名称genomeBrowser-p 8080:80 gbimage

Apache服务器正在8080端口上运行,您应该可以通过以下方式访问它https://localhost:8080(本地主机:8080)

手动安装说明

请参见镜像手册.html:如果安装程序有无法在linux发行版上运行,或者您更喜欢对您的镜子,我们提供这些分步安装说明书包括Apache的配置,MariaDB、基因组浏览器CGI、临时文件删除和其他主题,如通过代理加载数据。

以下外部网站不是UCSC创建的员工和质量各不相同,但在上安装时可能会有所帮助不寻常的平台。

使用UDR加速下载

UDR公司(UDT Enabled Rsync)是一种非常有效的下载协议远距离发送大量数据。UDR利用rsync作为传输机制,但通过UDT协议发送数据。UDR不由UCSC编写或管理。它是一个开源工具高级计算实验室在芝加哥大学。它已经在Linux、FreeBSD和Mac OSX下进行了测试,但可能在其他UNIX变体下工作。源代码可以通过github.使用GBIC安装时程序-u个选项将对所有下载使用UDR。

如果您只是偶尔手动下载数据,则没有需要改变你的方法;继续访问我们的下载服务器下载您需要的文件。这项新协议已经实施主要是为了方便长距离快速下载大量数据。

对于典型的基于TCP的协议,如http、ftp和rsync,传输速度随着下载源和目标之间的距离增加,速度会变慢。UDT/UDR等协议允许许多UDP数据包成批发送,因此可以在较长时间内实现更高的传输速度距离。UDR对正在下载的用户特别有用从遥远的地方到加利福尼亚州。美国东海岸和在以下情况下,国际社会可能会看到更高的下载速度使用UDR与rsync、http或ftp进行比较。

如果您需要帮助构建UDR二进制文件,或者对如何构建UDR二进制文件有疑问UDR函数,请阅读GitHub页面上的文档,如果如有必要,请通过GitHub页面联系UDR作者。我们建议阅读UDR GitHub页面上的文档以更好地理解UDR的工作原理。UDR是用C++编写的。它是开源的,并已发布在Apache 2.0许可证下。为了让它发挥作用,你必须您的系统上安装了rsync。

为方便起见,我们为Red Hat Enterprise Linux 6.x(或CentOS 6或Scientific等变体Linux 6)。您会发现64位和32位rpm在这里.

一旦您有了一个有效的UDR二进制文件,可以通过从源代码构建,也可以通过安装rpm后,您可以从我们的以类似于rsync的方式下载服务器。例如,使用rsync,hg19的所有MariaDB表可以使用以下两个命令之一下载数据库:

rsync-平均值rsync://hgdownload.soe.ucsc.edu/mysql/hg19//my/local/hg19/rsync-avP hgdownload.soe.ucsc.edu::mysql/hg19//my/local/hg19/

使用UDR非常相似。用于下载相同数据的UDR语法将是:

udr rsync-avP hgdownload.soe.ucsc.edu::mysql/hg19//my/local/hg19/

基因组镜像邮件列表

有关安装和镜像UCSC基因组浏览器的问题,请联系UCSC邮件列表&#103&#101&#110&#111&#109&#101&#45&#109&#105&#114&#114&#111&#114&#64&#115&#111&#101&#46&#117&#99&#115&#99&#46&#101&#100&#117.发送到此地址的消息将发布经审核的基因组镜像邮件列表,该列表存档在SEARCHABLE PUBLIC上谷歌群组论坛.