HISAT公司是一种快速灵敏的拼接对准程序,用于绘制RNA-seq读数。除了一个代表整个基因组的全球FM指数外,HISAT还使用了一大组小的FM指数,这些指数共同覆盖了整个基因组(每个指数代表约64000 bp的基因组区域,覆盖人类基因组需要约48000个指数)。这些小指数(称为局部指数)与几种比对策略相结合,可以有效地比对RNA-seq读码,尤其是跨越多个外显子的读码。HISAT的内存占用相对较低(人类基因组约4.3GB)。我们根据鲍蒂2实现来处理FM索引上的大多数操作。
开源软件

现场地图

新闻和更新

    新版本和相关工具将通过Bowtie发布邮件列表.

获取帮助

发布

索引

智人,UCSC hg19 7.0 GB
小M,UCSC mm10 6.4 GB

HISAT的当前版本不使用索引中的某些文件,因此实际内存需求远低于索引大小。例如,HISAT对人类基因组的内存占用约为4.3GB。

相关工具

出版物

贡献者

链接

HISAT2公司发布日期:2015年9月7日

  • HISAT2公司是HISAT和TopHat2的继承者。我们建议HISAT和TopHat2用户切换到HISAT2。

HISAT 0.1.6基准发布日期:2015年4月17日

  • 在SAM输出中添加NH标签以指定对齐数量。
  • 修复了一个bug,该bug的-s/--summary选项在hisat-inspect中不起作用。
  • 多亏了George Young,重写了extract_splice_sites.py以更好地处理各种GTF文件。
  • 当提供已知或新的剪接位点时,通过防止读数被映射到假基因来提高比对准确性(-已知的剪接位点-中缝/-新的剪接位点-中缝)。
  • 不允许读取具有不匹配的短锚点。

HISAT源可用于公共GitHub存储库(3/30/2015).

HISAT论文于2015年9月3日在《自然方法》杂志上发表

HISAT 0.1.5β版本2015年2月25日

  • HISAT现在能够直接处理SRA数据:既可以通过互联网按需下载,也可以预取到本地磁盘。
    • 使用新的NGS API(https://github.com/ncbi/ngs)由NCBI的SRA工具包团队创建和发布。
    • 例如,可以使用SRA数据(SRR353653)运行HISAT,如下所示。
      hisat-x/path/to/index--sra-acc SRR353653
    • 这样就无需手动下载SRA读取并将其转换为fasta/fastq格式,而不会影响运行时。
    • 与SRA Toolkit安装创建的环境兼容,并利用对受dbGaP保护的数据以及缓存文件下载的任何现有权限。
  • --笔插入选项处理正确。
  • 引入了两个新选项,--min-intronlen和--max-intronren,使用户可以指定最小和最大插入长度。

HISAT 0.1.4-beta发布日期:2015年1月30日

  • 次佳对齐(XS:i)的对齐分数不再报告,因为它与XS:A标记冲突。XS:诸如Cufflinks和StringTie之类的转录汇编程序需要标记。
  • 改进了包含多个内含子的对齐精度。

HISAT 0.1.3-beta发布日期:2015年1月27日

  • 修复了偶尔出现的运行时错误。
  • 修复了一个python脚本extract_splice_sites.py,以正确处理基因注释文件(GTF文件)。

的预打印版本HISAT手稿于2014年12月12日提供


HISAT 0.1.2-beta发布日期:2014年3月11日

  • 此版本改进了对齐灵敏度和拼接站点发现。

HISAT 0.1.1-发布日期:2014年7月29日

  • 这个版本支持任何大小的基因组,大于40亿个碱基对(参见手册).

HISAT 0.1.0-版本7/10/2014

  • HISAT的首次发布。