HTSeq公司

HTSeq–一个用于处理高吞吐量排序数据的Python框架。动机:在分析高通量测序(HTS)数据时,许多标准任务都有大量的工具可供选择。然而,一旦项目偏离了标准工作流,就需要定制脚本。结果:我们提出了HTSeq,一个Python库,以促进此类脚本的快速开发。HTSeq为HTS项目中的许多常见数据格式提供解析器,以及表示诸如基因组坐标、序列、测序读取、比对、基因模型信息、变体调用等数据的类,并提供允许通过基因组坐标进行查询的数据结构。我们还介绍了htseq count,一个用htseq开发的工具,通过计算读取与基因的重叠来预处理RNA-Seq数据以进行差异表达分析。可用性:HTSeq是根据GNU通用公共许可证发布的开源软件,可从http://www-huber.embl.de/HTSeq或者从Python包索引https://pypi.python.org/pypi/HTSeq。