摘要

带有R的计算基因组学为基因组数据分析的初学者提供了一个起点,也指导了更多高级从业者使用基因组学中的复杂数据分析技术。这本书涵盖了从R编程到机器学习和统计,再到最新的基因组数据分析技术的主题。文本提供了可访问的信息和解释,始终以基因组学背景为背景。这也包含了R中的实用且有良好文档记录的示例,因此读者可以通过简单地重用所提供的代码来分析其数据。由于计算基因组学是跨学科的,它需要不同背景的人有不同的起点。例如,生物学家可能会跳过基本基因组生物学的部分,从R编程开始,而计算机科学家可能会想从基因组生物学开始。 

阅读后:

  • 您将掌握R的基础知识,并能够深入研究R在计算基因组学中的特殊用途,例如使用Bioconductor软件包。
  • 您将熟悉统计、有监督和无监督学习技术,这些在数据建模和高维数据探索性分析中都很重要。
  • 您将了解用于对齐读取计数和基因组特征注释等任务的基因组间隔及其操作。
  • 您将了解高通量测序数据处理和质量检查的基础知识。
  • 你将能够进行序列分析,例如计算基因组部分的GC含量或寻找转录因子结合位点。
  • 您将了解基因组学中使用的可视化技术,如热图、元基因图和基因组轨迹可视化。
  • 您将熟悉不同高通量测序数据集的分析,如RNA-seq、ChIP-seq和BS-seq。
  • 您将了解集成和解释多组学数据集的基本技术。

阿尔图纳·阿卡林是柏林马克斯·德布吕克中心柏林医学系统生物学研究所生物信息学和Omics数据科学平台的组长和负责人。自2002年以来,他一直在开发用于分析和整合大规模基因组数据集的计算方法。他发表了这方面的大量著作。这本书的框架源自他自2015年以来每年组织和教授的计算基因组学课程。