×

比较基因发现。模型、算法和实现。第2版。 (英语) Zbl 1350.92001年

计算生物学20.伦敦:施普林格出版社(ISBN 978-1-4471-6692-4/hbk;978-1-447 1-6693-1/电子书)。xx,第382页。(2015).
正在审查的这本书是第一版的更新和修订版,其中特别包含了一个新的章节,描述了基于下一代测序(NGS)的用于基因预测的工具和方法。本书分为八章,首先介绍了所需的概念,如中心法则、基因结构和定义基因位置的常见挑战。作者还包括基因发现算法的历史概述。本章最后简要描述了构建基因搜寻器的四个步骤。第二章讨论了利用隐马尔可夫模型进行单物种基因发现。首先,介绍了马尔可夫链和动态规划的要素。接下来,讨论了正向、反向和维特比算法。作为一个例子,作者介绍了原核生物基因查找器EasyGene。在接下来的部分中,将介绍广义隐马尔可夫模型(GHMM)和插值马尔可夫模式(IMM)。作为示例,讨论了基于GHMM的Genscan和基于IMM的GLIMMER。本章还描述了基于神经网络(以GRAIL为例)、决策树(以MORGAN为例)和条件随机场(以Conrad为例)的方法。在第三章中,作者回顾了两两和多序列比对。对于前者,讨论了核苷酸和氨基酸取代模型,然后介绍了Needleman-Wunsch和Smith-Waterman算法。为了确保对多序列比对进行彻底描述,作者首先概述了渐进比对和其他迭代方法的评分方案和方法。接下来,讨论了各种方法,并附有示例。作为HMM的应用,作者介绍了SAM–序列比对和建模;对于遗传算法,示例是SAGA–通过遗传算法进行序列比对;对于模拟退火,示例是MSASA,它通过迭代重排产生多重比对。在第四章中,作者描述了基于以下两种方法的比较基因发现
(i)
相似性搜索(GenomeScan,一种基于GHMM的同源性基因查找方法),
(ii)
启发式跨物种方法(ROSETTA),
(iii)
配对隐马尔可夫模型(DoubleScan),
(iv)
广义对隐马尔可夫模型(SLAM),
(v)
基因图谱(GeneMapper)和
(vi)
多序列基因发现(N扫描)。
第五章是基因结构子模型。首先,描述了状态空间,包括外显子、剪接位点、内含子和基因间区域、未翻译区域和启动子。接下来,讨论状态长度分布,然后讨论内容传感器,如GC含量、密码子和氨基酸用法以及(k)元组频率分析。本章最后介绍了检测剪接位点的方法,包括权重矩阵和权重阵列模型、可变长度马尔可夫模型、最大相关分解等。第六章介绍了基因发现算法的参数搜索;详细讨论了MLE、EM和Baum-Welch。文中还介绍了反向传播算法、判别训练、吉布斯采样和模拟退火。第七章重点介绍了比较基因查找器的实现。首先,描述了程序结构,然后以GPHMM模型为例,该模型用于建模内含子、基因间对和外显子对。在第八章中,作者提出了下一代测序数据的注释管道。本章首先简要概述DNA测序和当前NGS技术。接下来,作者提出了NGS注释管道,用于调查装配质量,并可用于重复掩蔽和基因注释。例如,MAKER结合了基因组注释的各种证据来源,其输出与常用的GMOD程序(如GBROWSE和JBROWSE)兼容。
这本书的结构反映了理解如何进行基因发现的学习步骤。虽然它是用一种容易理解的语言编写的,但它需要对它所涵盖的各个领域有一些先验知识,例如概率论、统计学、信息论、最优化理论和数值分析。其目标受众主要是研究生研究人员或在生物信息学中应用数学或统计学背景的资深研究人员,他们需要对该领域进行全面而简明的概述。

MSC公司:

92-02 与生物学有关的研究博览会(专著、调查文章)
92-08 生物问题的计算方法
92C40型 生物化学、分子生物学
92D10型 遗传学和表观遗传学
60J22型 马尔可夫链中的计算方法
92B20型 生物研究、人工生命和相关主题中的神经网络
90立方厘米 动态编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部