×

RNA序列、结构和功能:计算和生物信息学方法。 (英语) Zbl 1307.92008号

分子生物学方法1097.纽约州纽约市:Humana出版社/Springer(ISBN 978-1-62703-708-2/hbk;978-1-6270 3-709-9/电子书)。xi,第533页。(2014).
这本书是一本及时的补充,描述了为与非编码RNA(ncRNAs)相关的前沿课题开发的方法和途径。该书分为23章,包括对不同研究方向的综述,如RNA结构构建原理、基于多序列比对共识或随机上下文无关文法(SCFG)预测RNA结构的方法、基序发现、,RNA-RNA或RNA-蛋白质相互作用的系统发育分析或预测。
第一章回顾了一些与2D和3D RNA结构相关的生物学和计算概念、基于RNA的相互作用和一些类别的小RNA(如小干扰RNA和小RNA)。本章首先介绍了RNA二级结构的常用表示法,并介绍了RNA折叠的Nussinov算法。它继续采用基于交互信息的方法,根据多重比对推断二级结构。本章最后概述了RNA生物信息学中的开放问题,以及用于不同预测任务的基准列表。
第二章重点介绍RNA的性质,从酶的性质到信息的性质,包括对RNA本身和RNA折叠原理的简要描述。本章最后简要概述了RNA模体和RNA配体。
第三章描述了一种使用一组最近邻参数确定二级结构的方法,这些参数是通过熔化实验确定的。本章首先概述了该方法,说明了如何使用这些参数量化最终结构的稳定性。第二部分介绍了双态近似、非互补双分子折叠曲线的拟合和熔化温度的计算等实验步骤。作者还讨论了关于基线和热容变化的公认假设。接下来,结合结构信息参数估计方法,给出了最近邻规则。本章最后对提出的方法的几个版本进行了比较,并简要描述了可用的参数集合,包括实验确定的RNA参数和伪结参数。
第四章描述了使用基于能量的计算预测RNA二级结构的方法,即旨在确定最优和次优结构的动态规划方法,该方法处理了最小自由能(MFE)方法的不精确性。本章首先介绍应用于折叠问题的动态规划概念以及使用核糖体亚基的已知结构检查预测准确性的方法。接下来,介绍了分区函数,并给出了可靠性度量和可视化。本章继续描述次优折叠和MFE标准的替代方法,并以RNA折叠动力学的概念(如共转录折叠和折叠动力学的粗粒计算)结束。
第五章介绍了随机上下文无关文法(SCFGs),并为其在RNA二级结构分析中的应用提供了理论背景。在描述了语言、派生、范式、解析和歧义等概念之后,作者介绍了SCFG的规则以及将这些规则与隐马尔可夫模型(HMM)术语联系起来的方法。接下来,在SCFG上下文中讨论了RNA二级结构的分析,特别关注SCFG解析如何指示二级结构存在,以及如何处理语义歧义和语法设计及其权衡。
下一章介绍数据库背后的历史和术语,如:Noncode、miRbase、Rfam和SILVA。讨论了提交给这些数据库的条目的管理、手动注释与自动注释的优缺点以及序列数据库与对齐数据库的使用。接下来,介绍了四个数据库中每个数据库的独特特征,例如,非编码特征为“过程功能分类”(PFC)和布尔搜索引擎,布尔搜索引擎支持有效的数据挖掘,miRBase包含所有已知的miRNAs,Rfam是目前可用的最大的通用比对数据库,SILVA主要用于rRNA的正确鉴定。
第七章回顾了使用基于能量的一致性和多序列比对预测二级结构的方法。它首先分析功能RNA中的保守RNA结构,然后继续深入分析RNA alifold算法。作者详细描述了多重比对的平均能量最小化和基于RIBOSUM矩阵的协方差得分及其改进版本。还包括RNAlifold的逐步指南。本章最后概述了替代方法和新方法。
第八章是对SCFG用于RNA二级结构预测的实际描述。从SCFG的描述开始,本章继续介绍一系列算法,如基本CYK(Cocke-Younger-Kasami)、最高概率解析和内外算法。讨论包括SCFG和热力学模型之间的客观比较(在前几章中描述),以及对pfold的描述——使用系统发生学对SCFG模型的扩展。
第九章重点介绍了Rfam广泛使用的无间道和协方差模型(CMs)在注释archeon的功能RNA中的作用,反刍甲烷杆菌,如示例所示。首先,介绍了家族特异性RNA搜索方法,然后详细描述了概率CM。接下来,将介绍无间道,并提供其使用的逐步指南;接下来是关于其预测的注意事项/警告列表。本章最后将无间道方法与其他特定于家族的方法进行了比较。
在第十章中,作者将ncRNAs的预测范围缩小到特定类别,如tRNAs、snoRNAs或miRNAs,以特定的序列基序和结构特征为特征,并详细描述了一种三层方法,包括敏感性筛选、特异性选择和预测评分。本章首先介绍tRNAs及其预测工具。接下来,介绍了rRNA和snoRNAs的生物学特性以及用于识别和靶向预测的工具。作者最后概述了新发现的RNA类,如Y RNA和穹窿RNA,它们也具有特定的二级结构。
第十一章介绍了确定RNA结构的新视角:RNA的抽象形状分析,它研究了RNA分子二级结构的完整玻尔兹曼系综。本章首先描述了MFE折叠上下文中的这种方法。接下来,详细介绍了数学框架,重点介绍了热力学方面、形状类的属性和计算任务。接下来,对RNA结构的表征进行了全面综述。本章继续介绍识别和表征代表性结构的计算方法,并给出了许多示例并进行了讨论。本章最后介绍了RNA形状软件包和相关软件。
第十二章继续对结构进行比较分析,使用伪结对相同或不同序列上形成的结构进行比较。作者讨论了用于同一序列上结构比较的第一个距离,如基对距离或Hausdorff距离,并继续讨论不同序列的方法。详细讨论了树编辑模型和距离。本章以伪结示例结束,并简要描述了使用对齐或替代编码的方法,代表了算法挑战的下一个前沿。
第十三章首先介绍RNA结构比对方法,然后从基于Sankoff的方法开始。首先,阐述了其原理,并以成对结构对准算法为例进行了说明。在简要描述了多种结构对齐方法之后,作者介绍了实现细节,并讨论了针对该问题开发的启发式方法。
第十四章重点介绍了用于结构比对的非Sankoff方法,并描述了如何从局部结构中提取候选对象、如何调整评分函数以及如何检查比对和结构的一致性。本章还包含基于非Sankoff方法构建的软件工具列表。
在第十五章中,作者讨论了新发现的模体(结构上的共性),这些模体可以提供对非编码RNA的额外描述。在描述CM finder发现路径之后,作者详细介绍了CM finder算法:启发式对齐、模型推理、重新对齐和模体评分。本章最后给出了来自Rfam和modENCODE数据的示例。
第十六章重点分析RNA结构的系统发育及其用于推断进化。首先,达尔文的进化理论(种群选择)被转换为数学语言和基本理论,并概述了系统发育树的入门概念。接下来,介绍了系统发育模型,并详细讨论了核苷酸替换问题,包括示例。然后介绍了从进化角度设计RNA结构,重点是进化的化学动力学。还讨论了准谱概念的优缺点以及从序列和结构到基因型和表型的转变。第三部分介绍了系统发育树的推断、基因组筛选的系统发育背景模型以及病毒和细菌的进化等应用。
第十七章介绍了RNA结构比对的生物学编辑,这是一门需要大量知识和创造力的艺术。作者介绍了RNA结构比对的第一批编辑器、算法和工具,以及控制它们的基本原理。接下来,使用示例详细介绍了一些工具,例如SARSE-semi自动化RNA结构编辑器。
第十八章介绍了3D RNA结构,提出了一种结合ParAlign和Infinal特性的流水线。首先,概述了概念,并详细描述了两种主要的建模类型:基于模板和无模板,包括可用软件列表。对于第一类,详细讨论了空间约束的满足性和模板搜索。对于后者,作者重点关注模型的局部和全局细化。
第十九章探讨了RNA表征的一个新方面:它与其他RNA分子的相互作用,即以其他RNA的调节方式靶向ncRNA。在概述了这种相互作用的一般原理之后,作者概述了忽略分子内结构的预测方法。接下来,讨论了考虑这些结构的方法,包括基于可达性的方法和基于一般关节结构的方法。本章最后对这些方法进行了比较分析。
第二十章介绍了RNA结构预测的另一个方面,即microRNA的预测,microRNA是一类特殊的ncRNA。在简要描述了它们的生物起源并概述了公开可用的数据库之后,作者将生物学要求转换为计算术语,并介绍了从头开始的miRNA预测。接下来,描述了基于理论特征的其他可用于miRNA预测的工具,作者总结了基于测序结果的工具RNAseq。
第二十一章以动物miRNA为例,讨论了基于比较基因组学的miRNA靶点识别。由于转化抑制所需的种子区域长度有限,潜在目标的数量超过了生物湿实验室的验证能力。因此,该方法基于3'非翻译区(3'UTR)、miRNA以及miRNA与其靶点之间的相互作用的守恒。提出了一种基于kmer保守性的保守性度量,并提出了基于系统发育分析的工具PHYLIP。
第二十二章讨论了非miRNA ncRNAs的设计,称为小干扰RNA(siRNAs)。在简要介绍了生物学背景之后,作者提出了基于siRNA的设计和机器学习方法来优化这一过程。本章最后介绍了基于可访问性辅助siRNA设计的工具。
这本书以第二十三章结束,重点是RNA-蛋白质相互作用。首先,作者介绍了RNA结合蛋白的功能作用及其对mRNA翻译或降解、mRNA编辑或mRNA稳定性的贡献。接下来,综述了最丰富的RNA结合域以及检测和量化这些相互作用的实验方法。本章最后概述了预测这些结合位点的计算方法。
这本关于RNA结构和功能的书适合研究生和研究生以及资深研究人员。这些概念被清楚地表达出来,并附有大量的例子,以便于理解,而不需要大量的先验知识;这本书也是一本有价值的综述,介绍了前沿研究方向的热点话题的最新进展。此外,每一章的价值都通过一系列近期已发表论文的广泛参考文献而得到了丰富,为每个研究主题的文献提供了可靠的起点。

MSC公司:

92-06 与生物学有关的会议记录、会议、收藏等
92D10型 遗传学和表观遗传学
92D20型 蛋白质序列,DNA序列
92比99 一般数学生物学

软件:

菲利普
PDF格式BibTeX公司 XML格式引用
全文: 内政部