×

RNA生物信息学。 (英语) Zbl 1318.92003年

分子生物学方法1269.纽约州纽约市:Humana Press/Springer(ISBN 978-1-4939-2290-1/hbk;978-1-493 9-2291-8/电子书)。xii,第415页。(2015).
本文是一本及时的书,概述了分析RNA数据的方法学方法的现状,从预测其二级或三级结构到分析大量RNAseq数据。这本书分为三部分。第一部分介绍了预测和理解RNA结构的方法。第二部分重点分析高通量RNA测序数据,第三部分介绍用于RNA数据分析的网络资源。
第一部分首先概述了用于预测二级RNA结构的自由能最小化方法,如RNAfold和McCaskill方法。接下来,作者介绍了预测结构、RNA有害突变及其用于计算RNA设计所需的某些方法细节。第二章重点介绍一种预测次级结构的替代方法,一种基于多重比对的方法。从一个突出两种方法之间差异的示例开始,作者继续概述了从对齐序列进行结构预测的常用工具。接下来,详细介绍了基于碱基对序列协变和使用系统发育(进化)信息的方法。还讨论了MEG估计量的使用、概率模型(p(θ|A)和增益函数(G(θ,y))的选择。本章最后提出了预测RNA-RNA相互作用和确定两个对齐RNA序列的共同联合结构的数学相关问题。在第三章中,提出了一个简单的RNA全局成对比对推断方案。在简要描述了将要使用的计算方法和相应的测试数据集之后,作者继续比较算法的性能,并通过示例对结果进行了评论。第四章重点研究了利用RNAProfile发现二级结构中的从头基序。作者详细描述了该算法,包括候选区域的选择,以及使用启发式方法识别基序。还包括该工具的运行示例以及所涉及参数的描述。本章最后列举了几个例子。第五章着重于RNA二级结构的绘制和编辑。从RNA可视化目标概述和现有工具概述开始,作者详细介绍了RNA二级结构的常用文件格式及其典型表示:线性布局、圆形布局、波形图和树布局。作者还讨论了伪结和交互的3D表示。在第六章中,作者讨论了RNA 3D结构的预测和建模。从碱基配对相互作用的分类开始,作者接下来重点关注RNA模体的作用和预测RNA三级结构的步骤,包括预测二级结构支架和使用带有模体插入的相互作用图。本章最后概述了从碱基配对相互作用网络重建三级结构的方法。第一部分的最后一章着重于使用启发式方法快速预测RNA-RNA相互作用。在描述测试数据集之后,作者详细描述了RNA二级结构预测算法、RNA-RNA相互作用预测步骤以及优化运行时间的方法的并行化。
本书的第二部分介绍了高通量RNA测序数据的分析。第八章首先概述了质量检查方法。从fastq数据得出的测序质量开始,接下来介绍核苷酸组成和PCR扩增的效果。作者还讨论了tRNA/rRNA污染、测序深度的饱和测试、重复之间的再现性、覆盖均匀性和读入不同注释类的分布。在第九章中,作者回顾了RNAseq数据的映射,解决了硬件和软件的局限性和特点。详细介绍了拼接映射方法,包括半读映射、种子选择和扩展以及连接搜索。还讨论了从连接读取路线中检测连接。在第十章中,作者讨论了使用RNAseq数据进行转录组量化,重点是基于一系列R(右)用于检测差异表达的mRNA和miRNA的包装。作者详细介绍了所需的R(右)库。还包括序列比对、后处理和使用DESeq检测差异表达转录物等步骤。第十一章介绍了RNAseq的另一个方面,转录组组装和选择性剪接的分析,重点是PIntron方法。首先,作者描述了安装要求和输入数据。接下来,广泛审查管道和执行细节,如参数范围和要求。还讨论了各种输出格式,包括GTF文件和JSON。在第十二章中,作者回顾了检测转录后RNA编辑事件的简单(简单且可重复)计算协议,以人类RNAseq和DNAseq为例。作者首先概述了硬件和软件先决条件以及安装REDItools的步骤。接下来,介绍了该方法,包括关于RNAseq读取映射、SAM到BAM转换、BLAT校正(可选)以及使用匹配的DNAseq和RNAseque检测RNA编辑候选项的建议。第十三章对miRNA靶点的预测进行了广泛的回顾。从最新技术的概述开始,作者继续介绍预测目标所需的生物背景。本文详细讨论了miRNA-mRNA相互作用的特点以及将其纳入预测算法的方式。还包括miRNA在线数据库和预测工具的概要。本章以miRNA功能注释工具结束,使用高通量实验中提供的信息。在第十四章中,作者继续讨论了miRNAs,重点是使用深度测序数据来识别成熟miRNAs中的编辑位点。在描述了诸如低质量读数的过滤和适配器的修剪、基因组比对和miRNA前体的误匹配映射的初始步骤之后,作者重点讨论了如何使用二项式统计来识别和消除测序错误,以及从统计显著性修改列表中删除SNP的方法。在第十五章中,作者提出了RNAseq数据的自动分析工作流:NGS-Trex,并以人类mRNAseque数据为例。在对管道进行概述之后,接下来将介绍各个步骤。这些包括数据提交、预处理、序列映射和注释。本工作流程中还包括数据挖掘和统计方法。在第十六章中,作者提出了一种方法,使用e-DNA元代码将NGS原始数据与分类分析联系起来,以人类微生物为例。详细描述了用于此分析的SFF工具。特别关注去噪过程和分类分类。下一章,即第十七章,介绍了元翻译数据的破译方法。它包括SortMeRNA工具、其输入和输出以及所需参数的详细描述。这些例子集中在rRNA的分类上。在本部分的最后一章中,作者概述了一种确定RNA-蛋白质相互作用的测序方法,RIPseq;还讨论了它的变体。首先,作者概述了测序数据的生物信息学分析,详细介绍了参考基因组的映射、读取计数的使用以及与RNAseq或ChipSeq的相似性。在工具方面,介绍了RIPSeeker和PARalyzer。
本书的第三部分介绍了RNA数据分析的网络资源。第十九章描述了维也纳RNA网络服务,通过产生二级结构和提供考虑RNA-RNA杂交的高效序列设计,在分析非编码RNA方面的应用。在概述了硬件和软件要求以及可接受的输入数据格式之后,作者详细描述了使用RNAfold网络服务器预测二级结构,使用RNAalifold和RNAcofold的RNA-RNA相互作用预测共识二级结构。本章最后概述了RNA设计工具(如RNAiverse网络服务器)以及使用屏障服务器分析折叠动力学。在第二十章中,作者介绍了ExpEdit,一种用于探索RNAseq数据的RNA编辑潜力的工具。在描述了技术要求之后,作者继续对该方法进行详细描述,然后使用ExpEdit GUI进行实际操作。第二十一章是作为注释UTR网站集中5'和3'非翻译区域(UTR)及其顺调控区域的指南而建立的。作者讨论了如何检测和提取相关的直向同源序列,如何推断它们的二级结构,以及如何生成和使用MotifPattern。第二十二章介绍了RFAM,它是非编码RNA序列的集合。在讨论了如何将转录本组织成家族和宗族之后,作者详细介绍了序列搜索的方法和检索家族信息的步骤。本章最后给出了有关浏览数据库或从ftp站点下载数据库的建议。在第二十三章中,作者介绍了如何使用ASPIcDB,一个用于选择性剪接分析的数据库。作者讨论了典型分析的所有步骤,并为每个步骤提供了建议和屏幕截图。第二十四章介绍了另一种替代拼接工具。作者使用AStalavista工具分析定制基因数据集中的选择性剪接事件。本章首先详细介绍如何安装工具和检索RNAseq比对。接下来,作者详细介绍了该方法并提供了使用GENCODE的示例。在最后一章中,作者讨论了人工RNA分子的计算设计及其在基因调控中的应用。在对主题进行了最新描述之后,作者讨论了功能性sRNAs设计的组成部分,并概述了可用的在线资源。本章最后介绍了该方法在抗肿瘤药物和有效miRNA海绵设计中的应用。
尽管这本书写得很通俗易懂,但它需要在生物信息学和生物学方面有广泛的背景知识。尽管如此,作者经常结合大量参考文献,对领域和技术现状进行充分描述。这本书的主要优点是,它包含了吸引生物信息学家寻求其建议方法适用性和生物学家寻求特定生物问题答案的要素。

MSC公司:

92-06 与生物学有关的论文集、会议、文集等
92B05型 普通生物学和生物数学
92D10型 遗传学和表观遗传学
92D20型 蛋白质序列、DNA序列
92E10型 分子结构(图论方法、微分拓扑方法等)
00B15号机组 杂项特定利益物品的收集
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接