跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https公司

网站是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2008;9(12):R175。
doi:10.1186/gb-2008-9-12-r175。 Epub 2008年12月16日。

用大规模RNA测序注释基因组

附属公司

用大规模RNA测序注释基因组

法国德诺等。 基因组生物学. 2008.

摘要

下一代技术支持大规模cDNA测序(即RNA-Seq)。主要是因为难以对齐外显子-外显子连接上的短阅读,所以到目前为止还没有尝试使用RNA-Seq从头构建基因模型,也就是说,在缺乏一组已知基因和/或剪接事件的情况下。我们提出了G-Mo.R-Se(Gene Modelling using RNA-Seq),这是一种直接从RNA-Seq构建基因模型的方法,并证明了其在葡萄基因组中的实用性。

PubMed免责声明

数字

图1
图1
G-Mo.R-Se公司基于短阅读的基因模型构建方法五个黑框显示了方法的五个步骤。步骤1(covtig构造)是covtigs(覆盖连续)的构造,它是从短读映射到给定深度阈值以上的位置构建的。第2步(候选外显子)是定义从每个新变异体衍生的单链候选外显子列表。在每个covtig边界周围搜索100个核苷酸,以确定候选外显子在正向或反向链上的方向,如第二个方框所示。第3步(连接验证)包括使用根据未映射读取构建的单词词典验证候选外显子之间的连接。在步骤4(通过验证连接链接的候选外显子图)中,将创建一个图,其中节点是候选外显字(黑框),两个节点之间的定向边(紫色箭头)表示验证连接。最后连接的两个组分显示了一个分裂基因的例子,可以使用开放阅读框检测第一个模型的最后一个外显子和第二个模型的第一个外显字之间的基因进行校正。在最后一步,即第5步(模型构建和编码序列检测)中,我们将遍历前面的图,并提取每个源和每个汇之间的所有可能路径。然后,每个路径将表示一个预测的转录本,并为每个转录本标识一个CDS。M型1,男2,男5和M7(未翻译区域为灰色,内含子为黑色,编码外显子为红色)正确模拟真实转录物T1,T型2,T型和T5(未翻译区域为灰色,内含子和外显子分别用黑线和方框表示)。由于所有可能的路径都是从图中提取出来的,因此其中一些可能与真实的转录本不对应(例如,模型M,男4和M6).
图2
图2
参考基因重叠的读取覆盖深度G-Mo.R-Se公司模型和天鹅绒轮廓对于重叠在其核苷酸≥75%上的基因,通过以下公式绘制出基因所有外显子核苷酸的平均深度(log)分布G-Mo.R-Se公司模型(红线)和天鹅绒contig(紫色虚线)。y轴对应于每个箱子中参考基因的百分比(箱子宽度为0.2)。
图3
图3
cDNA簇中唯一32-mers的比例显示了由模型重叠在75%以上核苷酸(绿色)上的cDNA簇和未由模型重叠的cDNA集群的独特32单体百分比(红色)。y轴对应于每个bin中cDNA簇的百分比(bin宽度是集群中所有32-mers中唯一32-mers的10%)。
图4
图4
重叠cDNA位点和不重叠cDNA的模型的读取覆盖深度对于重叠cDNA在其核苷酸(绿色)上≥50%的模型和不重叠cDNA的模型(黑色),绘制了模型所有外显子核苷酸的平均深度(log)分布。y轴对应于每个箱子中模型的百分比(箱子宽度为0.2)。
图5
图5
根据短阅读构建的可选拼接模型示例图中显示了从葡萄藤第12染色体在3836500 bp和3840500 bp之间。第一首曲目(Genoscope注释)包含[44]中的自动注释。绿色模型是Uniprot蛋白质的GeneWise比对。对齐葡萄属[44]中的cDNA是红色的,并且是公开的葡萄属EST为浅绿色。下一个轨迹显示了预测的模型G-Mo.R-Se公司(未翻译区域为灰色,CDS为红色)。初始covtig显示为棕色方框(covtigs的平均深度写在每个covtig.下方)。天鹅绒胸像的排列以紫色显示。从头算由geneID[51]和SNAP[52]产生的模型分别以蓝色和粉色显示。短读覆盖深度绘制在最后一条轨迹上(黑色):红色虚线显示用于构建covtigs的阈值。M型2被众多资源证实,模型M似乎是一种次要的替代剪接形式(它仅由两个公共EST支持:E1和E2)和M型1是一种新型的替代拼接形式。

类似文章

  • RNA-Seq:一种综合转录组分析方法。
    Nagalakshmi U、Waern K、Snyder M。 Nagalakshmi U等人。 当前原摩尔生物。2010年1月;第4章:单元4.11.1-13。doi:10.1002/0471142727.mb0411s89。 当前质子分子生物学。2010 PMID:20069539
  • 应用于花发育的下一代测序:RNA-seq。
    何杰、焦毅。 何杰等。 方法分子生物学。2014年;1110:401-11. doi:10.1007/978-1-4614-9408-923。 方法分子生物学。2014 PMID:24395272
  • 利用RNA-Seq研究葡萄果实发育过程中的转录复杂性。
    Zenoni S、Ferrarini A、Giacomelli E、Xumerle L、Fasoli M、Maleba G、Bellin D、Pezzotti M、Delledonne M。 Zenoni S等人。 植物生理学。2010年4月;152(4):1787-95. doi:10.1104/pp.109.149716。Epub 2010年1月29日。 植物生理学。2010 PMID:20118272 免费PMC文章。
  • 使用RNA-seq数据表征和注释基因组。
    陈刚,史涛,石磊。 Chen G等。 中国生命科学。2017年2月;60(2):116-125. doi:10.1007/s11427-015-0349-4。Epub 2016年6月13日。 中国生命科学。2017 PMID:27294835 审查。
  • 为非模式植物物种设计转录组下一代测序项目。
    Strickler SR,Bombarely A,Mueller LA。 Strickler SR等人。 《美国医学杂志》,2012年2月;99(2):257-66. doi:10.3732/ajb.1100292。Epub 2012年1月19日。 《美国医学杂志》,2012年。 PMID:22268224 审查。

引用人

工具书类

    1. Holt RA,Jones SJ。流式细胞测序的新范式。基因组研究2008;18:839–846. doi:10.1101/gr.073262.107。-内政部-公共医学
    1. Mardis ER。下一代DNA测序方法。《基因组学与人类遗传学年鉴》。2008;9:387–402。doi:10.1146/annurev.genom.9081307.164359。-内政部-公共医学
    1. Korbel JO、Urban AE、Grubert F、Du J、Royce TE、Starr P、Zhong G、Emanuel BS、Weissman SM、Snyder M、Gerstein MB。系统预测和验证与人类基因组中拷贝数变异相关的断点。美国国家科学院院刊2007;104:10110–10115. doi:10.1073/pnas.0703834104。-内政部-项目管理咨询公司-公共医学
    1. Chen W、Kalscheuer V、Tzschach A、Menzel C、Ullmann R、Schulz MH、Erdogan F、Li N、Kijas Z、Arkesteijn G、Pajares IL、Goetz-Sothmann M、Heinrich U、Rost I、Dufke A、Grasshoff U、Glaeser B、Vingron M、Ropers HH。通过下一代测序绘制易位断点。基因组研究2008;18:1143–1149. doi:10.1101/gr.076166.108。-内政部-项目管理咨询公司-公共医学
    1. Cokus SJ、Feng S、Zhang X、Chen Z、Merriman B、Haudenschild CD、Pradhan S、Nelson SF、Pellegrini M、Jacobsen SE。拟南芥基因组的霰弹枪亚硫酸氢盐测序揭示了DNA甲基化模式。自然。2008;452:215–219. doi:10.1038/nature06745。-内政部-项目管理咨询公司-公共医学

出版物类型

LinkOut-更多资源