nar的徽标Link to Publisher's site
PMC全文:
2013年4月3日在线发布。 数字对象标识:10.1093/nar/gkt214

图2。

保存图片、插图等的外部文件。对象名为gkt214f2p.jpg

在种子-标记范式下检测外显子-外显子连接的示意图。两次扫描程序用于检测外显子-外显子连接并确定每次读取的映射。使用三个人工读取来说明此过程(读取1、读取2和读取50)。在第一次扫描中,从每次读取中提取一组子读取并映射到参考基因组。从每次读取中选择获得两个最多票数的两个最佳映射位置以供进一步考虑。如果在这两个位置和总大小之间发现供体和受体部位(保存图片、插图等的外部文件。对象名称为gkt214i1.jpg)参考中两个映射区域的大小等于(L(左))在由投票选出最佳两个映射位置的子阅读跨越的阅读区域中,确定的剪接点将记录在假定的外显子-外显子连接表中。还记录了基因组中和读数中每个读数的锚定位置,这分别给出了读数最佳映射到的映射位置和投票给该位置的一组提取子读数的最左边碱基的位置。锚定位置将用于检索假定的剪接点,并用于第二次扫描进行的验证。第一次扫描应用于所有读取,完成时生成两个表。这两个表分别包括每个外显子-外显子连接处的假定剪接点的染色体位置和每个读取的锚定信息。第二次扫描的输入包括这两个表以及读取的数据。对于每次读取,第二次扫描使用其锚定位置从第一次扫描的连接表输出中搜索位于读取范围内的假定拼接点,然后检查所有映射可能性(包括将读取映射为外显子读取),以最终确定应如何映射读取。当它被映射为连接读取时,读取序列和映射区域之间的相似性必须大于被映射为外显子读取时的相似性(即。保存图片、插图等的外部文件。对象名为gkt214i2.jpg),如果它被称为连接读取。当假定读取不包含连接时,青色虚线指示读取的第一个基址或最后一个基址的映射位置。如果在第二次扫描完成后发现假定拼接点没有任何支持读取,则从最终结果中删除这些拼接点。此两次扫描程序的最终输出是一个验证的外显子-外显子连接表,其中包括支持读取的数量,以及每个读取的完整映射结果,包括CIGAR字符串,其中描述了每个读取中的每个碱基是如何映射的。

本文中的图像

  • 图1。
  • 图2。
  • 图3。
  • 图4。

单击图像以查看更大的版本。