跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
自然方法。作者手稿;PMC 2010年12月1日提供。
以最终编辑形式发布为:
2010年5月9日在线发布。 数字对象标识:10.1038/nmeth.1459
预防性维修识别码:项目经理2879396
美国国立卫生研究院:美国国立卫生研究院196783
PMID:20453866

单分子实时测序期间直接检测DNA甲基化

关联数据

补充资料

摘要

我们描述了通过单分子实时(SMRT)测序直接检测DNA甲基化,无需亚硫酸氢转化。在SMRT测序中,DNA聚合酶催化荧光标记核苷酸并入互补核酸链。产生的荧光脉冲的到达时间和持续时间产生聚合酶动力学信息,并允许直接检测DNA模板中的修饰核苷酸,包括N6-甲基腺苷、5-甲基胞嘧啶和5-羟甲基胞嘧啶。聚合酶动力学的测量是SMRT测序的固有部分,不会对初级DNA序列的测定产生不利影响。不同的修饰对聚合酶动力学的影响不同,从而可以区分它们。我们利用这些动力学特征来鉴定基因组样品中的腺苷甲基化,并表明,结合环形共识测序,它们可以实现以碱基对分辨率进行表观遗传修饰的单分子鉴定。这种方法适用于长读取长度,并且可能能够在甚至高度重复的基因组区域内绘制甲基化模式。

介绍

DNA甲基化,以其各种形式,被牵涉到在分类树的几乎每个分支的各种生物过程的调控中。例如,在某些细菌中,N6-甲基腺苷(mA)主要出现在GATC序列上下文中,有助于调节复制、错配修复途径和某些基因的表达1在植物中,5-甲基胞嘧啶(mC)出现在多序列环境中,每个序列都由不同的遗传机制控制2,脊椎动物体内的.5-甲基胞嘧啶通常出现在CG二核苷酸,这些二核苷酸通常聚集在位于或接近转录起始位点的称为CpG岛的区域4-6这些岛内的甲基化调节细胞内的基因表达7也可以赋予后代表观遗传力8,9.mC模式的变化在发展中起着关键作用10,11与癌症有关12,13和其他疾病14最近在人类胚胎干细胞中发现了大量非CG环境下的胞嘧啶甲基化,但在分化细胞中没有发现,这表明它是一种不同类型的甲基化,参与维持多能性状态15最后,5-羟甲基胞嘧啶(hmC)是一种新发现的表观遗传学标记,其生物学功能尚不清楚,迄今为止在小鼠浦肯野神经元中发现16和胚胎干细胞17.

由于胞嘧啶甲基化在人类健康和疾病中发挥着关键作用,它是上述DNA修饰中研究最广泛的一种,人们对绘制不同细胞类型的全基因组mC模式以及对各种环境影响的反应非常感兴趣18目前,研究胞嘧啶甲基化的最常见技术包括亚硫酸氢盐处理(通过将胞嘧啶而非甲基胞嘧啶转化为尿嘧啶,将表观遗传信息转化为遗传信息),然后进行大规模平行DNA测序18。使用这种方法,研究人员最近为拟南芥基因组2,,用于小鼠基因组的子集19以及大多数人类基因组中的成纤维细胞和胚胎干细胞15尽管亚硫酸氢盐测序取得了这些进展,但该技术仍存在一些缺点。例如,与亚硫酸氢盐测序相关的样品制备步骤可能既昂贵又耗时,并且完全转化所需的苛刻反应条件可能会降解DNA。此外,转换基因组复杂性的降低限制了后续PCR扩增的引物设计20也使与参考基因组的比对变得复杂6最后,通过亚硫酸氢盐测序无法区分C、mC和hmC16,17,21,22.

使用薄层色谱等技术可以直接检测溶液中核苷酸的甲基化16,17,高效液相色谱法16,23,质谱16,17,23,和纳米孔安培法24然而,尚未证明高通量方法可以在甲基化状态的同时测定初级序列。本文提出了一种在单分子实时DNA测序(SMRT)过程中直接检测DNA甲基化的方法,这是一种研究核酸序列和结构的新兴技术25在这项技术中,实时观察单个DNA聚合酶分子,同时催化荧光标记的核苷酸与模板核酸链互补。在数千个阵列零模波导(ZMW)中同时测量这些反应26纳米光子结构可以减少背景荧光,从而能够使用高浓度的标记核苷酸,以支持快速和处理的DNA序列逐合成。核苷酸的结合被检测为荧光脉冲,其颜色识别该核苷酸。当与核苷酸末端磷酸连接的荧光团在转移到DNA模板中的下一个碱基之前被聚合酶裂解时,脉冲结束。SMRT测序中典型的聚合酶合成速率目前为每秒1-3个碱基25.

SMRT测序中的荧光脉冲不仅以其发射光谱为特征,还以其持续时间和连续脉冲之间的间隔为特征25这些指标在这里定义为脉冲宽度(PW)和脉冲间持续时间(IPD),增加了有关DNA聚合酶动力学的宝贵信息。PW是核苷酸结合和荧光物质释放后所有动力学步骤的函数,而IPD是由核苷酸结合和聚合酶易位动力学决定的27我们之前已经证明SMRT测序聚合酶合成速率对DNA一级和二级结构敏感25因此,我们假设DNA模板中的甲基化碱基可以根据其存在影响SMRT测序期间聚合酶动力学的原理直接检测到(图1). 奇怪的是,据我们所知,尽管有证据表明其他类型的修饰核苷酸确实会改变DNA聚合酶动力学,但之前甚至没有研究过核苷酸与甲基化模板结合的动力学28.

保存图片、插图等的外部文件。对象名为nihms196783f1.jpg

SMRT测序期间检测DNA甲基化的原理和相应示例。()含有甲基化(顶部)或非甲基化(底部)腺苷的DNA链聚合酶合成示意图。(b条)来自这些模板的典型SMRT测序荧光痕迹。荧光示踪脉冲上方的字母表示包含在生长互补链中的核苷酸的身份。虚线箭头表示合并同源T之前的IPD,对于这个典型示例,模板中mA的IPD比A大约5倍。

结果

甲基化对聚合酶动力学的影响

为了验证这个假设,我们设计了几个合成DNA模板,除了它们在特定位点的甲基化状态外,其他模板都是相同的。一个模板用作对照,不包含甲基化,而其他模板包含多个mA、mC或hmC碱基。因为甲基化碱基原则上会影响DNA合成的动力学,所以我们用不少于11个碱基将它们分开29在所有情况下,mA位于GATC上下文中,而mC和hmC位于CG上下文中。我们对这些模板进行测序,然后通过计算每个模板位置的比率,将每个甲基化模板的平均IPD与控制模板的平均IP进行比较。对于所有三种甲基化类型,在甲基化碱基附近的聚合酶合成动力学有明显的偏移(图2). 甲基化碱在占据活性位点之前和之后与聚合酶接触有几个碱基29与该模型一致,甲基化的动力学影响不限于与修饰碱基相对的核苷酸掺入。此外,两个甲基化位置之间的IPD比率模式不同。由于所有三种模板类型中这两个位点之间差异的唯一来源是局部序列上下文(参见补充说明对于模板序列),我们得出结论,一般来说,甲基化的动力学特征将取决于序列上下文。

保存图片、插图等的外部文件。对象名为nihms196783f2.jpg

SMRT序列介导的甲基化DNA碱基检测。所有三个面板都显示了甲基化模板中的平均IPD与对照模板中的平均IPD的比率,相对于DNA模板位置绘制。在显示的区域中,除了三角形标记的两个位置外,这两个模板是相同的。聚合酶合成朝着增加位置数的方向进行。虽然在所有情况下,这两个模板都具有圆形拓扑结构,长度为199个碱基,但为了清晰起见,仅显示了甲基化区域周围的90个碱基段。误差条表示每个模板位置的s.e.m.IPD比率(平均值n个=(a)中每个位置的346个测量值,平均值n个=(b)中每个位置的504,平均值n个=(c)中每个位置393,使用自举技术(在线方法)计算。

然而,每种甲基化类型的两个实例之间有几个共同的特征,这表明甲基化的碱基和聚合酶的特定位点之间可能存在普遍的相互作用。对于mA(图2a)与甲基化位置相对,这些IPD的比率最大(介于5-6之间)。N6位置在互补碱基配对期间参与氢键,因此mA的甲基可能直接修改核苷酸结合动力学。两个mA位置之间的另一个共同特征是,在与甲基化碱相反的结合后,IPD比5碱出现偏移。

包含mC的模板(图2b)显示两个甲基化位置后IPD显著增加2、3和6个碱基。包含hmC的模板(图2c)在甲基化位置之后的2和6碱基(而不是3碱基)上显示出常见的IPD信号。PW比率图显示hmC比mC更明显的偏移(补充图1). 事实上,因为每次修改都会在给定的上下文中显示唯一的IPD和PW签名(参见图2b-c补充图1)这一方法为在实时测序过程中直接区分C、mC和hmC提供了有趣的可能性。为此,我们使用主成分分析,在假定的优化分辨率的修改附近的不同模板位置,找到IPD和PW信号的权重组合(补充表1). 每个模板的动力学特征投影到前两个主成分上的分离(图3)通过利用来自多个模板位置的多个动力学参数的信息,证明了这三种胞嘧啶碱基类型之间的区别。

保存图片、插图等的外部文件。对象名为nihms196783f3.jpg

C、mC和hmC IPD和PW特征的主成分分析。每个主成分是位置71-79处平均IPD和PW的线性组合,围绕可变修改模板位置73。IPD和PW在每个位置的权重如补充表1图上的数据点是通过将IPD和PW值的随机20%子样本投影到前两个主成分(PC1和PC2)上,然后转换为z评分(在线方法)来计算的。

通过环状共识测序检测甲基化

虽然先前的实验确立了相同分子群体中甲基化检测的原则,但实际上基因组样本中的个别位置可能只在存在的分子中的一小部分中甲基化。当基因组位置不总是甲基化时,集合上的聚合动力学数据将是甲基化和非甲基化情况下动力学特征的线性叠加。部分甲基化可以通过将数据拟合到一个双组分模型来量化,但对于由单个速率限制步骤导致的高度重叠的IPD分布25,最好将较少数量的分子进行排序,但每个分子都要进行多次排序。为了能够多次读取单个分子,我们利用DNA模板的环形拓扑结构,通过将发夹适配器连接到双链DNA插入物的两端来实现(图4a). 链置换DNA聚合酶可以围绕这样的DNA模板进行多圈DNA合成,并使同一DNA分子能够重复或循环一致测序。在特定DNA模板位置重复测量IPD(我们称之为循环子读取),得出该位置的平均IPD,该位置遵循伽马分布,比潜在的指数分布窄。随着收集到更多的循环亚基,甲基化碱和非甲基化碱的平均IPD分布变得更加分离(图4b). 这大大提高了它们之间的区别,如呼叫A与mA的接收器工作特性(ROC)曲线所示(图4c)在特定的上下文中。ROC曲线下的归一化面积在第一个圆形子广告后为0.80,但在三个和五个圆形子广告后分别增加到0.92和0.96。事实上,在五个子读取后,在该模板位置可以检测到>85%的mA碱基,假阳性率仅为~5%,并且通过更长的读取长度启用的额外子读取将产生更好的区分。如果考虑到受甲基化位点影响的所有模板位置,则识别效果会更好(如中mC和hmC所示图3). 有趣的是,通过循环一致性使用同一模板位置的多个观察结果与使用同一子广告中的多个受影响位置之间存在相似之处。两者都导致从高度重叠的指数分布过渡到更好的分离模式分布。将圆形共识测序和方法(如主成分分析)相结合,以结合所有可用信息,这将大大有助于将此技术扩展到具有碱基对分辨率的可变甲基化基因组位点的定量。

保存图片、插图等的外部文件。对象名为nihms196783f4.jpg

合成DNA模板中A和mA的IPD分布。()总长度为199个碱基的DNA模板示意图。(b条)两个模板指定位置的IPD分布。对于每一行,直方图描述了平均IPD的分布(在指定的循环子读取数上取平均值)。(c(c))基于(b)中差异甲基化位置的IPD分布并通过IPD阈值参数化的受体操作特征(ROC)曲线,用于在一个(灰色)、三个(红色)或五个(蓝色)圆形共识测序子读取后将甲基化状态分配给腺苷核苷酸。黑色虚线描绘了随机猜测甲基化状态的ROC曲线。请注意,因为模板的长度为199个基数,所以五个完整的循环子读取对应于近1000个基数的读取长度。

腺苷甲基化大肠杆菌

为了证明直接甲基化检测在基因组DNA中的应用,我们绘制了IPD对序列上下文的依赖性秀丽线虫磷酰胺,从DNA腺苷甲基转移酶阳性中分离(水坝+)大肠杆菌应变。为了提供一个非甲基化的对照模板,对一部分样品进行全基因组扩增(WGA),这有望消除任何甲基化特征(补充图2). 详细研究了该磷酰胺3.7 kb片段的测序动力学(图5,补充图3,补充数据). 在一系列具有不同GC内容的序列上下文上(图5a),的水坝+样本GATC头寸的平均IPD通常大于非GATC头衔(图5b). 相反,WGA样本中所有模板位置的平均IPD相似(图5c). 两个样本之间平均IPD的结果比率(图5d)证明在广泛的周围序列环境中,腺苷甲基化显著改变了聚合酶动力学(表1). 在本样本所示范围内,不同GC含量水平的IPD比率增加相似(补充图4). 腺苷甲基化引起的平均IPD增加大肠杆菌与合成mA模板中测量的IPD比率范围一致。整个磷酰胺样本中所有可能的4 mer序列上下文的平均IPD(48 kb,包括矢量,参见补充图5)显示出显著的上下文依赖性,在水坝+和WGA热图,突出了DNA聚合酶动力学研究方法的敏感性。这两个图之间的高度相似性证明了SMRT测序IPD测量的稳健性。它们相似性的显著例外是序列上下文GATC,它在水坝+与WGA样本相比。使用具有~10个SMRT测序仪器的未来商业版本,可以直接扩展到更大的基因组样本2×吞吐量大于原型仪器25,30用于这些实验。

保存图片、插图等的外部文件。对象名为nihms196783f5.jpg

DNA样品SMRT测序动力学的比较水坝+大肠杆菌以及对于全基因组扩增(WGA)后的相同样品。该样本包含一个3.7-kb的子区域秀丽线虫将磷克隆到大肠杆菌矢量。()样品50-bp窗口GC含量,绘制与模板位置的关系图。(b条)每个模板位置的平均IPD水坝+样品。(c(c))WGA样本中每个模板位置的平均IPD。(d日)平均住院日比率(水坝+(b)除以(c)中的WGA,绘制与模板位置的关系图。具有GATC上下文的位置,其中预期序列基序GATC处腺嘌呤甲基化,用黑色方块表示,所有其他位置用蓝色开圆圈表示。GATC位置的误差线表示这些位置的s.e.m.IPD比率(平均值n个=每个位置的106个测量值)。为了进行比较,非GATC位置(蓝色圆圈)的所有IPD比率的平均值±s.d.为1.00±0.24(n个为~389000个测量值)。该fosmid地区的平均测序覆盖率是水坝+样品和91倍的WGA样品。

表1

3.7 kb磷酰胺亚区中每个GATC基序的序列上下文和IPD比率(图5)、本地序列上下文、IPD比率(平均IPD水坝+样本除以来自WGA样本的平均IPD)和p值。p值是通过执行两个样本的Kolmogorov-Smirnov良好性测试得出的,该测试比较了水坝+以及WGA采样并测试它们来自相同的潜在分布的可能性(零假设)。较低的p值表示应拒绝零假设的信心更大。强调了每一个地方背景下的关贸总协定中心主题。

#职位顺序IPD比率P值
1273 TGCCAT公司关贸总协定TAGATC公司5.282.84 × 10-18
2279 关贸总协定关贸总协定ATCGTG公司4.324.41 × 10-16
720 TTCTAT公司关贸总协定AGGGAG公司6.127.00 × 10-21
41015 GCGTGG公司关贸总协定TGTATG公司3.466.25 × 10-2013年
51329 TATCAC公司关贸总协定TCATTA公司3.782.35 × 10-12
61668 TAGTTG公司关贸总协定AAGAGA公司3.332.61 × 10-2013年
72256 CTTTTG公司关贸总协定AGATCC公司5.221.70 × 10-19
82261 GGATCA公司GATC公司CAATTA公司5.561.43×10-22个
92499 CAGATG公司关贸总协定阿拉伯联合酋长国2.434.44 × 10-7
102583 ATTTT公司关贸总协定TAGTTT公司4.652.00 × 10-21
112887 ATTCGC公司关贸总协定TCCACA公司4.461.57 × 10-14
123402 CCTCAA公司关贸总协定ATCATC公司4.242.04 × 10-15
133619 GCCAGC公司关贸总协定阿塔特4.132.05 × 10-10个

讨论

在本文所述的实验中,甲基化和对照DNA都为每个实验测序,但在重新测序应用中,只能收集一次未甲基化的动力学参考数据,并将其制成表格,用于同一物种的所有后续研究。未来,从头开始甲基化的检测也可以通过在适当数量的上下文中列出预期动力学,或利用体现SMRT测序动力学中观察到的趋势的启发式方法。

在SMRT DNA测序中,聚合酶动力学的测量与一级序列测定同时进行,不需要任何额外的样品制备步骤。我们已经证明DNA模板中的几种甲基化形式,即mA、mC和hmC,都会改变掺入动力学。基于同样的原理,我们预计其他表观遗传修饰以及各种形式的DNA损伤也可以通过这种方法检测到。每次修改显示的独特动力学特征将允许在同一DNA样本中区分它们。通过重复询问单个分子,圆形共识测序允许对mA进行基线分辨率和单分子灵敏度检测。对于mC和hmC,可能需要提高动力学灵敏度。这些改进可能来自优化的溶液条件、聚合酶突变和算法方法,这些方法利用了动力学特征在多个模板位置上的扩散,而反褶积技术将有助于解析相邻的mC碱基(补充图6). SMRT测序的长读取长度可能允许在高重复性基因组区域进行甲基化分析,其中有大量mC残基存在6结合单分子敏感性,这些长读取也将允许不同基因组位置之间甲基化状态的阶段化。随着我们不断完善这项技术,从头开始甲基化分析可能成为可能。

联机方法

零模波导(ZMW)制造

ZMW纳米结构如前所述进行了制备和功能化24,31,32.使用同时监测的3000个ZMW阵列进行测序实验24,31,32.

DNA模板的制备

~35-base ssDNA寡核苷酸组(图1--44补充图1)购买(Trilink Biotechnologies,加利福尼亚州圣地亚哥)。质谱法证实了这些单链寡核苷酸中存在碱基修饰。杂交和结扎后,将产生的dsDNA寡核苷酸的每一端连接到发夹状寡核苷酸。用核酸外切酶处理样品,去除任何非共价闭合的分子。结果DNA模板的序列为199个碱基,由中心84-bp双链区组成,两端各有一个单链环(补充说明).

用于全磷的测序(补充图2和5),一个含有~40 kb的磷酰胺克隆(克隆号:WRM0639cE06)秀丽线虫基因组插入物来自Geneservice(英国剑桥,http://www.geneservice.co.uk/products/clones/Celegans_Fos.jsp)英寸水坝+大肠杆菌EPI300菌株,并使用诱导源进行培养和扩增(CopyControl system,Epicenter,Madison,WI)。使用标准方法纯化化石DNA。然后直接从磷酰胺DNA或全基因组扩增(WGA)磷酰胺DNA创建DNA模板。对于WGA文库,使用GenomiPhi HY DNA扩增试剂盒(英国GE Healthcare)中制造商推荐的条件扩增25 ng磷酰胺DNA。

用于对磷酰胺的分段进行排序(图5补充图3和4)使用Phusion High-Fidelity DNA聚合酶(马萨诸塞州伊普斯威奇新英格兰生物实验室)和以下引物从磷中PCR扩增出一个约3.7 kb的片段(对应于磷中的位置12797-16484),该片段包含13个GATC序列上下文实例:Forward 5′-AGTCCTGCTTCACCAAAAT-3′;背面5′-ATTTAGATTGCAAGCCGTAA-3′。使用Zero Blunt PCR克隆试剂盒(Invitrogen,Carlsbad,CA)将PCR产物克隆到PCR-Blunt载体中,并在水坝+大肠杆菌菌株TOP10(Invitrogen,Carlsbad,CA)。使用REPLI-g迷你试剂盒(加利福尼亚州巴伦西亚QIAGEN)扩增约25 ng DNA,以生成非甲基化对照样品。

Fosmid DNA或同等数量的WGA Fosmid DNA被剪切到平均大小500 bp(图5补充图3和4)或200 bp(补充图5)使用超声波仪(Covaris Inc,Woburn,MA)。然后用T4 DNA聚合酶和T4多核苷酸激酶的混合物对剪切的DNA进行最终修复,纯化并用Klenow(exo-)对其进行3′a拖尾处理。将A尾片段连接到包含单个3′T悬垂和5′磷酸的发夹状寡核苷酸。样品用核酸外切酶混合物处理,以去除任何非共价闭合的分子。使用SPRI磁珠(AMPure,Agencourt Bioscience,Beverly,MA)纯化所得DNA模板,并将其退火至序列引物(5′-GGAGGAGGAG-3′)的两倍摩尔过剩量,该序列引物特异性结合到发夹适配器的单链环区。

DNA聚合酶和磷酸连接dNTP的制备以及DNA测序分析

DNA聚合酶的产生如下所述24,33.如前所述生成膦化dNTP24,33,但将Alexa Fluor 660替换为改良的Cy5.5荧光粉除外。其他修饰包括将与每种染料相关的碱基排列成以下构型:A555-dT、A568-dG、A647-dA、Cy5.5-dC。所使用的激发激光线与所描述的相同24,33DNA聚合酶/模板复合物形成、复合物在ZMW阵列上的固定和测序反应的方案与先前描述的方案相似。

数据收集和分析

如前所述,在高度平行的共焦荧光检测仪器上进行数据收集24,30描述了使用阈值算法对荧光发射的染料加权强度进行脉冲调用,以及使用Smith-Waterman算法实现读取对齐24。校准后对读数进行筛选,以删除来自双加载ZMW的低质量序列。脉冲间持续时间(IPD)值从正确对准的模板位置的连续对制成表格,并分配给该对中的第二个模板位置。脉冲宽度(PW)值被计算为与正确对齐基本呼叫相关的脉冲持续时间。为了避免离群效应,在所有分析中排除了每个位置最小和最大5%的IPD和PW。

条形图误差线(图2)表示平均IPD比率的标准误差估计值,通过引导10%数据的10个随机选择的子样本计算得出。可以看出,误差栏在一定程度上低估了误差,因为在远离任何修改的位置确实会发生小的偏移,而这些位置与控制装置的差异是不可预料的。不同模板的分子覆盖率不同,mA、mC和hmC模板10%子样本的平均覆盖率分别为346、504和393。未对PW图的创建执行引导(补充图1)所有的分子都被用于。

标准主成分分析34使用统计计算程序R的Stats包中的prcomp函数执行35。输入变量按比例缩放,使其平均值和单位方差为零,所得的第一主成分和第二主成分由整个数据集确定(参见补充表1). 生成主成分散点图(图3)首先将每个模板20%的数据的500个子集投影到前两个主成分上。然后,通过减去平均值并除以每个主成分所有1500个数据点的标准偏差,将这些值转换为z评分。

IPD分配(图4)通过对单个分子内相同模板位置的多个IPD测量值进行平均来确定。使用了mA实验中的所有分子。相应的ROC曲线是通过在整个观察到的平均IPD范围内滑动阈值生成的。计算每个阈值的真实阳性率,作为平均IPD大于阈值的甲基化观察分数。同样,假阳性率由平均IPD大于阈值的非甲基化观察值的分数确定。

对于磷试验(图5,补充图3-5),GATC位置定义为T与模板GATC上下文中的模板a相对合并的位置。非GATC位置对应于所有其他位置。每个位置的IPD比率通过总平均IPD比率进行标准化水坝+读取数与所有WGA读取数的平均IPD之比。本图中分析的3688 bp磷区的平均测序覆盖率是水坝+样品和91倍的WGA样品。使用九个ZMW阵列(SMRT™Cells)和每个样本总计约1.5小时的测序获得该覆盖率(水坝+和WGA)。

局部序列上下文(补充图5)使用标准Smith-Waterman对准算法来确定。检测到的基底的“局部上下文”定义为之前检测到的两个基底(显示在左轴上)、检测到的基础本身和之后检测到的下一个基底(均显示在下轴上)。例如,在局部上下文5′-GATC-3′中,报告的平均IPD描述了检测到的A(与模板DNA中的T互补)和检测到的T(与模板中的A或mA互补)之间的平均持续时间。平均而言,1890个观察值(去掉最小和最大的5%后剩余)用于计算256个可能的4分子环境中每个环境的平均IPD,相当于整个磷虾的10倍覆盖率。

补充材料

1

单击此处查看。(222K,pdf)

致谢

我们感谢太平洋生物科学公司的全体员工,特别是J.Londry和D.Kolesnikov的样品制备;E.Mollova、M.Berhe和J.Yen负责进行测序实验;J.Sorenson、J.Chin、A.Kislyuk和D.Holden为数据分析提供帮助;以及E.Schadt和J.Eid进行了有益的讨论。国家人类基因组研究所资助1RC2HG005618-01。

脚注

作者贡献:B.A.F.、K.T.、J.K.、J.L.和S.W.T.设计了实验。E.O.和T.A.C.准备了磷库结构。B.A.F.进行了测序实验。D.W.和B.A.F.进行了数据分析。B.A.F.、J.K.、S.W.T.、E.O、D.W.和T.A.C.撰写了手稿。

竞争利益声明:作者们宣布了相互竞争的经济利益:所有作者都是太平洋生物科学公司(Pacific Biosciences)的员工,该公司是一家将DNA测序技术商业化的私营公司。

工具书类

1Marinus MG,Casadesus J.DNA腺嘌呤甲基化在宿主-猪相互作用中的作用:错配修复、转录调控等。FEMS微生物版。2009;33:488–503. [PMC免费文章][公共医学][谷歌学者]
2Cokus SJ等。拟南芥基因组的Shotgun亚硫酸氢盐测序揭示了DNA甲基化模式。自然。2008;452:215–219. [PMC免费文章][公共医学][谷歌学者]
三。李斯特R等。拟南芥表观基因组高度整合的单碱基分辨率图谱。单元格。2008;133:523–536. [PMC免费文章][公共医学][谷歌学者]
4Gardiner-Garden M,Frommer M.脊椎动物基因组中的CpG岛。分子生物学杂志。1987;196:261–282.[公共医学][谷歌学者]
5Saxonov S、Berg P、Brutlag DL。人类基因组中CpG二核苷酸的全基因组分析区分了两类不同的启动子。美国国家科学院院刊。2006;103:1412–1417. [PMC免费文章][公共医学][谷歌学者]
6Pomraning KR,Smith KM,Freitag M.真核生物DNA甲基化的基因组高通量分析。方法。2009;47:142–150.[公共医学][谷歌学者]
7Jaenisch R,Bird A.基因表达的表观遗传调控:基因组如何整合内在和环境信号。自然遗传学。2003;33(补充):245–254。[公共医学][谷歌学者]
8Holliday R,Pugh JE。发育过程中的DNA修饰机制和基因活性。科学。1975;187:226–232.[公共医学][谷歌学者]
9里格斯AD.X失活、分化和DNA甲基化。细胞遗传学细胞遗传学。1975;14:9–25.[公共医学][谷歌学者]
10Li E,Bestor TH,Jaenisch R.DNA甲基转移酶基因的靶向突变导致胚胎致死。单元格。1992;69:915–926.[公共医学][谷歌学者]
11Razin A,Shemer R.早期发育中的DNA甲基化。人类分子遗传学。1995;4规范编号:1751–1755.[公共医学][谷歌学者]
12Jones PA,Baylin SB。表观遗传事件在癌症中的基本作用。Nat Rev基因。2002;:415–428.[公共医学][谷歌学者]
13Jones PA,Laird PW。癌症表观遗传学随着年龄的增长而发展。自然遗传学。1999;21:163–167.[公共医学][谷歌学者]
14罗伯逊KD。DNA甲基化与人类疾病。Nat Rev基因。2005;6:597–610.[公共医学][谷歌学者]
15李斯特R等。碱基分辨率的人类DNA甲基体显示出广泛的表观基因组差异。自然。2009 [PMC免费文章][公共医学][谷歌学者]
16Kriaucionis S,Heintz N.核DNA碱基5-羟甲基胞嘧啶存在于浦肯野神经元和大脑中。科学。2009 [PMC免费文章][公共医学][谷歌学者]
17Tahiliani M等。MLL伙伴TET1将哺乳动物DNA中的5-甲基胞嘧啶转化为5-羟甲基胞嘧啶。科学。2009;324:930–935. [PMC免费文章][公共医学][谷歌学者]
18Lister R,Ecker JR。寻找第五个碱基:胞嘧啶甲基化的全基因组测序。基因组研究。2009;19:959–966. [PMC免费文章][公共医学][谷歌学者]
19Meissner A等人。多能干细胞和分化细胞的基因组尺度DNA甲基化图。自然。2008;454:766–770. [PMC免费文章][公共医学][谷歌学者]
20Clark SJ、Statham A、Stirzaker C、Molloy PL、Frommer M.DNA甲基化:亚硫酸氢盐修饰和分析。国家协议。2006;1:2353–2364.[公共医学][谷歌学者]
21Hayatsu H,Shiragami M.嘧啶和噬菌体DNA中亚硫酸氢盐与5-羟甲基的反应。生物化学。1979年;18:632–637.[公共医学][谷歌学者]
22黄毅,等。5-羟甲基胞嘧啶在亚硫酸氢盐测序中的行为。《公共科学图书馆·综合》。2010;5:e8888。 [PMC免费文章][公共医学][谷歌学者]
23Tardy-Planechaud S,Fujimoto J,Lin SS,Sowers LC。含有5-羟甲基胞嘧啶的寡核苷酸的固相合成和限制性内切酶裂解。核酸研究。1997;25:553–559. [PMC免费文章][公共医学][谷歌学者]
24Clarke J等人。单分子纳米孔DNA测序的连续碱基鉴定。Nat Nanotechnol公司。2009;4:265–270.[公共医学][谷歌学者]
25Eid J等。单聚合酶分子的实时DNA测序。科学。2009;323:133–138.[公共医学][谷歌学者]
26Levene MJ等。用于高浓度单分子分析的零模波导。科学。2003;299:682–686.[公共医学][谷歌学者]
27Wong I、Patel SS、Johnson KA。DNA复制保真度的诱导荧光动力学机制:通过单翻转动力学直接测量。生物化学。1991;30:526–537.[公共医学][谷歌学者]
28Hsu GW,Ober M,Carell T,Beese LS。高保真DNA聚合酶对氧化损伤DNA的错误复制。自然。2004;431:217–221.[公共医学][谷歌学者]
29Berman AJ等。phi29 DNA聚合酶与底物复合的结构:B族聚合酶的易位机制。EMBO J。2007;26:3494–3505. [PMC免费文章][公共医学][谷歌学者]
30Lundquist PM等人。实时平行共焦检测单分子。光学快报。2008;33:1026–1028。[公共医学][谷歌学者]
31Foquet M等人。改进了用于单分子检测的零模波导的制造。应用物理学杂志。2008;103:034301. [谷歌学者]
32Korlach J等。零模波导纳米结构中单个DNA聚合酶分子靶向固定的选择性铝钝化。美国国家科学院院刊。2008;105:1176–1181。 [PMC免费文章][公共医学][谷歌学者]
33Korlach J等人,《使用100%染料标记的末端磷酸连接核苷酸的加工酶DNA合成》。核苷、核苷酸和核酸。2008;27doi:10.1080/15257770802260741。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
34Jolliffe IT。主成分分析,Edn。2002:2. [谷歌学者]
35R统计计算基金会;2009.R:统计计算语言和环境。网址:http://www.R-project.org.[谷歌学者]