跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
基因组研究。2010年12月;20(12): 1719–1729.
doi(操作界面):10.1101/gr.110601.110
预防性维修识别码:PMC2989998型
PMID:21045081

基于亲和力的全基因组DNA甲基化数据评估:CpG密度、扩增偏差和拷贝数变化的影响

摘要

DNA甲基化是一种重要的表观遗传修饰,在分化过程中发挥着与基因表达调控相关的关键作用,但在疾病状态下,如癌症,DNA甲基化景观往往被解除调控。现在有许多技术可用于以靶向或全基因组方式查询CpG位点的DNA甲基化状态,但由于固有偏差,每种方法都可能查询基因组的不同部分。在本研究中,我们比较了两种流行的全基因组技术,甲基化DNA免疫沉淀(MeDIP)和甲基-CpG结合域捕获(MBDCap)之间甲基化DNA的亲和力纯化,并表明每种技术在CpG密度景观的不同域中运行。我们探讨了全基因组扩增的效果,并说明它可以降低检测基因组中富含GC区域DNA甲基化的敏感性。通过使用MBDCap,我们比较和对比了基于微阵列和序列的读数,并强调了拷贝数变化(CNV)在甲基体差异比较中的影响。这些研究表明,DNA甲基化数据和基因组覆盖率的分析高度依赖于所采用的方法,必须考虑GC含量、DNA扩增程度和拷贝数。

DNA甲基化是研究最多的表观遗传标记之一,它涉及在胞嘧啶环的5位上添加甲基,主要发生在哺乳动物的CpG二核苷酸上(琼斯1999). DNA甲基化模式在发育早期建立,并与分化期间基因表达的调节和维持有关(Sorensen等人,2010年). 甲基化模式在许多疾病状态下也会被破坏,特别是CpG岛相关启动子的DNA甲基化变化可能在癌症的发展中发挥作用(琼斯和拜林2002,2007;Jaenisch和Bird 2003).

现在有许多方法可用于确定CpG甲基化状态(有关审查,请参阅莱尔德2010)包括侧重于CpG岛屿层面的方法(Ponzielli等人,2008年;Kaminsky等人,2009年),个人发起人(Weber等人2005,2007;Novak等人2008)以及越来越多的基因组-“规模”(Meissner等人,2008年;Gu等人,2010年)和全基因组方法(李斯特等人,2009年)或低分辨率(Serre等人,2009年;Ruike等人,2010年). 这些后来的方法大致可分为以下名称:简化表示法基于甲基化敏感的方法(例如HELP)(Oda等人,2009年)或特定(例如CHARM)(Irizarry等人,2008年)限制消化(有关审查,请参阅Jeddeloh等人,2008年),基于亲缘关系甲基-DNA免疫沉淀(MeDIP)等方法(Weber等人,2005年,2007;Novak等人,2008年)和甲基CpG结合基于域的捕获(MBDCap)(劳赫等人,2006年,2008;Serre等人,2009年)和更直接的亚硫酸氢盐处理-基于的方法(李斯特等人,2009年);还原表示和亚硫酸氢盐处理的耦合现已得到证实(Meissner等人,2008年;Gu等人,2010年),以及其他组合也是可能的。然而,由于在程序的各个步骤中引入的技术和生物的复杂影响,以及所用方法的隐含偏差,在解释基于DNA甲基化的分析数据时仍然存在许多挑战。这些包括细胞纯度和DNA质量、GC富集区的DNA扩增偏差以及拷贝数畸变的影响。本研究的重点是使用基于亲和力的方法,结合启动子DNA微阵列或高通量DNA测序读数进行DNA甲基化分析。

染色质免疫沉淀(ChIP)已广泛用于研究蛋白质与DNA的相互作用(Ren等人,2000年)最近,进行了一项广泛的基准研究,比较了微阵列平台和分析方法(Johnson等人2008). DNA甲基化平台的比较研究现在开始出现(Li等人,2010年). MeDIP使用针对单链DNA的5-甲基胞苷抗体(翁等人,2009年;Ruike等人,2010年)而MBDCap方法使用MBD2蛋白的甲基-CpG结合域捕获双链DNA(Serre等人,2009年). 此外,MBDCap方法可以使用一系列盐分馏步骤来评估特定的甲基化密度(图1A). 使用平铺微阵列或高通量测序分析从MeDIP或MBDCap分离的免疫沉淀DNA的甲基化状态,每个平台都有多个可用平台。由于DNA通常是限制性的,并且来源于混合细胞类型,特别是在临床样本研究中,很难分离出足够数量的纯DNA直接杂交到微阵列或测序。DNA扩增技术已被开发用于解决这个问题(2009年巴黎). 这里,我们表明DNA扩增可以导致GC丰富区域的缺失,因此可能对CpG岛DNA甲基化的解释产生特别影响。最重要的是,拷贝数变异(CNV)可以影响DNA甲基化水平的解释,在癌症中,这在基因扩增和/或缺失的区域内可能至关重要。此外,启动子拼接阵列数据可以用于调整拷贝数的变化,并且我们表明拷贝数畸变可以对全基因组DNA甲基化分析产生重大影响。

保存图片、插图等的外部文件。对象名为1719fig1.jpg

(A类)显示甲基化DNA捕获到单链(MeDIP)或双链(MBDCap)片段群体的示意图。(B类)总结了用MeDIP富集完全甲基化DNA的探针强度和两种基于甲基矿工的富集变化。X(X)-轴显示局部CpG密度组(1-50)。Y(Y)-轴显示对数2标度输入标准化强度。每行显示箱中探针的输入正常强度的中值(此处仅适用于GC含量为11的探针)。强度进一步标准化,使最低箱中的中值为0。CpG岛内探针的位置由灰度区域显示,对应于12到40之间的局部CpG密度分数。(C)Affymetrix Promoter 1.0R阵列查询的相同基因组区域上1000个碱基的箱子中的总读取计数。每行代表log2读取计数中值(RCpM表示每百万映射读取计数);将汇总归一化,使bin最低的中位数为0。

结果

MeDIP和MBDCap根据CpG密度富集基因组的不同部分

MeDIP和MBDCap是两种常用于询问全基因组DNA甲基化模式的捕获方法。这两种技术具有固有的差异,即抗体与MBD捕获。我们询问每种方法在检测相同甲基化基因组DNA序列时是否具有可比性。使用经SssI甲基转移酶处理的全甲基化人类基因组DNA作为两个基于亲和力的DNA甲基化映射平台的基准。对于MBDCap的比较,使用了MethylMiner方案,其中DNA可以在高盐缓冲液(2 M NaCl)中作为单个组分洗脱,这里称为MBD-SF,或者根据甲基化程度作为不同的亚群洗脱,使用的NaCl浓度从200 mM增加到2000 mM。MBD-Elu5表示洗脱系列的1 M部分(图1A). SssI处理后,基因组中的每个CpG位点基本上都被甲基化,从而可以直接比较MeDIP和MBDCap之间的富集情况,这是使用Affymetrix Human Promoter 1.0R阵列进行的,该阵列包含450多万个25mer探针,跨越23155个启动子。图1B显示了根据局部基因组CpG密度分层探针后,来自完全甲基化DNA的MeDIP、MBD-Elu5和MBD-SF的输入提取启动子拼接阵列信号的摘要(有关正式定义,请参阅方法)。可以进行几个关键的观察:首先,基于MBDCap的程序的总体富集程度更高,特别是对于CpG密集的甲基化DNA(具有高局部CpG密度的探针);其次,由于盐洗脱步骤的性质,MBD-Elu5主要仅富集CpG致密材料,而MBD-SF富集CpG密度的范围更广,尽管平均水平较低。在最高CpG密度区域观察到启动子微阵列信号的衰减,值得注意的是,与MeDIP相比,基于甲基矿工的程序在更高的局部CpG浓度处出现衰减。随着MeDIP恢复单链DNA和MBDCap恢复双链DNA,M.SssI的拓扑异构酶活性可能会影响MeDIP相对于MBDCap所恢复DNA的扩增(Matsuo等人,1994年). 然而,我们发现甲基化LNCaP DNA的富集水平也受到MBDCap的青睐,相比之下,MeDIP对CpG密集区的富集水平有所降低(补充图1),支持使用基于MBDCap程序来支持对CpG-富集区的询问。

接下来,我们询问测序数据是否也观察到明显的CpG偏倚。与之前的实验类似,使用完全甲基化的DNA进行MBDCap富集,并且我们使用高通量测序读数分析洗脱的DNA。使用单通道Illumina基因组分析仪测序,对MBD-Elu5和MBD-SF各进行36个碱基的单端读取,分别获得8616022和11557035个到参考人类基因组的唯一映射读取(见方法)。为了将甲基化读数与启动子阵列进行比较,计算了映射到Affymetrix平铺阵列查询的基因组子集的读取数(在不重叠的1000-bp容器中)。图1C显示了归一化为深度的读取计数,类似地按本地CpG密度分组。补充图2显示了整个基因组的富集情况,突出显示了与整个基因组相比启动子富集(和CpG密度)的不同情况。CpG密度箱图1C近似表示中的本地CpG密度箱图1B,但富集水平无法直接比较。总的来说,测序数据中观察到类似的富集情况,其中MBD-Elu5富集于密集的甲基化区域,MBD-SF富集于稍宽的CpG密度范围。与之前一样,在CpG密度非常高的区域中观察到读取次数略有下降,但与平铺阵列数据中观察到的程度不同。目前尚不清楚这种减少是否可归因于文库制备或簇生成步骤中基于PCR的扩增,或者在基因组定位读取过程中是否引入了其他偏差,或者这是否是基于亲缘关系的技术的固有特性。

全基因组扩增可使CpG密集区的DNA甲基化呼叫发生偏差

鉴于在完全甲基化富集实验中观察到的信号衰减,我们接下来检查这是否是由于全基因组扩增(WGA)造成的,这是方案中生成足够材料以与启动子阵列杂交所必需的步骤。众所周知,DNA模板的GC含量会影响扩增效率,通常会导致对基因组中GC丰富区域的偏见(Bredel等人,2005年;Pugh等人,2008年;Teo等人,2008年).Johnson等人(2008)此外,当扩增的DNA被杂交时,灵敏度显著下降,尤其是Affymetrix拼接阵列。扩增偏倚可能是DNA甲基化绘图中的一个潜在问题,因为CpG岛就其本质而言是GC富集的,因此更容易出现任何现存的偏倚。

我们最初被提醒注意到一个涉及GC偏差的潜在问题GSTP1标准,在前列腺癌中其CpG岛相关启动子高度甲基化,在正常细胞中未甲基化(Song等人,2002年;Nakayama等人,2004年)在前列腺癌(LNCaP)和正常前列腺上皮细胞(PrEC)的MeDIP富集和WGA后,Affymetrix启动子拼接阵列上的探针水平上几乎没有差异富集(参见补充图3A;Coolen等人,2010年). 作为杂交前的对照,MeDIP-qPCR实验证实甲基化DNA在GSTP1标准基因座,放大前(77倍)和放大后(76倍)(补充图3B)。因此,即使LNCaP和PrEC之间的富集程度保持不变GSTP1标准WGA后,群体中的分子数量成比例地减少,从之前的676和8.7拷贝/ng减少到之后的32和0.43拷贝/ng。这些数据表明,DNA扩增可能导致基因组中扩增效率较低的区域(如富含GC的区域)甲基化检测的明显损失。为了进一步说明这一点,补充图4显示了WNT2型CAV2型和CpG-缺乏的启动子AGR2公司,PTN公司,以及SOSTDC1系统所有这些都被证实在前列腺癌细胞中高度甲基化。对于WNT2型CAV2型启动子,仅在CpG岛两侧的区域观察到代表差异甲基化的微阵列信号。我们假设WGA消融了这些DNA分子的绝对水平,类似于GSTP1标准。值得注意的是AGR2公司,PTN公司,以及SOSTDC1系统CpG含量较低的启动子在整个被验证为差异甲基化的区域中显示差异信号。可以预期的是,许多GC富集区域,例如CpG岛,虽然在扩增前在种群间差异富集,但在WGA后稀释到启动子微阵列上的检测下限以下。

利用Affymetrix启动子拼接阵列数据,通过比较来自同一来源的未扩增和扩增DNA的探针强度,直接研究WGA的作用。在这个实验中,使用了基因组输入DNA,没有甲基化DNA亲和步骤。图2显示了相同输入基因组DNA的未扩增和WGA样本的原始启动子阵列信号强度在大小相等的局部CpG密度容器中的分布。此处仅显示GC含量为8、11和14(25 mer探针)的探针(补充图5显示了探针GC含量的全部范围)。值得注意的是,在富含CpG区域的探针中观察到启动子拼接微阵列信号大幅下降(局部CpG密度大于12表示CpG岛)。此外,当探针GC含量大于11时,基因组中富含CpG的区域也显示来自未扩增DNA的杂交信号有所衰减,这表明其他影响,例如交叉杂交和探针特异性温度影响(Wei等人,2008年),可能会影响在微阵列上观察到的信号。还需要注意的是,观察到的CpG密度偏差并不是Affymetrix平台独有的,因为在NimbleGen平台上分析的未扩增的MeDIP富集的完全甲基化DNA样本(Gal-Yam等人,2008年)在GC含量范围较广的探针上也表现出衰减(补充图6)。

保存图片、插图等的外部文件。对象名为1719fig2.jpg

未扩增和WGA扩增基因组DNA的非标准对数尺度微阵列强度的盒须图。为了控制探针GC含量和强度之间的关联,GC含量为8、11和14(共25个)的探针如所示A类C分别是。补充图5显示了剩余探针GC含量(和进一步的实验样品)的曲线图。根据探针的局部CpG密度,将探针分为基因组范围内50个大小相等的仓,如图所示图1、B和C.方框和胡须图显示第25和75百分位为底部顶部方框中,带代表中间值;晶须显示出第25个百分位的1.5个四分位间距(IQR)内的最低数据点,以及第75个百分位数的1.5个IQR内的最高数据点。

由于需要某种形式的全基因组扩增才能获得足够的DNA用于阵列实验,我们接下来询问是否最近的变异可以增强GC富集区的扩增(Zhang等人,2009年)可以减少瓷砖阵列上观察到的衰减。含有标准WGA的未扩增基因组DNA样品,含有WGA的添加剂(甜菜碱、二甲基亚砜、乙二醇、1,2-丙二醇),以及Affymetrix为ChIP-ChIP实验建议的不同扩增条件(图3)进行了比较。为了总结结果,a累积偏差得分计算以量化GC含量下每组探针在本地CpG密度箱中平铺阵列数据时的信号衰减(有关偏差分数的详细信息,请参阅方法;有关解释,请参阅补充图7)。如前所示图2,未扩增DNA在较高探针GC含量(大于11)下发生更多富含CpG的衰减(累积偏差)(图3). 然而,所有不同的扩增条件都显示出比未扩增DNA更大的偏差分数,并且没有降低信号衰减(图3).

保存图片、插图等的外部文件。对象名为1719fig3.jpg

观察到各种放大方法的累积偏差。X(X)-轴表示探针GC含量。Y(Y)-轴表示累积偏差得分,它捕获50个局部CpG密度箱的累积信号衰减(有关定义,请参阅方法)。每一行代表不同的放大策略。

检测差异甲基化区域

为了探讨这些偏见的影响,我们在Affymetrix启动子拼接阵列上代表的启动子区域中寻找差异甲基化区域(DMR),比较前列腺癌(LNCaP)和正常上皮(PrEC)细胞系。使用类似于平铺阵列(MAT)基于模型分析的统计程序(Johnson等人,2006年)在MeDIP、MBD-Elu5和MBD-SF的两个细胞系之间分别检测到7384、4398和3815个DMR,错误发现率估计为5%(参见方法)。根据来自图1,毫不奇怪,检测到的DMR显示出CpG密度分布,反映了富集剖面,如图4.差异甲基化启动子被拆分为高甲基化(图4A)和癌症中的低甲基化(图4B)以说明细胞系之间差异甲基化的不对称性。不出所料,MBD-Elu5在富含CpG的地区发现了更多的DMR,并确定了CpG岛屿的最大比例,MBD-SF在更广泛的CpG密度范围内发现了DMR,而MeDIP确定了富含CpG-的地区的最低比例。

保存图片、插图等的外部文件。对象名为1719fig4.jpg

LNCaP和PrEC细胞之间假定DMR(估计错误发现率为5%)的CpG密度盒须图。显示为高甲基化(A类)和低甲基化(B类)地区。

接下来,使用启动子拼接阵列(MBDCap-chip)和高通量测序(MBDCcap-seq)从两个细胞系中分析MBD-SF富集的DNA,使我们能够直接比较两个读数的一致性。由于平铺阵列只测量启动子,因此将测序数据汇总到启动子的读取计数箱中,以便直接进行比较。由于数据的性质(探针强度与读取计数,请参阅方法),用于检测两个平台上差异甲基化启动子的统计程序从根本上不同。然而,P(P)-数值应在可直接比较的刻度上。这个P(P)-每个平台的值都被反向转换为Z轴-分数(即标准正态分布的分位数),以总结差异甲基化的证据,并根据变化的方向进行签名。差异甲基化Z轴-两个平台的得分如所示图5A正如所料,由于两个平台正在比较来自同一来源的浓缩DNA,因此存在普遍一致性(r=0.46)。平台之间的一个显著差异是Z轴-评分,测序数据为差异甲基化提供了更大范围的证据。虽然不能确定每个启动子水平高于阈值的差异确实是不同的甲基化,但Z轴-分数表明基于序列的数据具有更高的敏感性。此外,MBDCap-seq数据和基于Sequenom双硫化物的定量DNA甲基化数据的比较突出了一个强烈的一致性(r=0.81)(补充图8)。图5A强调了前面讨论的所有六个高甲基化基因被其中一个读数称为差异甲基化。值得注意的是GSTP1标准CpG岛启动子显示癌细胞基因转录起始位点(TSS)周围区域的读取次数显著增加,但与MeDIP-chip数据相似(图5A)MBDCap-chip数据中几乎没有差异甲基化的证据(补充图8)。同样CAV2型是一个富含CpG的区域,在测序中显示出强烈的差异甲基化,但在微阵列中没有。的发起人SOSTDC1系统AGR2公司,来自低CpG密度区域,由微阵列发现,在测序数据中仅显示中度差异甲基化(补充图9)。差异甲基化需要PTN公司WNT2型相当一致。此外,如果Z轴-设置了3的分界点,启动子阵列仅检测到测序数据检测到的2854个启动子中的256个存在差异甲基化,这表明其灵敏度要低得多。然而,平铺阵列还发现测序数据没有发现的246个不同甲基化的区域,这表明在适合测序的基因组区域中也可能存在固有的偏差。

保存图片、插图等的外部文件。对象名为1719fig5.jpg

MBD-SF拼接阵列和测序数据的比较。(A类)差异甲基化Z轴-使用MBD-SF-seq对LNCaP和PrEC细胞进行评分(-轴)和MBD-SF-chip(x个-轴)。补充图3A和4中显示的六个经验证的基因用黑点表示。根据MBD-SF-seq和MBD-SF-chip之间的差异甲基化一致性选择其余的点颜色Z轴-得分如所示B类注意,一些真正差异甲基化的启动子,例如WNT2型,被该一致性分类视为“不确定”。(B类)一致和不一致差异甲基化启动子的CpG密度盒须图,颜色对应于A类. (C)使用来自A类.

接下来我们研究了一致和不一致启动子的CpG密度(定义如下Z轴-得分截止值;参见方法)(图5B),分为高甲基化和低甲基化区域。与基于序列的数据相比,基于阵列的读出检测到的富含CpG的区域百分比较小,支持了DNA扩增和其他偏差对检测到的区域有直接影响的观察。通过微阵列而非测序检测到的大多数区域位于低CpG密度区域。相反,仅序列检测主要来自富含CpG的区域。此外,被微阵列而非测序视为差异甲基化的启动子平均具有较低的可映射性(图5C). 然而,应该注意的是,这些相同的微阵列检测区域中的探针显示出略高的探针拷贝数(参见补充图10)。

测序数据确定的差异甲基化启动子的数量最终取决于读取深度。为了估计启动子差异甲基化的饱和程度是否已达到当前测序深度,对LNCaP细胞和PrEC的MBD-SF-seq数据集在不同组分进行了采样,并拟合了差异甲基化启动子的数量曲线。所提出的实验捕获了估计60%–68%的差异甲基化启动子,而将可映射读数加倍将导致估计78%–89%的灵敏度(参见方法;补充图11)。

拷贝号、输入DNA和DNA甲基组数据

识别表观遗传变化的另一个重要但微妙的方面,尤其是在癌症背景下,是拷贝数畸变对DNA甲基化信号的影响。拷贝数畸变会直接影响转录水平(Stranger等人,2007年). 在DNA甲基组数据中,这种影响不太明显,但如果DNA甲基化,预期基因组的基因扩增(删除)区域应以较高(较低)的速率捕获。在ChIP-ChIP实验的分析中,通常从免疫沉淀信号中减去基因组DNA输入信号以计算拷贝数,而这种调整也可以间接地解释杂交、声波或探针特异性效应。在双色微阵列实验中,这种调整是明确进行的(Gal-Yam等人,2008年). 早期基于序列的DNA甲基化绘图练习没有包括输入DNA控制(Serre等人,2009年)如果包括在内,则已知存在偏见(Teytelman等人,2009年;Vega等人,2009年). 这里要强调的是,来自输入DNA的信号可以充分识别拷贝数畸变,而这一知识对于从拷贝数变化中分离差异甲基化至关重要。

为了验证使用基因组输入DNA拼接阵列数据来解释拷贝数变化,在具有全基因组DNA甲基化数据的同两个细胞系上收集了Affymetrix SNP 6.0阵列数据。为了定义两个细胞系之间的拷贝数变化,输入的DNA拼接阵列的处理与基因表达数据类似,在考虑了探针特异性影响后,得到了拷贝数变化的启动子级摘要(参见方法)(Irizarry等人,2003年).图6显示了第5染色体的两个细胞系之间拷贝数的变化(对于所有其他染色体,请参见补充图12),强调了启动子拼接阵列上基因组输入DNA的启动子级摘要之间的紧密联系(图6A),并总结了来自基因分型阵列的SNP和拷贝数探针(图6B). 它还证明了在没有直接收集SNP阵列数据或类似数据的情况下,使用输入DNA信号的启动子级摘要来发现拷贝数畸变的潜力。图6C显示了两个平台拷贝数平滑估计值之间的关系(参见方法),表明拷贝数变化的全基因组对应性相当高(r=0.86)。

保存图片、插图等的外部文件。对象名为1719fig6.jpg

使用启动子平铺阵列估计拷贝数的变化。(A类)Y(Y)-轴是使用Affymetrix Promoter 1.0R阵列沿着人类5号染色体在前列腺癌和正常上皮细胞系之间拷贝数的差异。灰色线表示超过200kb的内核平滑差异。(B类)Y(Y)-轴显示了沿着5号染色体相同区域使用Affymetrix SNP 6.0阵列的拷贝数差异。灰色线表示50kb以上的内核平滑差异。(C)X(X)-轴和-轴分别代表启动子1.0R和SNP 6.0阵列的前列腺癌和上皮细胞系之间在一组常见基因座上的全基因组平滑拷贝数变化。

接下来,我们强调拷贝数畸变的影响在基于亲缘关系的表观基因组数据中非常显著,影响DNA甲基化和ChIP分析。差异甲基化检测(对前列腺癌LNCaP和PrEC株使用MBD-SF)扩展到整个基因组,使用超过1500个碱基对的读取计数,以及Z轴-计算每个区域的得分。图7A说明了MBDCap-seq读取计数沿13号染色体的变化。正如预期的那样,它们与拷贝数的变化相关(图7B)对于相同的地区。图7C显示了DMR的分布Z轴-对全基因组进行评分,并根据其相应的变异密码状态进行分层。综上所述,这些观察结果强调了将CNV明确纳入表观基因组分析的必要性。有趣的是,13号染色体上靠近70MB的一个大的(~10M碱基对)区域显示缺失(SNP阵列数据),但甲基化没有相应的变化(MBDCap-seq)。来自该染色体其余部分的MBDCap-seq数据表明,它是一个超甲基化区域,这意味着区域超甲基化与基因组稳定性之间存在潜在联系。

保存图片、插图等的外部文件。对象名为1719fig7.jpg

拷贝数变化对差异甲基化检测的影响。(A类)差异甲基化Z轴-使用MBD-SF-seq对人类13号染色体LNCaP和PrEC细胞之间的得分。(B类)平滑的Affymetrix SNP 6.0阵列数据显示拷贝数的相应变化。(C)基因组分布Z轴-分数,根据相应地区的变化数字状态进行分层。

讨论

随着可用于DNA甲基化分析的不同全基因组技术的快速发展(李斯特等人,2009年;Oda等人,2009年;Serre等人,2009年;Ruike等人,2010年)及时停止并重新评估不同技术的局限性和益处。我们评估了启动子水平平铺微阵列和基于全基因组序列的DNA甲基化数据的技术和数据分析方面,发现在出现全基因组甲基化覆盖的高灵敏度平台之前,需要克服几个障碍,不同的富集技术和读数给出了DNA甲基组的不同快照。了解每种方法的固有偏见和局限性,应鼓励改进方案,促进多个平台的数据集成,以及开发改进的生物信息学工具,以提取有意义的生物解释。

基于亲和力的甲基组映射技术的比较现在开始出现(Li等人,2010年). 在此,对基于MBDCap和MeDIP的亲和捕获策略进行了比较,并对启动子拼接阵列和基于序列的读出进行了比较。此外,我们强调了WGA带来的技术局限性,描述了一种使用拼接阵列评估全基因组扩增的新方法,并说明了与DNA甲基组有效分析相关的拷贝数引起的生物偏差。通过使用完全甲基化的DNA和LNCaP DNA,比较了MeDIP和两种版本MBDCap的CpG密度谱的富集情况:MBD-Elu5(洗脱高度甲基化DNA的1000-mM部分)和MBD-SF(包含所有甲基化部分的单一洗脱)。我们的数据显示,与使用5-甲基胞嘧啶单克隆抗体进行免疫沉淀相比,使用MethylMiner的甲基DNA结合域协议进行的总体富集更高,尤其是在富含CpG的区域。MBD-Elu5优先洗脱富含CpG的DNA,而MBD-SF包含跨越更广泛CpG密度范围的DNA分子。对于启动子微阵列分析的所有方法,在CpG密集区(包括许多CpG岛)观察到信号强度显著下降。发现这种衰减主要是由于WGA,但也被其他影响所混淆,如微阵列探针的GC含量和交叉杂交,这会影响信号,从而影响灵敏度和动态范围。有趣的是,CHARM在性能上优于MeDIP(Irizarry等人,2008年)尤其是没有放大步骤。然而,CHARM确实需要大量的起始DNA,并且通常与定制的微阵列一起使用。

不幸的是,对于MeDIP和MBDCap方法,获得足够的亲和纯化DNA用于全基因组分析是不可行的,因此在杂交到微阵列之前需要进行扩增。在某些情况下,合并多个样本可能是一个合理的选择,但这会导致丢失有价值的复制信息。此外,在分析低细胞数的DNA时,例如福尔马林固定石蜡包埋的临床样本,合并亲和纯化的DNA通常不实用。我们的结果表明,扩增降低了敏感性,只允许对基因组的一个亚组分进行检测。具体来说,代表富含CpG区域的平铺阵列探针(可以说是甲基化映射最感兴趣的区域)似乎显示出较低的强度和压缩的动态范围。因此,使用扩增DNA检测差异甲基化的能力在许多CpG岛受到损害。

基于序列的分析需要较少的起始材料。然而,测序过程中的扩增也有可能在富含CpG的区域引入一些序列偏差,尽管程度较小。比较了相同MBDCap-富集甲基化DNA群体的启动子拼接阵列和高通量测序结果。尽管一致性很强,但正是这种不一致突出了甲基组的平台特异性快照中的差异。通过测序而非微阵列检测到的DMR通常位于基因组中富含CpG的区域,验证了微阵列的敏感性损失,这部分归因于WGA。此外,基于序列的分析受到富集水平的强烈影响,因此高富集区域的测序深度更大,从而检测变化的能力更强。因此,微阵列可能更适合查询富集度较低的区域,例如CpG密度较低区域,在这些区域,获得足够覆盖率的测序成本可能会受到限制。在较小的程度上,由微阵列而非测序检测到的一些DMR位于“可映射性”较低的区域,这表明如果可以设计独特的探针,微阵列可能会提高这些区域的灵敏度。此外,基因组重复元件在亲和捕获的甲基化DNA中的存在程度基本上是未知的。较长或成对读取将导致更高的可映射性,而成对读取对于研究重复元素的影响至关重要。总的来说,测序数据似乎对发现DMR更为敏感,总检测数也更高,而且它们具有明显的优势,可以对整个基因组进行查询。然而,富集水平、测序使用量、扩增、甲基化重复元件、CpG密度和可测性带来的复杂性累积显著,这表明阵列和测序平台可能是对差异甲基化的成本效益和综合分析的补充。

最后,我们研究了CNV可能引入DNA甲基化数据集的微妙影响。验证了将输入DNA杂交到平铺阵列用于经济拷贝数畸变检测的方法,并且我们强调,如果没有明确地整合到分析中,遗传变化可能会严重混淆表观遗传差异的识别。这在分析癌症甲基体时尤其重要,例如,在甲基体中,拷贝数畸变非常普遍。从现有拷贝数数据库中或从现有基因组DNA微阵列或阵列中推断信息CGH数据应该很简单。然而,我们的结果意味着,在某些情况下,需要投入额外的资源来收集CNV信息(例如,CNV-seq)(谢和塔米2009). 拷贝数偏差不仅会混淆全基因组甲基化分析,而且还会出现在其他基于亲和力的表观基因组作图练习中,例如研究组蛋白修饰的染色质免疫沉淀实验。

最近出现了许多令人兴奋的新方法来研究全基因组DNA甲基化(Clarke等人,2009年;李斯特等人,2009年;Flusberg等人,2010年)随着这些新方法的出现,也带来了大量的挑战,主要是与越来越多的数据的解释有关。更好地了解这些技术和当前实验室协议(如MeDIP和MBDCap)的影响,将大大有助于开发适用于全基因组甲基组分析的敏感协议。

方法

细胞系和培养条件

如前所述培养LNCaP前列腺癌细胞(Song等人,2002年). 根据制造商的说明在前列腺上皮生长培养基(PrEGM;Cambrex生物科学目录号CC-3166)中培养正常的PrEC(Cambrex生物科学目录号CC-2555)。

通过MeDIP进行甲基化分析

使用Puragene提取试剂盒(Gentra Systems)从细胞系中提取DNA。对于完全甲基化阳性对照DNA,CpG基因组普遍甲基化DNA来自Millipore(目录号57821)。在1×IP缓冲液(pH 7.0、140 mM NaCl和0.05%Triton X-100条件下的10 mM磷酸钠)中对4μg超声基因组DNA(300–500 bp)进行MeDIP分析。将10微克抗5-甲基胞嘧啶小鼠单克隆抗体(Calbiochem克隆162 33 D3目录号NA81)在500μL 1×IP缓冲液中培养过夜,并用80μL蛋白A/G PLUS琼脂糖珠(Santa Cruz sc-2003)收集DNA/抗体复合物。在4°C下用1×IP缓冲液清洗珠子三次,在室温下用1 mL TE缓冲液清洗两次。用新制备的1%SDS和0.1 M NaHCO洗脱免疫复合物3通过苯酚/氯仿萃取和乙醇沉淀纯化DNA,并在30μL H中重新悬浮2O.并行处理输入样本。

MBDCap分离甲基化DNA

甲基化DNA富集试剂盒(Invitrogen)用于分离甲基化DNA。将一微克基因组DNA超声至100-500 bp。然后根据制造商的说明,将3.5μg(7μL)MBD-生物素蛋白偶联到10μL Dynabeads M-280链霉亲和素。MBD磁珠结合物被洗涤三次,并重新悬浮在1体积的1×结合/洗涤缓冲液中。捕获反应是通过在室温下将1μg声波DNA添加到MBD磁珠上的旋转混合器中1小时来完成的。所有捕获反应均重复进行。用1×绑定/清洗缓冲液清洗珠子三次。甲基化DNA以两种方式之一洗脱:(1)用高盐洗脱缓冲液(2000 mM NaCl)作为单一组分,表示MBD-SF;或(2)根据甲基化程度,使用洗脱缓冲液的NaCl浓度增加,从200 mM逐步梯度至2000 mM,作为不同的亚群(洗脱1200mM;洗脱2350mM;洗提3450mM;洗出4600mM;洗脱51000mM;和洗脱62000mM)。使用1μL糖原(20μg/μL)、1/10体积的3 M醋酸钠(pH 5.2)和两个样品体积的100%乙醇通过乙醇沉淀法浓缩每个部分,并在60μL H中重新悬浮20

WGA和启动子阵列分析

根据制造商的说明,使用GenomePlex Complete WGA Kit(Sigma目录号WGA2)对来自MeDIP免疫沉淀和MBD-Capture反应的免疫沉淀DNA和输入DNA进行扩增。每次扩增反应中使用50毫微克DNA。使用cDNA净化柱(Affymetrix编号900371)对反应进行净化,并根据Affymetix染色质免疫沉淀分析协议P/N 702238 Rev.3对7.5μg扩增DNA进行片段化和标记。使用基因芯片杂交清洗和染色试剂盒(P/N 900720)对Affymetrix基因芯片人类启动子1.0R阵列(P/N.900777)进行杂交。

放大偏置实验

在已知试剂的存在下进行WGA反应,以增强富含GC的DNA的扩增(Zhang等人2009). 甜菜碱(西格玛B0300-IVL;最终2.2M)、乙二醇(西格马E-9129;批号23H00252;最终1.075 M)、1,2丙二醇(西格玛398039;最终0.816M)和二甲基亚砜(斯特拉赫纳目录号600260-53;最终4%)用于单独的100μL WGA反应。扩增后,DNA被纯化、标记、片段化,并与上述Affymetrix基因芯片人类启动子1.0R阵列杂交。

局部CpG密度

我们使用以下公式给出的局部CpG密度定义Pelizzola等人(2008),窗口为600 bp(Pelizzola等人,2008年)因为我们杂交了平均长度为600个碱基的基因组DNA片段,单个探针正在测量来自相邻基因组区域的信号,因此受到该区域CpG位点数量的影响。简言之,局部CpG密度是从给定的兴趣点(例如,微阵列探针位置)到基因组上游和下游600个碱基的CpG位点的加权计数。权重从感兴趣点中心的1线性下降到上游或下游600个碱基处的0。分数反映了靠近关注点的CpG站点数量。

累积信号衰减

累积偏差得分捕获了具有给定探针GC含量的一组探针在高局部CpG密度下的衰减程度。使用3–17号箱中探针GC含量和样品的每种组合的统计数据(中位数、25%和75%),计算组合的中位数和方差。累积偏差是与计算的中位数的绝对偏差和50个组合箱之间的方差的总和。补充图7给出了图片说明。

启动子阵列数据的非靶向启动子级分析

计算感兴趣差异的探针水平分数(LNCaP信号−PrEC信号),并使用修剪平均值(600bp窗口)进行平滑,并寻找显著和持久的差异。为了计算错误发现率,探针的顺序是随机的,并遵循相同的过程。该方法在Repitools包的regionStats函数中实现(Statham等人,2010年).

启动子阵列和测序数据的靶向启动子水平分析

对于平铺阵列数据,使用每个TSS 750个碱基内的所有探针计算感兴趣差异的探针水平分数(LNCaP信号−PrEC信号)。一个样本t吨-然后计算统计数据,以确定每个TSS的平均probelevel分数是否与零有显著差异,如Repitools包的blockStats功能所实现的那样(Statham等人,2010年).P(P)-值的计算依据t吨-统计数据。对于测序数据,统计每个TSS 750个碱基内的读取数。然后,使用Bioconductor edgeR软件包计算LNCaP和PrEC之间计数差异的精确测试(Robinson等人,2010年).

数据规范化

Affymetrix Human Promotor 1.0R阵列的标准化遵循基于模型的平铺阵列分析(MAT)提出的调整(Johnson等人,2006年),它补偿了碱基组成和探针拷贝数的全局影响。

根据高通量测序实验的性质,每个样本的测序深度不同。总读取深度的补偿发生在以下阶段:(1)在分析MBDCap富集的SssI处理的DNA时,信号水平表示为每百万唯一映射的读取计数,如图1C(启动子)和补充图2(基因组);和(2)启动子处读取计数的差异分析,用于比较LNCaP MBDCap与PrEC MBDCap,明确补偿了edgeR软件中的读取深度(即库大小)(Robinson等人,2010年).

反向转换Z轴-分数

为了将观察到的LNCaP和PrEC细胞之间的差异放在一个共同的尺度上,用于平铺阵列和测序平台,P(P)-值被反向转换为有符号Z轴-分数。对于每个P(P)-值Z轴-score是标准正态分布的值z,使得Pr(Z轴>z)=p/2,其中p是P(P)-值。LNCaP细胞中具有较高信号(或较高相对计数)的区域将具有阳性Z轴-分数,否则将为负数。

绘图基因组分析仪测序读数

我们使用Bowtie将36个碱基对读取映射到hg18参考基因组(Langmead等人,2009年),最多有三个不匹配项。排除了多次(即相同起始位点)映射到单个基因组位置的读取。

启动子阵列和测序之间DMR的一致性

如果两个平台都给出一个Z轴-得分大于3分,如果两者都符合,则为一致和低甲基化Z轴-得分小于-3。高甲基化不协调启动子被定义为一个平台具有Z轴-得分大于3,另一个平台得分为Z轴-得分低于1.5分。类似地,使用−3和−1.5的截止值来定义不一致的低甲基化启动子。请注意,被一个平台而不是另一个平台(即1和3之间或−3和−1之间)视为差异甲基化的启动子被认为是不确定的。

下采样分析

对每个基因启动子的计数进行下采样,以累积原始数据集20%到100%之间的总读取计数(每一级下采样抽取10个数据集)。对于每个下采样数据集,DMR的数量(使用绝对值Z轴-计算3)的分界点。使用每一级二次抽样的DMR的中值,一条形式为ax的非线性曲线c(c)/(b+xc(c))(使用R nls函数)进行拟合,以估计DMR的总数(即参数a)。DMR总数的95%置信区间为(55556323)。100%采样的数据集显示3777 DMR。

平滑拷贝数估计

使用aroma.core R包中的实现,使用带宽为50/200 kb(启动子/SNP数组)的截断高斯核平滑器平滑了拷贝数的变化(Bengtsson等人,2008年).

可映射性

使用Bowtie,从整个人类基因组中所有可能的36个碱基的读数都被映射回基因组。在每个基上,读取可以从给定位置开始明确映射,也可以不映射。可映射性是指可以为给定基因组区域映射的此类读取的比例。

致谢

我们感谢凯特·帕特森(Kate Patterson)在准备数据和批判性阅读手稿方面的帮助,以及奥列格·梅巴(Oleg Mayba)在可映射性计算代码方面的帮助。这项工作得到了国家卫生和医学研究委员会(NH&MRC)项目(427614、481347)(M.D.R.、C.S.、D.S.)和奖学金(S.J.C.)、新南威尔士州癌症研究所拨款(CINSW:S.J.C.、A.L.S.)、NBCF项目拨款(S.J.C)和ACRF的支持。我们还感谢新南威尔士大学(澳大利亚悉尼)拉马西奥蒂中心对MBDCap DNA进行阵列杂交和Illumina GAII测序。

脚注

[补充材料可在线获取,网址为网址:http://www.genome.org.本研究的数据已提交给基因表达总署(网址:http://www.ncbi.nlm.nih.gov/geo)超级系列登录号。GSE24546标准.]

文章在印刷前在线发布。文章和发布日期为http://www.genome.org/cgi/doi/10.1101/gr.110601.110.

工具书类

  • Bengtsson H、Simpson K、Bullard J、Hansen K,2008年。aroma.afymetrix:R中用于分析有限内存中小型到超大affymetrix数据集的通用框架,第745号技术报告加州大学伯克利分校统计系[谷歌学者]
  • Bredel M、Bredel C、Juric D、Kim Y、Vogel H、Harsh GR、Recht LD、Pollack JR、Sikic BI 2005。从有限的新鲜冷冻和石蜡包埋DNA来源中扩增整个肿瘤基因组和基因组畸变的逐基因定位.J Mol诊断 7: 171–182[PMC免费文章][公共医学][谷歌学者]
  • Clarke J、Wu HC、Jayasinghe L、Patel A、Reid S、Bayley H,2009年。单分子纳米孔DNA序列的连续碱基识别.Nat纳米技术 4: 265–270 [公共医学][谷歌学者]
  • Coolen MW、Stirzaker C、Song JZ、Statham AL、Kassir Z、Moreno CS、Young AN、Varma V、Speed TP、Cowley M等,2010年。通过长程表观遗传沉默(LRES)将癌症基因组整合到抑制性染色质区域降低转录可塑性.Nat细胞生物学 12: 235–246[PMC免费文章][公共医学][谷歌学者]
  • Flusberg BA、Webster DR、Lee JH、Travers KJ、Olivares EC、Clark TA、Korlach J、Turner SW,2010年。单分子实时测序期间直接检测DNA甲基化.Nat方法 7: 461–465[PMC免费文章][公共医学][谷歌学者]
  • Gal-Yam EN、Egger G、Iniguez L、Holster H、Einarsson S、Zhang X、Lin JC、Liang G、Jones PA、Tanay A,2008年。PC3前列腺癌细胞株中Polycomb抑制标记的频繁转换和DNA超甲基化.国家科学院程序 105: 12979–12984[PMC免费文章][公共医学][谷歌学者]
  • Gu H、Bock C、Mikkelsen TS、Jager N、Smith ZD、Tomazou E、Gnirke A、Lander ES、Meissner A,2010年。单核苷酸分辨率下临床样本的基因组DNA甲基化绘图.Nat方法 7: 133–136[PMC免费文章][公共医学][谷歌学者]
  • Irizarry RA、Bolstad BM、Collin F、Cope LM、Hobbs B、Speed TP 2003。Affymetrix基因芯片探针水平数据汇总.核酸研究 31:e15 doi:10.1093/nar/gng015[PMC免费文章][公共医学][谷歌学者]
  • Irizarry RA、Ladd-Acosta C、Carvalho B、Wu H、Brandenburg SA、Jeddeloh JA、Wen B、Feinberg AP 2008。用于相对甲基化的综合高通量阵列(CHARM).基因组研究 18: 780–790[PMC免费文章][公共医学][谷歌学者]
  • Jaenisch R,Bird A,2003年。基因表达的表观遗传调控:基因组如何整合内在和环境信号.自然基因 33:245–254[公共医学][谷歌学者]
  • 杰德洛JA,格雷利JM,Rando OJ 2008。减少表现甲基化映射.基因组生物学 9:231数字对象标识代码:10.1186/gb-2008-9-8-231[PMC免费文章][公共医学][谷歌学者]
  • Johnson WE、Li W、Meyer CA、Gottardo R、Carroll JS、Brown M、Liu XS,2006年。ChIP-ChIP平铺阵列的基于模型的分析.国家科学院程序 103: 12457–12462[PMC免费文章][公共医学][谷歌学者]
  • Johnson DS、Li W、Gordon DB、Bhattacharjee A、Curry B、Ghosh J、Brizuela L、Carroll JS、Brown M、Flicek P等,2008年。使用预先定义的DNA靶点系统评估ChIP-ChIP实验的可变性.基因组研究 18: 393–403[PMC免费文章][公共医学][谷歌学者]
  • Jones PA 1999年。DNA甲基化悖论.趋势Genet 15: 34–37 [公共医学][谷歌学者]
  • Jones PA,Baylin SB 2002。表观遗传事件在癌症中的基本作用.Natl版本 3: 415–428 [公共医学][谷歌学者]
  • Jones PA,Baylin SB 2007。癌症的表观基因组学.单元格 128: 683–692[PMC免费文章][公共医学][谷歌学者]
  • Kaminsky ZA、Tang T、Wang SC、Ptak C、Oh GH、Wong AH、Feldcamp LA、Virtanen C、Halfvarson J、Tysk C等,2009年。单卵和双卵双胞胎的DNA甲基化特征.自然基因 41: 240–245 [公共医学][谷歌学者]
  • Laird PW 2010。全基因组DNA甲基化分析的原则和挑战.Natl版本 11: 191–203 [公共医学][谷歌学者]
  • Langmead B,Trannell C,Pop M,Salzberg SL 2009年。短DNA序列与人类基因组的超快和高效记忆比对.基因组生物学 10:R25 doi:10.1186/gb-2009-10-3-R25[PMC免费文章][公共医学][谷歌学者]
  • Li N,Ye M,Li Y,Yan Z,Butcher LM,Sun J,Han X,Chen Q,Zhang X,Wang J 2010年。基于高通量测序技术的全基因组DNA甲基化分析.方法(印刷中)。doi:10.1016/j.meth.2010.04.009[公共医学][谷歌学者]
  • 李斯特R、佩利佐拉M、多文RH、霍金斯RD、Hong G、Tonti-Filippini J、Nery JR、Lee L、Ye Z、Ngo QM等,2009年。碱基分辨率的人类DNA甲基体显示出广泛的表观基因组差异.自然 462: 315–322[PMC免费文章][公共医学][谷歌学者]
  • Matsuo K、Silke J、Gramatikoff K、Schaffner W,1994年。CpG特异性甲基化酶SssI在镁存在下具有拓扑异构酶活性2+.核酸研究 22: 5354–5359[PMC免费文章][公共医学][谷歌学者]
  • Meissner A、Mikkelsen TS、Gu H、Wernig M、Hanna J、Sivachenko A、Zhang X、Bernstein BE、Nusbaum C、Jaffe DB等人,2008年。多能干细胞和分化细胞的基因组级DNA甲基化图谱.自然 454: 766–770[PMC免费文章][公共医学][谷歌学者]
  • Nakayama M、Gonzalgo ML、Yegnasubramanian S、Lin X、De Marzo AM、Nelson WG,2004年。GSTP1 CpG岛超甲基化作为前列腺癌分子生物标志物.J细胞生物化学 91: 540–552 [公共医学][谷歌学者]
  • Novak P、Jensen T、Oshiro MM、Watts GS、Kim CJ、Futscher BW 2008。聚集性表观遗传畸变是人类乳腺癌的常见事件.癌症研究 68: 8616–8625[PMC免费文章][公共医学][谷歌学者]
  • Oda M、Glass JL、Thompson RF、Mo Y、Olivier EN、Figueroa ME、Selzer RR、Richmond TA、Zhang X、Dannenberg L等,2009年。高分辨率全基因组胞嘧啶甲基化分析,同时进行拷贝数分析和有限细胞数优化.核酸研究 37: 3829–3839[PMC免费文章][公共医学][谷歌学者]
  • 巴黎PL 2009。适用于各种DNA的全基因组扩增协议,包括来自福尔马林固定组织和石蜡包埋组织的DNA.分子生物学方法 556: 89–98 [公共医学][谷歌学者]
  • Pelizzola M、Koga Y、Urban AE、Krauthammer M、Weissman S、Halaban R、Molinaro AM 2008年。MEDME:一种基于微阵列衍生MeDIP富集的DNA甲基化水平估计的实验和分析方法.基因组研究 18: 1652–1659[PMC免费文章][公共医学][谷歌学者]
  • Ponzielli R、Boutros PC、Katz S、Stojanova A、Hanley AP、Khosravi F、Bros C、Jurisica I、Penn LZ 2008。高通量染色质免疫沉淀研究实验设计参数的优化.核酸研究 36:e144网址:10.1093/nar/gkn735[PMC免费文章][公共医学][谷歌学者]
  • Pugh TJ、Delaney AD、Farnoud N、Flibotte S、Griffith M、Li HI、Qian H、Farinha P、Gascoyne RD、Marra MA 2008。全基因组扩增对拷贝数变异分析的影响.核酸研究 36:e80网址:10.1093/nar/gkn378[PMC免费文章][公共医学][谷歌学者]
  • 劳赫·T、李·H、吴·X、菲弗GP 2006。MIRA辅助的微阵列分析是一种测定DNA甲基化模式的新技术,可识别肺癌细胞中同源域基因的频繁甲基化.癌症研究 66: 7939–7947 [公共医学][谷歌学者]
  • Rauch TA、Zhong X、Wu X、Wang M、Kernstine KH、Wang Z、Riggs AD、Pfeifer GP 2008。肺癌DNA高甲基化和低甲基化的高分辨率定位.国家科学院程序 105: 252–257[PMC免费文章][公共医学][谷歌学者]
  • Ren B、Robert F、Wyrick JJ、Aparicio O、Jennings EG、Simon I、Zeitlinger J、Schreiber J、Hannett N、Kanin E等,2000年。DNA结合蛋白的基因组定位和功能.科学类 290: 2306–2309 [公共医学][谷歌学者]
  • Robinson MD、McCarthy DJ、Smyth GK 2010。edgeR:用于数字基因表达数据差异表达分析的Bioconductor软件包.生物信息学 26: 139–140[PMC免费文章][公共医学][谷歌学者]
  • Ruike Y、Imanaka Y、Sato F、Shimizu K、Tsujimoto G,2010年。甲基DNA免疫沉淀结合高通量测序对人类乳腺癌细胞异常甲基化的全基因组分析.BMC基因组学 11:137 doi:10.186/1471-2164-11-137[PMC免费文章][公共医学][谷歌学者]
  • Serre D,Lee BH,Ting AH 2009年。MBD分离基因组测序提供了对人类基因组中DNA甲基化的高通量和全面调查.核酸研究 38: 391–399[PMC免费文章][公共医学][谷歌学者]
  • Song JZ、Stirzaker C、Harrison J、Melki JR、Clark SJ,2002年。前列腺癌细胞谷胱甘肽-S-转移酶基因(GSTP1)的高甲基化触发.癌基因 21: 1048–1061 [公共医学][谷歌学者]
  • Sorensen AL、Jacobsen BM、Reiner AH、Andersen IS、Collas P,2010年。分化细胞的启动子DNA甲基化模式主要在祖细胞阶段编程.分子生物学细胞 21: 2066–2077[PMC免费文章][公共医学][谷歌学者]
  • Statham AL、Strbenac D、Coolen MW、Stirzaker C、Clark SJ、Robinson MD,2010年。Repitools:基于富集的表观基因组数据分析的R包.生物信息学 26: 1662–1663[PMC免费文章][公共医学][谷歌学者]
  • Stranger BE、Forrest MS、Dunning M、Ingle CE、Beazley C、Thorne N、Redon R、Bird CP、de Grassi A、Lee C等,2007年。核苷酸和拷贝数变异对基因表达表型的相对影响.科学类 315: 848–853[PMC免费文章][公共医学][谷歌学者]
  • Teo YY、Inouye M、Small KS、Fry AE、Potter SC、Dunstan SJ、Seielstad M、Barroso I、Wareham NJ、Rockett KA等人,2008年。全基因组扩增DNA:见解和插补.Nat方法 5: 279–280[PMC免费文章][公共医学][谷歌学者]
  • Teytelman L、Ozaydin B、Zill O、Lefrancois P、Snyder M、Rine J、Eisen MB,2009年。染色质结构对基因组分析中DNA处理的影响.公共科学图书馆 4:e6700网址:10.1371/journal.pone.0006700[PMC免费文章][公共医学][谷歌学者]
  • Vega VB,Cheung E,Palanisamy N,Sung WK 2009年。基于序列的染色质免疫沉淀控制库中的固有信号.公共科学图书馆 4:e5241 doi:10.1371/journal.pone.0005241[PMC免费文章][公共医学][谷歌学者]
  • Weber M、Davies JJ、Wittig D、Oakeley EJ、Haase M、Lam WL、Schubeler D,2005年。染色体和启动子特异性分析确定正常和转化人类细胞中差异DNA甲基化的位点.自然基因 37: 853–862 [公共医学][谷歌学者]
  • Weber M、Hellmann I、Stadler MB、Ramos L、Paabo S、Rebhan M、Schubeler D,2007年。人类基因组中启动子DNA甲基化的分布、沉默潜力和进化影响.自然基因 39: 457–466 [公共医学][谷歌学者]
  • Wei H、Kuan PF、Tian S、Yang C、Nie J、Sengupta S、Ruotti V、Jonsdottir GA、Keles S、Thomson JA等,2008年。NimbleGen微阵列数据中寡核苷酸特性与杂交信号强度关系的研究.核酸研究 36: 2926–2938[PMC免费文章][公共医学][谷歌学者]
  • 翁毅,黄泰,严P.S 2009。甲基化DNA免疫沉淀和微阵列分析:乳腺癌细胞系中DNA甲基化的检测.分子生物学方法 590: 165–176[PMC免费文章][公共医学][谷歌学者]
  • Xie C,Tammi MT,2009年。CNV-seq,一种使用高通量测序检测拷贝数变化的新方法.BMC生物信息学 10: 80.[PMC免费文章][公共医学][谷歌学者]
  • 张泽,杨X,孟L,刘F,沈C,杨W 2009。用两种有机试剂增强扩增富含GC的DNA.生物技术 47: 775–779 [公共医学][谷歌学者]

文章来自基因组研究由以下人员提供冷泉港实验室出版社