跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
核酸研究。2008年12月;36(21):e144。
2008年10月21日在线发布。 数字对象标识:10.1093/nar/gkn735号
预防性维修识别码:PMC2588500型
采购管理信息:18940864

高通量染色质免疫沉淀研究实验设计参数的优化

关联数据

补充材料

摘要

高通量、基于微阵列的染色质免疫沉淀(ChIP-ChIP)技术允许体内转录网络的解释。然而,该综合体尚不易获得,部分原因是其许多参数尚未得到系统评估和优化。我们通过系统评估实验设计参数,包括抗体纯度、染色偏差、阵列批次、日间杂交偏差、扩增方法和杂交对照的选择,来解决这一差距。这些优化参数的综合性能表明,使用两种不同的微阵列平台对HL60细胞中Myc基因组结合进行ChIP-ChIP分析的验证率为90%。ChIP-ChIP分析中灵敏度的提高和噪音的降低将使这种方法能够更广泛地用于准确和经济地阐明转录网络。

简介

染色质免疫沉淀(ChIP)和高通量DNA微阵列技术(芯片)的结合为绘制蛋白质-DNA相互作用提供了一种强大的方法(ChIP-ChIP)体内ChIP-ChIP程序首次用于研究酵母转录因子(1–4)最近被用于哺乳动物细胞的类似研究(5–15). 在ChIP-ChIP程序中,使用特异性和对照抗体沉淀基因组DNA,然后标记并杂交到基因组微阵列。已经使用了几种不同的阵列平台,包括近端启动子区阵列(11)、CpG岛阵列(12,15)和全基因组拼接阵列(16,17). 该技术用途非常广泛,可以通过蛋白质-DNA和蛋白质-蛋白质相互作用识别其调控区域受转录因子约束的靶基因。ChIP-ChIP可以应用于任何细胞或组织,使解码基因调控网络成为可能体内当然,分析的能力真诚地ChIP-ChIP彻底改变了靶基因。与信使核糖核酸表达分析不同,转录因子特异性指导的遗传程序可以与随后的下游调控事件区分开来(18–22).

尽管ChIP-ChIP已成为发现转录调控因子基因组结合位点的标准,但实验设计存在很大差异(23). 这种可变性使广泛应用变得复杂和延迟,反映了ChIP-ChIP实验中必须仔细优化的大量参数。例如,作为起始材料的细胞数量或组织数量在不同的研究中差异很大(24,25). 蛋白质-蛋白质和/或蛋白质-DNA交联、染色质超声处理以及抗体敏感性和纯度特征也可能存在显著差异。在大多数研究中,扩增ChIP程序后恢复的富集DNA。已经开发了多种扩增方法,包括连接介导的PCR(25,26),随机引物PCR(27),T7引物PCR(28)和全基因组扩增(WGA)(29)目前尚不清楚哪种方法最适合于ChIP研究。最后,当扩增和标记的DNA与微阵列杂交时,必须选择对照样品,并考虑阵列批次和染料交换状态的影响。

过去十年来,许多研究小组对mRNA表达阵列的实验设计参数进行了广泛评估(30–36). 因此,对关键因素有了很好的了解,并对检测方法进行了优化。例如,可以估计为充分支持特定假设测试问题所需的生物复制次数(37). 尽管有明确证据表明参数优化可以大大提高从阵列分析中检索到的信息的数量和质量,但ChIP-ChIP设计参数尚未得到彻底和系统的研究,并且不能假设mRNA和ChIP-cchip阵列的参数和过程是相同的。

在这里,我们通过为ChIP-ChIP研究提供实验设计参数的综合评估来填补这一空白。通过一系列验证研究,我们解决了之前mRNA表达研究的参数以及ChIP-ChIP实验的特定参数。我们开发了一个特性良好的系统:HL60细胞中Myc癌蛋白的基因组结合,HL60细胞是一种人类髓细胞白血病细胞系,与CpG岛阵列结合(38). 分析了ChIP-ChIP研究成功的许多参数,包括抗体纯度、阵列批次变异性、染色偏差、日间杂交变异性、扩增程序和杂交控制。此外,我们通过使用替代性寡核苷酸阵列平台进行Myc-ChIP-ChIP研究来评估优化参数的综合效果。我们的结果显示实时Q-PCR的验证率很高。这项研究的原始数据包括100多个阵列,已保存在NCBI的基因表达综合(GEO)库中。我们对ChIP-ChIP实验设计的仔细描述是使这项重要技术能够广泛应用于快速阐明全球转录调控网络的关键一步。

材料和方法

抗体生产和纯化

将对应于Myc 1-262 N末端结构域多肽的DNA片段克隆到pET15b载体(Novagen 69661-3)的5′-NdeI和3′-BamHI位点。使用Talon beads(BD Biosciences,Mississauga,ON,Canada)在变性条件下纯化His-c-Myc(1–262)融合蛋白。使用泰龙珠(BD Biosciences)在变性条件下纯化His-c-Myc(1–262)融合蛋白,如下所示,在40 ml pH 8.0的裂解缓冲液(5 mM咪唑、20 mM Tris、500 mM NaCl、10µM ZnCl)中均质细胞颗粒2、6 M盐酸胍、0.1%Triton X-100、1 mMβ-巯基乙醇),并在占空比30和30%输出下超声三次,持续3分钟。然后在4°C下于14000 r.p.m.离心30 min。接下来,用50 ml pH 8.0的结合缓冲液(不含TX-100的裂解缓冲液)洗涤4 ml 50%泰龙珠,并在1800 r.p.m下造粒5 min。在室温下,用洗涤的泰龙珠轻轻旋转培养溶解的上清液1 h,然后在1800 r/p.m下在4°C下离心5 min。用结合缓冲液洗涤珠子一次,用pH 8.0的洗涤缓冲液洗涤一次(用10 mM咪唑结合缓冲液)。将1 ml洗脱缓冲液pH 8.0(与500 mM咪唑结合的缓冲液)添加到小球中,洗脱蛋白质,并在1800 r.p.m、4°C下离心5分钟后收集上清液。检查蛋白质浓度,重复多次洗脱步骤,直到检测不到更多或非常低的蛋白质。然后通过SDS-PAGE检查蛋白质样品的纯度。通过向100µl蛋白质样品中添加900µl 95%乙醇来沉淀变性蛋白质样品,然后在14000 r.p.m.下离心10 min。在装载之前,将颗粒重新悬浮在20µl SDS-loading缓冲液中。将纯化蛋白浓缩至2.8 mg/ml,然后注射到兔子体内。然后将纯化蛋白溶解在每只兔子500µl PBS的体积中。每只兔子用500µg纯化蛋白进行初级免疫。首先用250µg精制蛋白进行强化。随后用50µg纯化蛋白进行了两次增强。然后使用带有蛋白A的Enchant IgG纯化试剂盒(Pall 5300-IGGPROA)对最终出血进行纯化,如下所示:样品用结合缓冲液1:1稀释,并应用于平衡的蛋白A亲和柱。用蛋白A结合缓冲液清洗色谱柱一次,然后用蛋白A洗脱缓冲液洗脱,以回收结合的IgG。然后通过添加50µl pH 9.5的1 M Tris中和每微升纯化部分。

细胞培养条件

HL60(ATCC)细胞保存在含有10%FBS的α-MEM中。

染色质免疫沉淀

指数生长的HL60细胞在37°C下用1%甲醛交联10分钟。通过将甘氨酸添加到最终浓度为0.125 M的溶液中5分钟,然后用磷酸盐缓冲盐水(PBS)进行两次洗涤,来终止交联反应。将细胞重新悬浮在细胞裂解缓冲液(5 mM PIPES pH 8,85 mM KCl,0.5%[v/v]NP40,1 mM PMSF,10µg/ml抑肽酶,10μg/ml亮氨酸蛋白酶)中,在冰上10分钟,然后造粒(5000转/分,5分钟,4°C)。将颗粒重新悬浮在1ml的核溶解缓冲液(50mM Tris–HCl pH 8.1,10mM EDTA,1%SDS,1mM PMSF,10µg/ml抑肽酶,10μg/ml leupeptin)中,在冰上悬浮10分钟,然后使用60型超声去膜器(Fisher Scientific 15-338-53)的8个脉冲(12–13 Watts,设置为每脉冲10,10 s,脉冲间冰上45 s)进行超声处理生成600 bp到1000 bp之间的片段。在21000℃下将裂解液离心10分钟温度为4°C。上清液用IP稀释缓冲液(0.01%SDS、1.1%Triton-X100、1.2 mN EDTA、16.7 mM Tris–HCl pH 8.1、0.2%Sarkosyl、1 mM PMSF、10µg/ml抑肽酶、10μg/ml亮氨酸蛋白酶)稀释至等体积,并用蛋白g-PLUS琼脂糖珠在4°C下预干燥30分钟(圣克鲁斯生物技术公司,加利福尼亚州圣克鲁斯,美国,sc-2002)。使用前,用最终浓度为50µG/ml的鲑鱼精子DNA封闭G-PLUS琼脂糖珠,并在4°C下旋转过夜。稀释和净化提取物对应于10 x 106将HL60细胞与以下抗体在4°C下孵育并旋转约12–16 h:无抗体对照、0.7µg正常兔IgG(圣克鲁斯生物技术sc-2027)、0.7μg N262(圣克鲁兹生物技术sc-764)、N262国产未纯化和纯化抗体,我们通过连续稀释进行经验测定,要使用的抗体量。将50µl鲑鱼精子DNA预阻断蛋白G-PLUS琼脂糖珠添加到每个样品中,在4°C的旋转平台上培养3 h。每个颗粒用1.4 ml超声缓冲液清洗一次,然后用1.4 ml高盐缓冲液清洗两次(0.1%[v/v]SDS,1%[v/v]Triton X-100,1 mM EDTA,50 mM HEPES,500 mM NaCl,0.1%[w/v]脱氧胆酸钠),然后用1.4ml LiCl缓冲液(250mM LiCl,1%[v/v]NP-40,1%[w/v]脱氧胆汁酸钠,1mM EDTA,1mM Tris pH 8)进行一次,最后用1.4ml TE pH 8(10mM Tris pH8,1mM ETTA)进行两次。对于每次清洗,在室温下将颗粒混合5分钟,然后造粒(3000转/分,30秒,室温)。最后一次清洗后,在300µl洗脱缓冲液(1%[w/v]十二烷基硫酸钠,10 mM Tris pH 8,5 mM EDTA)中洗脱微丸,在65°C下培养15分钟,然后造粒(3000转/分,3分钟,室温)。在65°C的温度下,在200 mM NaCl的存在下一夜之间逆转交叉链,并用RNase A(Sigma R5500)处理样品。乙醇沉淀后,将样品重新悬浮在100μl TE(10 mM Tris,pH 7.5,1 mM EDTA)、25μl 5×蛋白酶K缓冲液(1.25%SDS,50 mM Tris,pH 7.5、25 mM EDTA)和1.5μl蛋白酶K(Roche 1413783)中,并在42°C下培养2 h。使用苯酚:氯仿:异戊醇(25:24:1)从每个样品中提取DNA,然后在−20°C下用1/10体积的3 M醋酸钠(pH 5.3)、5μg糖原和2体积的乙醇沉淀过夜。通过微离心收集颗粒,并将其重新悬浮在60μl H中2O。

聚合酶链反应

使用启动子特异性引物对总共2µl的ChIP DNA进行PCR扩增。所有PCR引物(由加拿大ON Oakville的Sigma Genosys或加拿大ON Burlington的Invitrogen合成)在无菌RNase-/DNA无酶水中重新悬浮。通常,在室温下设置的每个10µl PCR反应由每个引物(fwd/rev)的10 ng/µl、1×PCR缓冲液、0.2 mM dNTP混合物、无菌水、DNA模板和0.2µl HotstarTaq DNA聚合酶组成(加拿大安大略省米西索加市齐根,203205);通过在95°C下启动PCR程序15分钟来激活HotstarTaq。使用多个退火温度沿着52–68°C的梯度进行30秒的PCR引物集扩增。引物序列见补充表8所有PCR反应均在含有4µl 10 mg/ml EtBr的100 ml 1.2%琼脂糖凝胶上电泳,然后通过紫外荧光观察。

实时定量PCR

在ABI PRISM 7900-HT(Applied Biosystems,Foster City,CA,USA)中使用SYBR Green试验进行实时定量PCR(Q-PCR)扩增。每个12µl定量PCR反应由以下部分组成:2µl ChIP中分离的DNA、1x PCR缓冲液、2.5 mM MgCl2,0.17 mM dNTP混合物,无菌水,0.25×SYBR Green(Sigma S9430),0.2µl Rox参考染料(Invitrogen 12223-012)和0.05µl铂Taq DNA聚合酶(Invit罗gen 10966-034),在384孔板中进行三次。反应在50°C下开始2分钟,然后在95°C下激活10分钟,然后进行40个95°C循环15秒和60°C循环1分钟。使用人类男性基因组DNA(Novagen 70572)作为标准实时Q-PCR,对三个独立的生物复制品中的每一个进行三次。Q-PCR数据通过计算每个靶基因的Myc/IgG比率和Chr6阴性对照进行分析。然后通过对数得到对称分布2-每个个体比率的转换。统计测试包括使用双尾配对比较每个目标基因与Chr6阴性对照的比率t吨-测试。引物序列见补充表8。引物使用Primer Express Software Version 2.0(Applied Biosciences)设计,参数如下:T型引物长度在19到50 bp之间,最佳引物长度为20个碱基,扩增子长度为80到200 bp。

随机引物PCR扩增方法

免疫沉淀DNA如其他地方所述被扩增(www.micarrays.ca/support/PDFs/ChIP_Protocol_for_Micarray_Analysis_Beeds_corr_01-12-06.pdf)进行以下修改:将15µl A轮与B1轮反应混合物混合,最终体积为100µl[4µl 50 mM MgCl2,10µl 10×PCR缓冲液,2µl 10mM dNTPs,2.5µl 100µM引物B(5′GTTTCCCAGTCACGATC3′),1µl Taq DNA聚合酶(美国威斯康星州麦迪逊市普罗米加,M1861)]。扩增/核苷酸并入程序:(94°C 30 s,40°C 30秒,50°C 30 s,72°C 1 min)×20周期,72°C2 min。

将总共15µl的B1轮与B2轮反应混合物混合,最终体积为50µl[2µl 50 mM MgCl2、5µl 10×PCR缓冲液、0.5µl dNTP Mix B2(25 mM dATP、dCTP、dCTP、12.5 mM dTTP)、1.5µl 2 mM aa-dUTP、1µl 100µM引物B(5′GTTTCCCAGTCACGACGATC3′)、1μl Taq DNA聚合酶(Promega M1861)]。扩增/核苷酸并入程序:(92°C 30秒,40°C 30秒钟,50°C 30 s,72°C 1分钟)×15个周期,72°C 2分钟。使用Microcon柱(Millipore,Billerica,MA,USA,Microcon YM-30)浓缩B2扩增的圆形DNA。一旦ChIP DNA被扩增到3µg,就用10ng扩增的DNA进行PCR反应,并且与最初分离ChIP DNA后进行的反应相同。该PCR用于确定扩增后IgG或NoAb与抗体样本之间的特异性是否保持。

连接介导的PCR扩增

每个ChIP反应的DNA按照别处所述进行处理(26). PCR采用以下循环方案进行:55°C 1个循环2分钟,72°C 5分钟,95°C 2分钟,以及连接介导PCR(LM-PCR)A和LM-PCR B(见下文LM-PCR A和B循环条件)在95°C下30秒,55°C 30秒和72°C下1分钟的相应循环数,在72°C下冷却4分钟,然后在4°C下持续冷却。PCR后,使用QIAquick PCR纯化试剂盒(Qiagen 28106)再次分离DNA。在NanoDrop ND-1000分光光度计上测定纯化DNA的浓度。通常,在第一轮扩增后没有获得杂交所需的3µg,因此将进行另一轮扩增,然后纯化和测定DNA浓度,如前所述。LM-PCR A扩增:20个周期后进行QIAquick PCR纯化,然后15个周期后再进行QIAqueck PCR纯化。LM-PCR B扩增:20个周期,然后QIAquick PCR纯化,依次重复三轮。一旦ChIP DNA扩增到3µg,阳性和阴性对照基因的PCR反应(补充表8)用10 ng扩增DNA进行,与最初分离ChIP DNA后进行的反应相同。此PCR对于确定扩增后IgG或NoAb与抗体样本之间的特异性是否保持是必要的。

标记反应

将来自抗体样品、无抗体或IgG样品的总共3µg扩增DNA真空干燥并重新悬浮在2.5µl H中2O(西格玛W4502)。4.5µl 0.1 M NaHCO在pH值为9时添加。DNA通过多次旋涡重新悬浮。向样品中添加2µl Cy3或Cy5染料(分别为Amersham、PA23001和PA25001)。将混合物在室温下黑暗中培养1.5小时。培养后,添加35µl 100 mM pH H5.2的醋酸钠,并在顶部涂上h2O(Sigma W4502),每个样品的总体积为100µl。使用QIAquick PCR纯化试剂盒(Qiagen 28106)纯化荧光标记探针。用50µl EB缓冲液从试剂盒中洗脱DNA,加热至65°C。使用SpeedVac在最大热量下将100µl混合ChIP和无抗体样品真空干燥60分钟。

DNA微阵列杂交

将混合DNA重新悬浮在5µl H中2O并与85µl杂交混合物混合[100µl DIG Easy Hyb溶液(Roche 603 558)、5µl 10 mg/ml小牛胸腺DNA(Sigma D8661)、5μl 10 mg/ml酵母tRNA(Invitrogen 15401-029)]。将所得溶液在65°C下培养2分钟,然后冷却至室温并应用于CpG岛阵列载玻片(UHN微阵列中心HCGI12K,设计可在网址:www.microrays.ca)并在杂交室中于42°C下孵育过夜。

微阵列清洗

杂交后,在50°C下用洗涤缓冲液1(1×SSC,0.1%SDS)洗涤一次微阵列载玻片5分钟。然后用洗涤缓冲溶液1洗涤(室温下5分钟),用洗涤缓冲2洗涤两次(0.2×SSC洗涤5分钟)和用洗涤缓冲3最后洗涤一次(0.1×SSC在室温下5 min)。然后,在700 r.p.m.下旋转玻片,使其干燥15分钟。为了防止Cy5染料受到臭氧依赖性降解的影响,这是在夏季进行杂交时观察到的,然后将玻片浸入DyeSaver 2(Genisphere Q500600)中并晾干。

微阵列扫描

使用基因Pix 4000B扫描仪(Axon仪器)在多个PMT电压下扫描微阵列载玻片。

使用agilent启动子阵列进行验证

如上所述进行HL60细胞的染色质免疫沉淀。在这种情况下,使用Diagenode BioRuptor声波探测仪(Diagenode,BioRupt 200,UCD-200 TM-EX)进行11次脉冲(设置高,每脉冲26秒,脉冲间冰上26秒)的声波处理,以产生500到1000 bp之间的碎片。使用0.7µg正常兔IgG(Santa Cruz Biotechnology sc-2027)或N262自制纯化抗体进行免疫沉淀,如上所述。按照O'Geen描述的协议执行WGA等。(29). 该方法有效地启动DNA片段,以生成具有定义的3′和5′末端的DNA片段库。然后在初始步骤中使用线性放大复制库,然后进行有限轮的几何放大。使用平均大小为500–1000 bp DNA片段的整个ChIP样本进行文库生成和后续扩增。对于文库准备和扩增(第1轮),使用GenomePlex Complete WGA试剂盒(Sigma WGA2),如下所示。库准备步骤:将2µl库准备缓冲液添加到已浓缩至10µl的ChIP材料中。添加一微升库稳定溶液,并在热循环器中在95°C下加热2分钟,然后立即在冰上冷却。添加一微升文库制备酶,并在预冷至16℃的热循环器中培养(16℃培养20 min,24℃培养20 min.,37℃培养20分钟,75℃培养5 min)。扩增步骤(第1轮):向上一步骤制备的每个样品中添加以下主混合物,7.5µl 10×扩增主混合物,47.5µl无核H2O和5µl WGA DNA聚合酶。样品在热循环器中培养(95°C培养3分钟,然后94°C培养14个循环15秒,65°C培养5分钟)。然后使用QIAquick PCR纯化试剂盒(Qiagen 28106)纯化样品。按照上述PCR标题,对每10 ng扩增样品进行特异性测试。对于扩孔步骤(第2轮),使用GenomePlex WGA扩增试剂盒(Sigma WGA3)。7.5µl 10×扩增主混合液和47.5µl无核H的主混合液2将O和5µl WGA DNA聚合酶添加到之前在无核H中稀释的15 ng纯化扩增产物中2O至10µl体积。然后使用QIAquick PCR纯化试剂盒(Qiagen 28106)纯化样品。如上所述,对扩增样品(10 ng)进行特异性测试。在UHN微阵列中心(加拿大多伦多)将WGA扩增DNA(4µg)与安捷伦2x244启动子阵列杂交。根据我们之前的结果,使用了批号为19585的单批阵列。使用安捷伦基因组DNA标记试剂盒对阵列进行标记,并按照ChIP-on-ChIP v10协议使用aCGH杂交试剂盒进行杂交,如下所示:对于每个1x244启动子阵列,2µg DNA达到26µl最终体积。添加5µl随机引物(与安捷伦基因组DNA标记试剂盒PLUS一起提供),将混合物在95°C下培养3分钟,然后在冰上培养5分钟。将31µl与标记混合物混合至50µl的最终体积(10µl 5×缓冲液、5µl 10×dNTP、3µl 1 mM氰化物3-UTP或1 mM氰化物5-UTP、1µl Exo-Klenow片段),并在37°C下孵育2小时。然后在65°C下灭活酶10分钟。用Microcon柱(Millipore,Microcon YM-30)清洗标记的基因组DNA,并用80.5µl 1×TE洗脱。将5µg Cy5标记的DNA和5µgCy3标记的DNA组合在总体积158µl中。将158µl与50µl的1 mg/ml人Cot-1 DNA、52µl 10×Agilent阻断剂、260µl 2×Agilen杂交缓冲液混合。将样品在95°C下加热3 min,然后在37°C下培养30 min。将490µl样品涂敷到组装在小室中的1x244启动子阵列上,并在65°C和20 r.p.m.的旋转杂交炉中培养40 h。杂交后,用Oligo-aCGH/ChIP芯片上洗涤缓冲液在室温下洗涤微阵列载玻片5分钟,然后在31°C下洗涤5分钟。使用的质量控制指标基于ChIP-on-ChIP要求,没有移除或重复阵列。

CpG岛微阵列数据预处理

首先手动检查阵列图像中的图像伪影,然后使用GenePix Pro(v6.0.1.27)进行量化。选择了一种在不使高强度信号饱和的情况下使动态范围最大化的扫描,并进行了分析。该扫描使用“圆形”分割算法进行量化,然后使用方差稳定归一化算法(VSN)进行预处理。在BioConductor开源项目的R统计环境(v2.4.1)中实现了VSN(39). 使用了vsn软件包的1.12.0版本,打印提示组用作地层,默认参数化,除了使用1000次迭代进行拟合(从默认的10次增加)。所有原始和加工的产品都已在NCBI的GEO存储库中公开,并带有IDGSE8447标准,GSE8448型、和GSE8449标准.

为了测试差异杂交,我们使用了limma包(v2.9.13)中实现的一般线性模型(40)BioConductor开源库的(39)R统计环境(v2.4.1)。首先,对每个主要设计参数:阵列批次、杂交日期和染料状态分别拟合一个点-线模型。没有包括交互项。模型建立后采用了标准误差的贝叶斯调节(40). 然后将高斯核密度拟合到效果估计值,以比较这些设计参数的相对大小。接下来,将使用商用抗体的杂交与使用本地生产抗体的杂交进行比较,得出一个点-线模型。确定了每个分析中的前100个点P(P)-绘制数值以确定抗体特异性的趋势。对纯化和非纯化的局部产生的抗体杂交进行了类似的分析。所有模型填充再次采用limma包(v2.9.13)。为了比较不同的放大方法,我们将不同的线性模型拟合到每种放大方法的放大与非放大比较中。两个样品之间的差异结合点的数量是在整个原始范围内计算出来的P(P)-值阈值从0到1,单位分辨率为0.00 001。使用类似的分析来研究杂交顺序,但模型是同时拟合的,并且使用对比矩阵分别提取每个杂交顺序的影响P(P)-使用的值在0到0.10之间,分辨率为0.0001。这些分析在R(v2.4.1)中进行。所有呈现的基因列表都基于P(P)-的值阈值P(P)<0.05。

安捷伦启动子微阵列数据预处理

使用安捷伦特征提取软件(v9.5)扫描微阵列数据,然后使用limma包(v2.12.0)将其加载到R统计环境(v2.6.2)中。如上所述,使用方差稳定规范化对数组数据进行预处理,并进行1000次迭代,以在这些大型数组上生成高度稳健的结果。预处理在R统计环境中使用了vsn包(v3.2.1)。原始数据和预处理数据经过一系列质量控制措施:所有阵列都包括在随后的分析中。使用的显著性测试t吨-比较抗体和控制通道的测试,然后是经验贝叶斯标准误差的调节(40)以及多次测试的假发现率调整(41). 原始数据和预处理数据已在GEO存储库中提供,并已加入邮编11245.

聚光灯注释

已发布的12k UHN CpG岛微阵列阵列注释基于UCSC构建的人类基因组hg17(38). 为了更新这些结果以用于更完善的hg18构建,我们使用基于BioPerl(v1.5.1)的Perl(v5.8.8)脚本实现了一个新的注释算法(42). 首先,使用bl2seq重叠3′和5′序列读取(43)字号为7。如果发现至少50 bp重叠,则选择聚合序列;否则,选择两个序列中较长的一个。接下来,将这些序列与人类基因组构建hg18的重复掩模过滤染色体序列重复序列比对(44)使用字号为7的本地编译(gcc v4.1.1;AIX 5.2.0.0)NCBI BLASTN可执行文件(45). 选择最匹配的点击作为最可能的杂交区域,并使用前两个点击的长度比率作为交叉杂交可能性的度量。安捷伦默认注释用于寡核苷酸验证实验。

结果

我们对ChIP-ChIP设计参数的分析是在急性髓细胞白血病细胞系HL60中特征良好的Myc癌基因的基因组结合背景下进行的(46). 优化实验使用了包含12192个基因组位置的12k CpG岛微阵列,代表5411个不同的基因组位点(38). 使用安捷伦人类启动子全基因组阵列集进行验证实验。

抗体筛选、阵列分批、相互标记和日间处理

我们的第一系列实验集中于评估ChIP-ChIP分析的四个关键参数。首先考虑抗体选择,因为免疫沉淀步骤为阵列分析提供了起始材料,因此是ChIP-ChIP研究成功的主要决定因素。其次,我们讨论了数组批处理的效果。这可能是一个主要的混淆变量,因为在微阵列载玻片上发现的DNA可能会降低或失去敏感性,甚至用来自单个探测器的不同打印序列打印的阵列也可能显示出变异性。第三,我们评估了样品标记过程中引入的偏差。这种偏倚是指用不同染料标记的相同样品之间的强度差异,可能以多种方式出现,包括两种染料的不同掺入效率、荧光团降解以及光漂白速率或扫描仪诱导的偏倚。第四,我们确定大气臭氧的日常变化、技术处理、扫描仪校准或其他尚未确定的混杂因素是否会影响杂交步骤。

为了评估这些ChIP-ChIP参数的影响,我们进行了一个饱和、完全封闭的实验(图1). 首先,用针对Myc癌蛋白N末端262残基的多克隆抗体对12个交联HL60细胞的独立生物复制品进行ChIP。12个重复中的6个使用商业抗体进行ChIP,其余6个使用针对相同区域的自制抗体。对于这十二个重复的ChIP反应中的每一个,我们探测了两批在印刷年龄上相隔约6个月的阵列。这允许我们评估阵列批处理效果。每个样品与每批样品杂交两次,并进行相互标记。因此,每个生物复制品都被杂交到四个单独的阵列,每个抗体有24个阵列,总共有48个阵列。最后,这48个阵列在7天内分批进行杂交,使我们能够可靠地估计杂交日期的影响(图1).

保存图片、插图等的外部文件。对象名称为gkn735f1.jpg

评价抗体效果的实验设计、阵列批次、相互标记和杂交。实验设计的示意图,其中六个交联HL60细胞的独立生物复制品使用针对Myc癌蛋白N末端262残基的商业或自制抗体进行ChIP。将每个样本与与其匹配的无抗体对照物杂交到单个阵列。虚线箭头表示生物复制#2到#5,为了简单起见,未包含在图中。黑色箭头表示反向标记。虚线表示48个阵列杂交的7天周期。

为了量化抗体选择的重要性,我们比较了针对Myc蛋白的相同N末端区域产生的两种多克隆抗体。一种抗体是从商业供应商处购买的,另一种是本地生产的(图1). 在我们研究的48个阵列中,我们观察到显著的抗体效应。P(P)-比较两种抗体阵列上排名靠前的点的值,观察到线性趋势,表明特异性是可比较的(图2A) ●●●●。然而,尽管复制数量相等,并且其他参数完全阻塞,如下所述,P(P)-商业抗体的值明显较低,表明它具有更好的信噪比特性。为了提高自制抗体的特异性,我们对其进行了纯化,以去除污染的血清蛋白,并以类似的方式比较了纯化和未纯化的自制抗体(图2B) 。再次观察到线性趋势,纯化抗体显示较低P(P)-值大于未净化值。注意P(P)-中的值图2A和B是不同的,因为涉及的复制数不同(图2A、,n个= 24; B、,n个=每种抗体4)。这些数据表明,抗体纯度是影响ChIP-ChIP研究的特异性和敏感性的关键因素,并可能改善某些抗体的性能。

保存图片、插图等的外部文件。对象名为gkn735f2.jpg

测量抗体效果。(A类)使用针对同一部分Myc蛋白制备的商业和国产多克隆抗体对ChIP-ChIP结果进行比较,结果显示出相似的线性趋势和两种抗体的排序(P(P)< 2.2 × 10−16; 然而,它们在灵敏度(轴标度)上存在数量级差异。(B类)自制抗体制剂的纯化提高了灵敏度。该线表示相等的灵敏度(=x个). 注意,轴上的数量级在A部分和B部分之间不同,因为复制数不同(A,n个= 24; B、,n个= 4).

为了评估阵列批处理、染料偏置和日间杂交的影响,我们将逐点线性模型分别与每个参数的结果拟合,并绘制这些影响大小的高斯密度(图3). 这些高斯密度基本上是平滑直方图。他们的身高(-轴)反映了在给定fold-change下受每个参数影响的阵列上的点数(x个-轴)。每条曲线反映了不同的可变性来源(染料、批次和日期)。图下的数字给出了在给定的倍数变化阈值下受每个参数影响的斑点数量。这三条曲线都是单峰曲线,在原点处有一个尖峰。这表明阵列上的大多数点不受每个参数的影响。在受影响的点中,震级通常非常温和,范围为-0.5到+0.5 log2单位。这相当于1.4倍的效果。总的来说,阵列上没有超过10%的点显示出对任何这些参数的巨大变化,这表明所使用的ChIP协议和CpG岛阵列对任何这些因素的扰动都是稳健的。

保存图片、插图等的外部文件。对象名为gkn735f3.jpg

评估阵列批处理效果、染料偏差和日间处理。为了评估阵列批次、染色和杂交数据的影响,我们对这三个参数中的每一个参数的研究数据拟合了单独的点状线性模型。然后为每个模型的拟合系数绘制高斯核密度。每条曲线都是单峰曲线,原点周围有一个尖峰,这表明阵列上的大多数点不会随这些设计参数而变化。图底部的点计数进一步量化了几个阈值(0.5=1.4倍,1.0=2.0倍,1.5=2.8倍,2.0=4.0倍)下的变异程度。

尽管有这种基本的相似性,但这三个参数之间仍存在差异。染料偏压曲线(红色)显示出明显的不对称性,对应于一致的Cy3偏压。虽然只有11个点显示Cy5/Cy3比率为1.4倍或更高,但685个点显示的Cy3/Cy5比率为1.4倍数或更高。这种明显的不对称性突出了在研究中使用的两种染料之间平衡实验的重要性。

数组批处理的效果类似,但不对称性较小。较旧的阵列显示的信号强度始终低于较新的阵列,408个点显示的新旧比率至少为1.4倍,而只有210个点显示类似幅度的新旧比值。这种可变性表明,实验应采用单批阵列或多批随机实验样品进行。

令人惊讶的是,杂交日期的影响几乎影响到阵列上10%的斑点,尽管在这一系列实验中,所有杂交都是由经验丰富的人进行的。这种效应是对称的,大约相等数量的点显示出与日期相关的富集和耗尽。这种偏差的来源尚不清楚。大气臭氧可能与日常情况有所不同。我们和其他人都经历了臭氧导致的Cy5抑制(47,48). 然而,在这种情况下,臭氧不太可能是偏差的来源,因为我们选择在大气臭氧浓度持续低的时候进行这些实验。标记反应效率的变化和随后的柱净化可能解释了这种影响。杂交后洗涤水平的处理变化也可能导致这种日际变化。另一种可能性是,扫描器校准在我们的实验过程中会发生变化,但这里描述的偏差并不依赖于时间(数据未显示)。这表明,如果扫描仪校准是一个问题,那么这是一个随机漂移,而不是渐进退化。

作为此数据的另一种可视化方式,我们提供了每个因素的直方图,如下所示补充图1此外,GEO存储库中提供了原始数据和规范化数据,而线性模型拟合可用作补充表1-3.

放大方法

用于微阵列杂交的足够的DNA通常不能从单个ChIP反应中获得。所需量可通过汇集多个ChIP反应来实现(12),但这种方法成本高昂且劳动密集。此外,当处理生物有限的样本时,例如主要患者材料,可能不可能重复ChIP。实际上,在这种情况下,合并多个ChIP可能会引入样本内异质性(49). 为了克服这一速率限制步骤,通常扩增单个ChIP反应中沉淀的DNA。有多种基于PCR的方法,包括LM-PCR、WGA、随机引物PCR(RP-PCR)和T7引物PCR方法。

我们开发了一种分析方法来评估扩增方案引入的偏差。对于每个扩增方案,我们取一个总基因组DNA池并扩增一份。然后,我们在微阵列载玻片上杂交等量的扩增和未扩增DNA。重复该程序以确定显示放大偏差的斑点的数量和性质(图4A) ●●●●。使用这种方法,我们测试了ChIP-ChIP实验中使用的三种最常见的扩增技术,即RP-PCR、WGA和LM-PCR(图4A) ●●●●。为了考虑LM-PCR方法的参数敏感性,我们评估了低(LM-PCR A,45个循环)和高(LM-PCR B,60个循环)PCR循环数的方案。

保存图片、插图等的外部文件。对象名为gkn735f4.jpg

比较DNA扩增方法。为了评估特定DNA扩增方案是否引入不同程度的偏差,我们调查了三种扩增方案的全基因组效应。(A类)总基因组DNA通过四种不同方案之一进行扩增:随机启动(RP-PCR)、WGA和两种LM-PCR方案(LM-PCR-A和LM-PCR-B)。然后将得到的DNA与等量的未扩增总基因组DNA杂交到CpG岛微阵列。对于三种放大方法中的每种方法,该过程重复四次,并且使用VSN和基于模型的方法对原始数据进行预处理t吨-测试(参见材料和方法部分)。黑色箭头表示反向标记。(B类)根据P(P)-每个放大方法的阈值。这个-axis给出了差异放大点的比例,因此值0.1表示阵列上10%的点受到放大协议的影响。这个=x个线反映了预计仅通过偶然放大就能改变的斑点的比例。所有四条曲线都位于这条线上,表明放大的效果很大。LM-PCR A和WGA的曲线均低于其他两种方法的曲线P(P)-值,表明这两种方法在测试的四种协议中引入的放大偏差最小。插图提供了P(P)-值的范围从0到0.1,其中大多数实验的阈值都是选定的。

对于每种扩增方法,我们将阵列上显示扩增和未扩增样品之间杂交改变的斑点分数视为p值阈值的函数(图4B) 。放大偏差减小的方法将显示较低的曲线,特别是在实验相关的较低曲线上P(P)-价值阈值(图4B、 插图)。与RP-PCR或LM-PCR B相比,LM-PCR A和WGA扩增方法改变了许多较少斑点的杂交。这些数据证明了使用基因组DNA评估各种扩增方案的实用且经济的方法。

杂交控制

ChIP-ChIP研究中使用了多种不同的杂交对照。例如,一些小组采用了“无抗体”控制(12),而其他人则使用了总基因组DNA(11,50). 为了确定这些杂交对照之间是否存在显著差异,我们设计了一系列实验来测试每种方法(图5A) ●●●●。具体来说,我们比较了ChIP样本与模拟治疗对照(直接无抗体)和IgG抗体对照(直接IgG)的直接杂交。我们还将总输入DNA的使用视为“分母”,方法是将ChIP和IgG样本分别与总输入DNA(间接无抗体)杂交,然后在统计分析期间使用线性模型间接比较其强度。结果(图5B) 从一个控件到下一个控件以及在任何给定条件下都具有惊人的不变性P(P)-每个实验中确定的命中次数几乎相同。然而,这两种直接设计以门限依赖的方式显示出比间接方法更高的灵敏度。

保存图片、插图等的外部文件。对象名为gkn735f5.jpg

比较杂交对照。许多潜在的对照样品可用于ChIP-ChIP研究。(A类)比较了三种常用方法,包括两种直接杂交方法(无抗体和IgG)和一种间接杂交方法(非抗体)。对于每种方法,都对HL60细胞中的Myc进行了ChIP-ChIP研究。黑色箭头表示相互标记。(B类)将每种方法的灵敏度绘制为确定为差异界限的点与P(P)-值。虽然这三种方法表现出相似的性能,但两种直接方法的灵敏度高于间接方法。

验证研究

为了评估上述确定的优化参数,我们用它们进行了一个新的Myc-ChIP-ChIP实验。因此,我们使用纯化抗体进行ChIP反应,通过LM-PCR扩增DNA,我们将最近打印的单个CpG岛阵列批次进行杂交,并使用IgG作为杂交对照。染料交换在杂交日期内随机进行,整个实验在高复制水平下进行(n个= 13). 通过使用这种高度优化的设计,我们希望既能减少偏差,又能增加特异性。在对原始数据进行预处理和统计分析后,我们获得了534个Myc结合点的列表(补充表4). 这代表了此阵列平台上5411个不同基因组位点的约9.9%(38). 重要的是,这535个位点中的35个对应于Myc靶基因数据库中注释的已知Myc靶点(51),为该基因列表的有效性提供了有力支持。

为了进一步概括我们的结果,我们随后使用不同的微阵列平台进行了第二次验证实验——镀金全基因组寡核苷酸启动子阵列。我们再次使用优化的参数,使用纯化抗体、单批阵列和IgG作为杂交对照。在第二次验证中,我们使用WGA方法扩增DNA。由于这些寡核苷酸是一个相对较新的平台,我们严格评估了阵列质量,没有发现空间或分布伪影的证据(数据未显示)。经过预处理和统计分析,我们获得了53 453个与c-Myc结合的基因组区域的列表,对应于10 196个独特的基因或基因组特征(补充表5和6). 这代表了11.1%(481 909中的53 453个)的独特基因组区域和28.9%的阵列上的独特基因,表明Myc结合广泛。平均而言,每个独特的基因都由5.24个探针表示,从而在阵列内实现了高水平的内部复制。

CpG岛和启动子阵列的比较因每个阵列上所代表的基因组特征之间缺乏完美的对应而混乱。例如,CpG岛阵列可能询问转录起始位点下游的区域,而启动子阵列询问起始位点上游的区域。然而,我们将注释Entrez基因转录起始位点10 kb范围内的CpG岛阵列与启动子阵列的点击数进行了比较。完全,81%(208/256)在启动子阵列上以10%的FDR得到确认。部分未确认病例归因于所询问的基因组区域的差异,这表明在本研究中,塑性间变异最多为19%。

令人惊讶的是,在我们的全基因组分析中,有很大一部分启动子区域表现出c-Myc结合,我们试图在独立的生物复制上使用金标准Q-PCR来验证这些结果。我们从基因列表中随机选择了50个基因组位点(补充表4-6)和引物对,通过Q-PCR对其进行检测。我们在HL60细胞中使用了三个Myc-ChIP生物复制品,这些复制品与优化或验证研究中使用的任何样品都完全分离。作为阴性对照,我们使用了6号染色体的一个区域,该区域在ENCODE研究中没有显示Myc结合的证据。我们的Q-PCR结果(图6补充表7)验证c-Myc在HL60细胞中的广泛结合,总验证率为45/50。此外,阵列和PCR结果在区域基础上高度相关,两者都具有统计显著性(Spearman的rho=0.533,P(P)= 7.80 × 10−5)和富集程度(斯皮尔曼ρ=0.598,P(P)= 5.77 × 10−6). 这些数据表明,我们优化的ChIP芯片实验参数使我们能够识别新的真诚地Myc靶基因使用两个单独的微阵列平台和定量PCR。

保存图片、插图等的外部文件。对象名为gkn735f6.jpg

Myc募集到生长HL60细胞中新靶基因的调控区域。使用Myc抗体和IgG抗体对指数增长的HL60细胞进行ChIP分析。用引物对50个不同的基因组区域进行Q-PCR扩增DNA。在ENCODE研究的任何细胞系中,六号染色体上的一个阴性对照区也显示出没有Myc结合,并且显示了两次,仅供参考。该区域以黑色阴影显示,并标记为“chr6”。每列代表一个特定区域,由HGNC基因符号标识。当测试同一基因的两个不同区域时,在图中可以两次找到同一基因(补充表8). 这个-axis给出平均对数2|每个基因组区域的Myc/IgG|值。误差条表示SD。

讨论

ChIP-ChIP是一项相对较新的技术,已迅速成为筛选蛋白质-DNA相互作用的标准方法体内然而,这也是一种高度复杂的方法,具有许多可调参数。我们开始系统地测试这些实验设计参数的一大部分。许多先前的微阵列再现性研究都采用了尖峰或混合设计(23,31,33,35)但尚不清楚掺入或混合实验是否再现了真实生物样品的潜在复杂性。因此,我们选择关注一个生物学特性良好的系统:将Myc癌基因作为HL60人类髓系白血病细胞中基因转录的调节器(12).

考虑的第一个实验设计参数是不同抗体对ChIP-ChIP研究结果的影响。直觉上,抗体的性质是ChIP-ChIP研究的一个限制步骤。为了确定不同抗体引起的变异性的下限,我们选择了两种多克隆抗体,它们是针对Myc蛋白的相同部分(N末端262残基,N262)产生的,但来源不同。关键的是,这两种抗体显示出一种广泛的线性、有序的趋势(P(P)< 2.2 × 10−16; Wilcoxon秩检验),但敏感性差异显著(图2A) ●●●●。我们对灵敏度较低的抗体进行柱纯化程序,以去除污染的血清蛋白,这种纯化程序显著提高了性能(图2B) 。显然,抗体选择是ChIP-ChIP研究的关键要素,而抗体特异性活性是杂交前需要考虑的重要参数。

接下来,我们考虑了CpG岛微阵列的带间变异性的影响。此阵列平台已被其他组广泛使用(27,50,52),为其可靠性提供了信心。我们测试了两批阵列之间的可变性,并观察到信号强度的一致偏差,较老的阵列批次显示出较低的信号(图3). 由于我们分析了每批中的24个阵列,这种偏差具有很高的重现性。偏差是对称的,因此可能导致误报和漏报。幸运的是,有简单的方法可以控制这种偏差。首先,只要可能,就应该使用单个批次中的数组。第二,当使用多个批次时,应将样本随机分配到多个批次。第三,线性建模方法可用于明确说明和消除批处理可变性。前两种方法是标准的实验设计实践,而第三种方法已成功用于信使核糖核酸表达阵列数据的分析(53).

第三,我们考虑了使用Cy3和Cy5染料对单个样品进行反向标记(染色浸染)的影响。这一主题已经从理论上进行了广泛研究(54,55),和经验(56)观点。这些研究发现,相互标记的影响很小,但却始终如一。虽然互惠标记比真正的生物复制具有更少的实验价值,但它们似乎比简单的重复测量携带更多的信息(56). 观察到相互标记的效果非常温和,在两倍变化水平上仅影响阵列上约0.1%的斑点(图3). 在不太严格的1.4倍变化阈值下,受染料状态影响的斑点更多,但这种幅度的变化改变斑点状统计分析的风险要小得多。这表明,至少对于具有我们的CpG岛阵列的ChIP-ChIP,没有必要进行相互标记,而染料bias是一个可以忽略不计的混淆因素。然而,为了解释特定实验场景中意外的染色偏倚,似乎谨慎地将样本随机分布在各个染色状态,尤其是因为该参数存在严重的不对称性。

考虑的第四个实验参数是杂交日期的影响。因为我们的实验在所有因素中都完全受阻,所以我们能够用线性模型直接估计这个参数的影响。我们惊讶地发现,杂交的当天对最终结果的影响比阵列批次或染料水的使用更大(图3). 这种偏见的来源尚不清楚。效应的对称分布表明,臭氧状态和扫描仪设置都不是主要因素,这表明扫描仪内存在随机漂移。也许使用机械杂交和清洗站可以减少日间变异性,尽管这种变异性也可能是由于标记反应或随后的色谱柱清理程序造成的。这个因素的控制很简单:样本应该在整个实验日内随机化,以便在不同的日子对给定条件的生物复制品进行杂交。

考虑的第五个实验参数是DNA扩增方法。虽然基于抗体的ChIP协议赋予ChIP-ChIP实验特异性和敏感性,但杂交所需的DNA数量通常无法在单个ChIP中获得。为了应对这一问题,发展了两种基本策略:多个ChIP的合并(12)和ChIP DNA的扩增(26). 各种不同的基于PCR的扩增方法已经开发出来,并被不同的群体使用。评估这些方法的性能具有挑战性。要直接比较扩增的ChIP样本和未扩增的ChIP-样本,需要为每个复制汇集大量的ChIP,这会带来巨大的成本、时间和人力。此外,在实验设计中必须小心,以确保汇集ChIP反应导致的方差减少不会混淆扩增过程的影响。由于这些财务和技术因素,只有一项研究评估了ChIP芯片数据放大方法的性能(23)尽管有几项关于mRNA实验的研究(57,58)那里有大量可用的起始材料。为了解决这个问题,我们开发了一种新的方法,将扩增后的基因组DNA与未扩增的基因组DNA杂交(图4A) ●●●●。我们评估了四种扩增方案:RP-PCR、WGA和两种LM-PCR变体。由于其简单性,该程序可以很容易地重复n个每个扩增过程产生=4。在匹配的扩增样品和未扩增样品之间发现差异杂交的斑点数量是扩增偏差的一个度量(图4B) 。有趣的是,随机捕获的性能介于两个LM-PCR协议的性能之间,这表明协议中的特定参数选择对于确定整体性能非常重要。WGA和低周期LM-PCR协议表现出类似的性能,这表明应选择其中一种方法来最小化扩增偏差。我们比较扩增过程的方法提供了一种新的方法,可以以合理的成本测量变异性,而不受抗体或生物问题的影响。

最后考虑的实验设计参数是选择一个阴性对照物与阵列杂交。我们考虑了三种方法(图5A) 包括两种直接法和一种间接法。对于每种方法,我们在HL60细胞中进行了四次Myc-ChIP-ChIP实验。当我们比较这些方法的敏感性时(图5B) 两种直接方法的表现相似,在IgG和非抗体对照组之间没有显著差异。然而,间接设计在任何给定条件下都显示出降低的灵敏度P(P)-值。因此,直接设计(使用的阵列数量是间接设计的一半)在成本和灵敏度方面都受到青睐。

在广泛优化了这六个参数之后,我们建立了两个Myc-ChIP-ChIP实验,以综合的方式测试我们的优化。我们的第一个实验使用了广泛的生物复制(n个=13),而我们的第二个使用较少的复制(n个=5)在更大的全基因组寡核苷酸启动子阵列上。为了验证这两项研究的结果,我们使用生物独立样本进行Q-PCR。在我们分析的50个独特引物中,有45个被验证,成功率为90%。这强有力的证据表明,在HL60细胞中发现的10 196个与Myc相关的基因组位置中,绝大多数是真阳性。重要的是,我们表明验证率在列表的底部仍然很高。这表明统计分析是保守的,通过放松我们的P(P)-值阈值从0.05到0.10或更高。这一点尤其重要,因为许多已发表的ChIP-ChIP研究使用P(P)-值阈值为0.001,比此处使用的严格50倍(11). 总的来说,我们的广泛验证证实了我们参数优化的成功。

在过去十年中,来自多个小组的一系列研究确定了mRNA表达研究的主要实验设计参数(33,56,59–61). 这些研究的一个共同主题是,有必要使用经验和统计方法来优化实验设计。我们首次全面概述了ChIP-ChIP数据的实验设计参数,测试了与所有微阵列实验相关的参数和ChIP-cchip研究特有的参数。我们发现ChIP-ChIP和mRNA表达设计特征具有良好的一致性。例如,在这两种情况下,间接杂交设计的成本似乎更高,但与更简单的直接设计相比没有显著优势。同样,我们已经证明,生物复制比染料交换更重要,正如mRNA表达阵列所确定的那样(56). 我们还证明抗体特性和扩增方法是ChIP-ChIP研究中变异性的主要来源。例如,使用具有最大比活性的抗体似乎对提高ChIP-ChIP研究的敏感性至关重要。此外,我们还介绍了一种新的方法,用于以抗体相关的方式测试放大偏差。这项研究表明,扩增程序可以显著偏离ChIP-ChIP结果,并提供了一种简单、有效的方法来基准特定扩增协议的偏差。

我们的发现也提出了一些关于抗体和扩增结果的有趣问题。我们证明,在ChIP-ChIP研究中存在抗体特异性基线变异,虽然可以缓解,但不能完全消除。用单克隆抗体或针对蛋白质不同区域的多克隆抗体来复制这些研究将非常有趣。通过这种方式,可能可以确定预测哪些抗体在ChIP-ChIP研究中最敏感或最特异的特征。或者,这可能不是一个可推广的参数,可能是蛋白特异性的。同样,我们提出了一种研究扩增偏差的新技术,并确定了LM-PCR的变体和WGA协议在这方面最有利。然而,这里测试的所有放大协议都引入了大量的偏差。我们的偏倚识别策略应该被证明在减少偏倚扩增协议的开发中是有用的。

我们的所有分析都是研究HL60细胞系中的c-Myc转录因子。虽然这在我们的许多实验中产生了一致的比较结果,但这也意味着我们的结果在形式上仅限于一个生物系统。然而,我们的发现很可能被广泛推广。首先,我们的验证实验使用了一个具有不同特征大小的单独微阵列平台,并再次通过Q-PCR发现了较高的确认率。其次,这里研究的几个参数对许多微阵列研究来说是通用的,包括放大方法的选择以及微阵列和扫描仪的跨波段和跨日变化。特别是,我们的扩增分析与使用阵列CGH和SNP阵列研究基因组变异有关。第三,ChIP反应中使用的抗体质量将影响微阵列、PCR和基于序列分析的技术检索的数据质量。因此,我们预计这些发现将广泛适用于许多领域。

随着ChIP-ChIP研究在其探索的生物学问题的范围和细节上不断拓宽,优化和验证的实验设计的应用将是该领域的一个显著优势。

补充数据

补充数据可从NAR Online获取。

基金

加拿大国家癌症研究所,由加拿大癌症协会资助(018298至L.Z.P.);加拿大卫生研究院(MOP 67048 to L.Z.P.);加拿大研究主席计划(L.Z.P.);Knudson博士后奖学金(发给R.P.);PreCarn基金会奖学金(至P.C.B.);加拿大自然科学与工程研究委员会奖学金(至P.C.B.);21世纪计划奖学金辐射研究优秀奖(P.C.B.);IBM(对I.J.);通过加拿大国家癌症研究所颁发的奖项获得特里·福克斯基金会奖学金(授予S.K.);安大略研究生奖学金(A.S.和A.P.H.)。

利益冲突声明。未声明。

补充材料

【补充资料】

致谢

我们感谢宾夕法尼亚大学实验室在这些实验过程中以及在审阅文章时提供的有益意见,感谢Richard Lu先生对计算机系统的支持和管理。

参考文献

1Iyer VR、Horak CE、Scafe CS、Botstein D、Snyder M、Brown PO。酵母细胞周期转录因子SBF和MBF的基因组结合位点。自然。2001;409:533–538.[公共医学][谷歌学者]
2Lieb JD、Liu X、Botstein D、Brown PO。Rap1的启动子特异性结合通过蛋白质-DNA关联的全基因组图谱揭示。自然遗传学。2001;28:327–334.[公共医学][谷歌学者]
三。Lee TI、Rinaldi NJ、Robert F、Odom DT、Bar-Joseph Z、Gerber GK、Hannett NM、Harbison CT、Thompson CM、Simon I等。酿酒酵母的转录调控网络。科学。2002;298:799–804.[公共医学][谷歌学者]
4Ren B、Robert F、Wyrick JJ、Aparicio O、Jennings EG、Simon I、Zeitlinger J、Schreiber J、Hannett N、Kanin E等。DNA结合蛋白的基因组定位和功能。科学。2000;290:2306–2309。[公共医学][谷歌学者]
5Bieda M、Xu X、Singer MA、Green R、Farnham PJ。E2F1结合位点的无偏定位分析表明E2F1在人类基因组中具有广泛的作用。基因组研究。2006;16:595–605. [PMC免费文章][公共医学][谷歌学者]
6Carroll JS、Liu XS、Brodsky AS、Li W、Meyer CA、Szary AJ、Eeckhoute J、Shao W、Hestermann EV、Geistlinger TR等。雌激素受体结合的染色体全方位定位揭示了需要叉头蛋白FoxA1的长程调控。单元格。2005;122:33–43.[公共医学][谷歌学者]
7Cheng AS、Jin VX、Fan M、Smith LT、Liyanarachi S、Yan PS、Leu YW、Chan MW、Plass C、Nephew KP等。转录因子伴侣的组合分析揭示了C-MYC对雌激素受体α应答启动子的招募。分子细胞。2006;21:393–404.[公共医学][谷歌学者]
8Fernandez PC、Frank SR、Wang L、Schroeder M、Liu S、Greene J、Cocito A、Amati B。人类c-Myc蛋白的基因组靶标。基因发育。2003;17:1115–1129. [PMC免费文章][公共医学][谷歌学者]
9Horak CE、Mahajan MC、Luscombe NM、Gerstein M、Weissman SM、Snyder M.通过哺乳动物chIp-chIp分析在β-珠蛋白基因座中绘制GATA-1结合位点。程序。美国国家科学院。科学。美国。2002;99:2924–2929. [PMC免费文章][公共医学][谷歌学者]
10Kirmizis A、Bartley SM、Kuzmichev A、Margueron R、Reinberg D、Green R、Farnham PJ。人类多梳靶基因的沉默与组蛋白H3 Lys 27的甲基化有关。基因发育。2004;18:1592–1605. [PMC免费文章][公共医学][谷歌学者]
11Li Z,Van Calcar S,Qu C,Cavenee WK,Zhang MQ,Ren B.伯基特淋巴瘤细胞中C-Myc的全球转录调控作用。程序。美国国家科学院。科学。美国。2003;100:8164–8169. [PMC免费文章][公共医学][谷歌学者]
12Mao DY、Watson JD、Yan PS、Barsyte-Lovejoy D、Khosravi F、Wong WW、Farnham PJ、Huang TH、Penn LZ。通过CpG岛阵列鉴定的Myc结合位点分析表明,Max对Myc依赖性抑制至关重要。货币。生物。2003;13:882–886.[公共医学][谷歌学者]
13Pokholok DK、Zeitlinger J、Hannett NM、Reynolds DB、Young RA。激活的信号转导激酶经常占据靶基因。科学。2006;313:533–536.[公共医学][谷歌学者]
14Squazzo SL、O'Geen H、Komashko VM、Krig SR、Jin VX、Jang SW、Margueron R、Reinberg D、Green R、Farnham PJ。Suz12以细胞类型特异的方式与基因组的沉默区域结合。基因组研究。2006;16:890–900. [PMC免费文章][公共医学][谷歌学者]
15Weinmann AS、Yan PS、Oberley MJ、Huang TH、Farnham PJ。通过耦合染色质免疫沉淀和CpG岛微阵列分析分离人类转录因子靶点。基因发育。2002;16:235–244. [PMC免费文章][公共医学][谷歌学者]
16Ishkanian AS、Malloff CA、Watson SK、DeLeeuw RJ、Chi B、Coe BP、Snijders A、Albertson DG、Pinkel D、Marra MA等。一种完全覆盖人类基因组的平铺分辨率DNA微阵列。自然遗传学。2004;36:299–303.[公共医学][谷歌学者]
17Takayama K、Kaneshiro K、Tsutsumi S、Horie-Inoue K、Ikeda K、Urano T、Ijichi N、Ouchi Y、Shirahige K、,、、、、,、Aburatani H等。通过耦合染色质免疫沉淀和基因组微阵列分析鉴定前列腺癌细胞中的新雄激素反应基因。致癌物。2007;26:4453–4463.[公共医学][谷歌学者]
18Guo QM,Malek RL,Kim S,Chiao C,He M,Ruffy M,Sanka K,Lee NH,Dang CV,Liu ET。使用大鼠cDNA微阵列鉴定C-myc应答基因。癌症研究。2000;60:5922–5928。[公共医学][谷歌学者]
19Kannan K,Kaminski N,Rechavi G,Jakob-Hirsch J,Amariglio N,Givol D.参与p53介导的凋亡基因的DNA微阵列分析:Apaf-1的激活。致癌物。2001;20:3449–3455.[公共医学][谷歌学者]
20O'Connell BC,Cheung AF,Simkevich CP,Tam W,Ren X,Mateyak MK,Sedivy JM。c-Myc调节基因表达模式的大规模遗传分析。生物学杂志。化学。2003;278:12563–12573.[公共医学][谷歌学者]
21Stanelle J,Stiewe T,Theseling CC,Peter M,Putzer BM。基因表达对E2F1激活的反应。核酸研究。2002;30:1859–1867. [PMC免费文章][公共医学][谷歌学者]
22Watson JD、Oster SK、Shago M、Khosravi F、Penn LZ。识别以Myc依赖方式调节的基因。生物学杂志。化学。2002;277:36921–36930.[公共医学][谷歌学者]
23Johnson DS、Li W、Gordon DB、Bhattacharjee A、Curry B、Ghosh J、Brizuela L、Carroll JS、Brown M、Flicek P等。使用预定义DNA靶点对ChIP-ChIP实验中的变异性进行系统评估。基因组研究。2008;18:393–403. [PMC免费文章][公共医学][谷歌学者]
24奥伯利MJ,法纳姆PJ。用CpG岛微阵列探测染色质免疫沉淀物,以确定DNA结合蛋白占据的基因组位点。方法酶制剂。2003;371:577–596.[公共医学][谷歌学者]
25Ren B,Dynlacht BD。染色质免疫沉淀分析在哺乳动物转录因子全基因组定位分析中的应用。方法酶制剂。2004;376:304–315.[公共医学][谷歌学者]
26Oberley MJ、Tsao J、Yau P、Farnham PJ。使用CpG岛微阵列对染色质免疫沉淀物进行高通量筛选。方法酶制剂。2004;376:315–334.[公共医学][谷歌学者]
27Paris J,Virtanen C,Lu Z,Takahashi M。肌肉分化过程中MEF2调节基因的鉴定。生理学。基因组学。2004;20:143–151.[公共医学][谷歌学者]
28Liu CL,Schreiber SL,Bernstein BE.基因组DNA基于T7线性扩增的开发和验证。BMC基因组学。2003;4:19. [PMC免费文章][公共医学][谷歌学者]
29O'Geen H、Nicolet CM、Blahnik K、Green R、Farnham PJ。ChIP-ChIP分析样品制备方法的比较。生物技术。2006;41:577–580. [PMC免费文章][公共医学][谷歌学者]
30Bammler T、Beyer RP、Bhattacharya S、Boorman GA、Boyles A、Bradford BU、Bumgarner RE、Bushel PR、Chaturvedi K、Choi D等。实验室间和跨平台的全球基因表达分析标准化。自然方法。2005;2:351–356.[公共医学][谷歌学者]
31Guo L、Lobenhofer EK、Wang C、Shippy R、Harris SC、Zhang L、Mei N、Chen T、Herman D、Goodsaid FM等。大鼠毒理学研究揭示了跨微阵列平台的分析一致性。自然生物技术。2006;24:1162–1169.[公共医学][谷歌学者]
32Shippy R、Fulmer-Smentek S、Jensen RV、Jones WD、Wolber PK、Johnson CD、Pine PS、Boysen C、Guo X、Chudin E等。使用RNA样品滴定评估微阵列平台性能和标准化技术。自然生物技术。2006;24:1123–1131. [PMC免费文章][公共医学][谷歌学者]
33Shi L、Reid LH、Jones WD、Shippy R、Warrington JA、Baker SC、Collins PJ、de Longueville F、Kawasaki ES、Lee KY等。微阵列质量控制(MAQC)项目显示了基因表达测量的平台间和平台内再现性。自然生物技术。2006;24:1151–1161. [PMC免费文章][公共医学][谷歌学者]
34Patterson TA、Lobenhofer EK、Fulmer-Smentek SB、Collins PJ、Chu TM、Bao W、Fang H、Kawasaki ES、Hager J、Tikhonova IR等。微阵列质量控制(MAQC)项目中单色和双色平台的性能比较。自然生物技术。2006;24:1140–1150.[公共医学][谷歌学者]
35Tong W、Lucas AB、Shippy R、Fan X、Fang H、Hong H、Orr MS、Chu TM、Guo X、Collins PJ等。评估微阵列性能的外部RNA对照评估。自然生物技术。2006;24:1132–1139.[公共医学][谷歌学者]
36Canales RD、Luo Y、Willey JC、Austermiller B、Barbacioru CC、Boysen C、Hunkappiller K、Jensen RV、Knight CR、Lee KY等。用定量基因表达平台评估DNA微阵列结果。自然生物技术。2006;24:1115–1122.[公共医学][谷歌学者]
37Wei C,Li J,Bumgarner RE.微阵列实验中检测差异表达基因的样本量。BMC基因组学。2004;5:87. [PMC免费文章][公共医学][谷歌学者]
38Heisler LE、Torti D、Boutros PC、Watson J、Chan C、Winegarden N、Takahashi M、Yau P、Huang TH、Farnham PJ等。源于物理库的CpG岛微阵列探针序列是人类基因组上注释的CpG岛的代表。核酸研究。2005;33:2952–2961. [PMC免费文章][公共医学][谷歌学者]
39Gentleman RC、Carey VJ、Bates DM、Bolstad B、Dettling M、Dudoit S、Ellis B、Gautier L、Ge Y、Gentry J等人。生物导体:计算生物学和生物信息学的开放软件开发。基因组生物学。2004;5:R80。 [PMC免费文章][公共医学][谷歌学者]
40Smyth GK公司。用于评估微阵列实验中差异表达的线性模型和经验贝叶斯方法。统计应用程序。遗传学。分子生物学。2004;第3条[公共医学][谷歌学者]
41Storey JD,Tibshirani R.全基因组研究的统计意义。程序。美国国家科学院。科学。美国。2003;100:9440–9445. [PMC免费文章][公共医学][谷歌学者]
42Stajich JE、Block D、Boulez K、Brenner SE、Chervitz SA、Dagdigian C、Fuellen G、Gilbert JG、Korf I、Lapp H等。Bioperl工具包:生命科学的Perl模块。基因组研究。2002;12:1611–1618. [PMC免费文章][公共医学][谷歌学者]
43Tatusova TA,Madden TL.BLAST 2 Sequences,一种比较蛋白质和核苷酸序列的新工具。FEMS微生物。莱特。1999;174:247–250.[公共医学][谷歌学者]
44Karolchik D、Baertsch R、Diekhans M、Furey TS、Hinrichs A、Lu YT、Roskin KM、Schwartz M、Sugnet CW、Thomas DJ等。UCSC基因组浏览器数据库。核酸研究。2003;31:51–54. [PMC免费文章][公共医学][谷歌学者]
45Altschul SF、Madden TL、Schaffer AA、Zhang J、ZhangZ、Miller W、Lipman DJ。Gapped BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序。核酸研究。1997;25:3389–3402. [PMC免费文章][公共医学][谷歌学者]
46Birnie GD.HL60细胞系:研究人类髓细胞分化的模型系统。英国癌症杂志。1988;9:41–45. [PMC免费文章][公共医学][谷歌学者]
47Branham WS、Melvin CD、Han T、Desai VG、Moland CL、Scully AT、Fuscoe JC。消除实验室臭氧会大大提高微阵列基因表达测量的重复性。BMC生物技术。2007;7:8. [PMC免费文章][公共医学][谷歌学者]
48Fare TL、Coffey EM、Dai H、He YD、Kessler DA、Kilian KA、Koch JE、LeProust E、Marton MJ、Meyer MR等。大气臭氧对微阵列数据质量的影响。分析。化学。2003;75:4672–4675.[公共医学][谷歌学者]
49Bachtiary B、Boutros PC、Pintile M、Shi W、Bastianutto C、Li JH、Schwock J、Zhang W、Penn LZ、Jurisica I等。宫颈癌基因表达谱分析:肿瘤内异质性的探索。临床。癌症研究。2006;12:5632–5640.[公共医学][谷歌学者]
50ViganóMA、Lamartine J、Testoni B、Merico D、Alotto D、Castagnoli C、Robert A、Candi E、Melino G、Gidrol X等。通过全基因组方法确定角质形成细胞中新的p63靶点。EMBO J。2006;25:5105–5116. [PMC免费文章][公共医学][谷歌学者]
51Zeller KI、Jegga AG、Aronow BJ、O'Donnell KA、Dang CV。Myc致癌转录因子应答基因的综合数据库:直接基因组靶点的识别。基因组生物学。2003;4:R69。 [PMC免费文章][公共医学][谷歌学者]
52Krieg AJ、Hammond EM、Giaccia AJ。不同应力下p53结合的功能分析。分子细胞生物学。2006;26:7030–7045. [PMC免费文章][公共医学][谷歌学者]
53密苏里州Semeralul、Boutros PC、Likhodi O、Okey AB、Van Tol HH、Wong AH。发育中皮层的微阵列分析。《神经生物学杂志》。2006;66:1646–1658.[公共医学][谷歌学者]
54Dobbin K,Shih JH,Simon R.反向染料微阵列的统计设计。生物信息学。2003;19:803–810.[公共医学][谷歌学者]
55Dobbin KK,Kawasaki ES,Petersen DW,Simon RM。微阵列实验中染料偏倚的表征。生物信息学。2005;21:2430–2437.[公共医学][谷歌学者]
56He YD、Dai H、Schadt EE、Cavet G、Edwards SW、Stepaniants SB、Duenwald S、Kleinhanz R、Jones AR、Shoemaker DD等。用于比较数据处理方法和实验设计的微阵列标准数据集和优值。生物信息学。2003;19:956–965.[公共医学][谷歌学者]
57Dafforn A,Chen P,Deng G,Herrler M,Iglehart D,Koritala S,Lato S,Pillarisetty S,Purohit R,Wang M,et al.从最少5 ng总RNA进行线性mRNA扩增以进行全球基因表达分析。生物技术。2004;37:854–857.[公共医学][谷歌学者]
58Marko NF、Frank B、Quackenbush J、Lee NH。一种在有义方向上扩增RNA的稳健方法。BMC基因组学。2005;6:27. [PMC免费文章][公共医学][谷歌学者]
59Pan W,Lin J,Le CT。在微阵列实验中检测基因表达变化需要多少重复阵列?混合模型方法。基因组生物学。2002;研究0022。[PMC免费文章][公共医学][谷歌学者]
60Peixoto BR、Vencio RZ、Egidio CM、Mota-Vieira L、Verjovski-Almeida S、Reis EM.使用斑点cDNA微阵列测量基因表达比率的基于参考的双色方法评估。BMC基因组学。2006;7:35. [PMC免费文章][公共医学][谷歌学者]
61Shih JH,Michalowska AM,Dobbin K,Ye Y,Qiu TH,Green JE。基因芯片类别比较中mRNA池化的影响。生物信息学。2004;20:3318–3325.[公共医学][谷歌学者]

文章来自核酸研究由以下人员提供牛津大学出版社