跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
自然遗传学。作者手稿;PMC 2013年5月1日提供。
以最终编辑形式发布为:
2012年9月23日在线发布。 doi(操作界面):10.1038/ng.2416
预防性维修识别码:项目经理3483423
NIHMSID公司:NIHMS404261标准
PMID:23001124

乳腺癌风险相关SNP调节染色质对FOXA1的亲和力并改变基因表达

关联数据

补充资料

摘要

全基因组关联研究(GWAS)已经确定了数千个与人类特征和疾病相关的单核苷酸多态性(SNP)。但由于绝大多数SNP位于基因组的非编码区,因此其风险促进机制尚不明确。我们采用一种新的方法,将顺反子体学、表观基因组学和基因型插补结合起来,对乳腺癌细胞基因组中的非编码区域进行注释,并系统地确定与乳腺癌风险相关的SNP的功能性质。我们的结果表明,乳腺癌风险相关SNP以癌症和细胞类型特异性的方式富集在FOXA1和ESR1的池和H3K4me1的表观基因组中。此外,大多数风险相关SNP调节染色质对远端调控元件FOXA1的亲和力,从而导致等位基因特异性基因表达,例如rs4784227 SNP对TOX3(TOX3)在16q12.1危险位点中发现的基因。

疾病风险相关SNP(raSNP)主要映射到非编码区域1美国国家人类基因组研究所(NHGRI)GWAS目录中70%以上的风险关联缺乏单倍型区内外显子的变异,从而避免了编码序列的中断2.“顺反义体”被定义为在特定处理下对给定细胞类型进行全基因组评估的转录因子的一整套结合位点。同样,“表观基因组”是指对特定细胞类型和治疗具有相同表观基因组标记的整套元素。通过ChIP-seq获得的顺反子和表观基因组确定了调控元件和新转录物在整个基因组编码区和非编码区的位置8重要的是,这表明池和表观基因组是细胞类型特异性的4,5,9,10例如,与其他细胞类型相比,先驱因子FOXA1(也称为HNF3A)和转录因子ESR1(雌激素受体α;也称为ERα)的顺反子在乳腺癌(BCa)细胞中具有独特的分布4,1113类似地,在不同细胞类型的调节元件中发现的特定组蛋白修饰的表观基因组,如组蛋白H3(H3K4me1或me2)上赖氨酸4的单或二甲基化,表明功能调节元件也具有谱系特异性4,5.顺反子和表观基因组之间的相互作用将BCa发育中这两个关键因子的转录活性引导到特定区域,从而驱动正确的基因表达谱11,12,14重要的是,FOXA1在增强子处的差异募集驱动细胞类型特异性转录程序4由于顺位体和表观基因组是细胞身份的来源,我们使用一种新的综合功能基因组学方法研究了BCa-raSNPs与BCa-顺位体和表观基因组之间的功能关系。

风险SNP富集

我们首先从NHGRI提供的GWAS目录中收集了BCa的raSNP坐标15其中,只有四分之一被定位到编码外显子,二十五个定位到内含子,一个定位到FOXA1位点,三个定位到ESR1位点(图1a). 然而,GWAS基因分型微阵列中评估的SNP数量提供了较低的基因组覆盖率;任何给定平台覆盖的所有注释SNP(dbSNP构建135)不到10%16因此,统计上,raSNP更可能与因果变量处于连锁不平衡(LD),而不是因果本身17因此,我们使用HapMap项目数据为每个BCa-raSNP确定了强LD(ldSNP)中所有SNP的列表(补充表1). 我们使用了非常严格的LD阈值LOD>2和D'>0.99。通过这种插补方法,我们将raSNP的覆盖范围扩展到更全面的假定功能性ldSNP列表,定义了raSNP/ldSNP簇(图1b). 我们将与特定疾病或性状(在本例中为BCa)相关的所有raSNP/ldSNP簇的综合集合称为其相关变异集(AVS)。BCa AVS由44个raSNP和1315个ldSNP组成(补充表1). raSNP/ldSNP簇的全基因组分布让人想起许多转录因子(如FOXA1和ESR1)的招募情况,因为它们主要映射到内含子和基因间区域4,11,12,14考虑到ldSNP,映射到编码外显子的raSNP/ldSNP簇数从1个增加到5个,映射到FOXA1和ESR1结合位点的簇数分别从1个增至16个和3个增至19个(图1c). 通过一种新的计算方法计算了这些映射结果的重要性;变量集扩展(VSE)。VSE是一种基于置换测试的方法,它基于随机变量集生成零分布,同时考虑到BCa AVS的异构LD结构(图1d–g; 方法部分提供了详细描述)。这是辛多夫和同事工作的延伸18.VSE显示BCa AVS不富含基因(图1d–e)但对FOXA1和ESR1顺反子有很强的富集作用(图1f–g).

保存图片、插图等的外部文件。对象名为nihms-404261-f0001.jpg

BCa-AVS富含FOXA1和ESR1的顺反池。()乳腺癌(BCa)raSNPs。二进制矩阵编码映射到基因组注释的raSNP。映射计数显示每个注释的raSNP数。(b条)SNP rs704010的单倍型区块。raSNP/ldSNP簇中包含的SNP以红色突出显示。底部一行数字表示每个raSNP/ld SNP簇的ldSNP数量。(c)BCa-raSNP/ldSNP簇。二进制矩阵编码带有至少一个SNP映射到基因组注释的簇。映射计数显示每个注释的簇数。(d–g)直方图和方框图显示了每个注释的映射计数的零分布。空值基于1000个匹配随机变量集(MRVS)。钻石显示了BCa集群的映射计数。红色菱形突出显示映射符合零以外的基因组注释(P<0.001)

我们扩展了VSE分析,将BCa细胞中16种不同转录因子的共72个顺反子和8种不同组蛋白修饰的27个表观基因组包括在内。在BCa细胞系MCF7、T47D和ZR75中进行评估。样品的主要处理是雌二醇(E2),其目的是刺激ESR1。睫状体和表观基因组要么由我们的实验室产生,要么从文献和核受体睫状体项目中获得。分析中仅使用了顺反子和表观基因组的显著峰(P<10e−5)4,19只有满足严格的Bonferroni显著性校正阈值的浓缩分数才被报告(103次测试;P<10−3.3).

在评估的24个不同的BCa表观基因组和外显子和内含子注释中,只有H3K4me1(未处理和处理)显示富集(图2a-c补充表2和3),一种组蛋白修饰,与调节元件相关,主要是增强子。在72个不同的BCa池中,只有FOXA1(三个样品,未处理和处理)和ESR1(一个样品,处理)转录因子显示富集(图2d,e补充表4和5). H3K4me1的富集与FOXA1和ESR1无关。从H3K4me1元件中减去FOXA1和ESR1结合位点后,雌激素治疗下的表观基因组仍然显著(P=10−3.532,补充表6). 使用r时,FOXA1、ESR1和H3K4me1仍然显著2作为LD而非D'的度量,以及r阈值的LOD2=0.8或更大(补充表7、8和9). BCa细胞中这六个富集的池和表观基因组跨越70%(31/44)的BCa-raSNP/ldSNP簇(图2a-e,深色热图行)。当在随后的VSE运行中使用基于DNase可访问性的空分布时,这六个富集事件中的五个也通过BCa AVS显著富集(补充表1011).

保存图片、插图等的外部文件。对象名为nihms-404261-f0002.jpg

BCa-AVS的富集具有因子、细胞型和癌型特异性。(a–f)乳腺癌AVS的变异集富集(VSE)图。每个面板中的方框图显示了标准化的零分布。钻石显示相应的VSE分数。彩色钻石突出显示了基因组注释的映射结果,这些注释满足Bonferroni校正的显著性阈值(P<10−3.3). P值基于1000个MRVS的零分布。二进制矩阵编码raSNP/ldSNP簇,其中至少有一个SNP映射到基因组注释。以深灰色突出显示的行显示了基因组注释的统计显著丰富性。()核心基因注释。(b条)BCa细胞中未经处理的表观基因组。(c)在BCa细胞中处理表观基因组。(d日)BCa细胞中未经处理的池。(e(电子))BCa细胞中经处理的池。((f))对照细胞系的睫状体和表观基因组。()前列腺癌AVS与FOXA1池的VSE图。(小时)骨密度AVS对ESR1池的VSE图。()结直肠癌AVS对H3K4me1表观基因组的VSE图。

对BCa细胞中所有池和表观基因组的BCa-AVS的VSE分析表明,FOXA1、ESR1池和H3K4me1表观基因组富集具有高度的因子特异性(图2a-e). 然而,由于并非所有FOXA1或ESR1顺反子都显示出显著的VSE评分,因此不能完全放弃研究中分析的其他转录因子的富集。核受体Cistrome项目数据集具有高度异质性;MCF7细胞中FOXA1结合位点的数量在数量级上有所不同,这取决于来源实验室。考虑到我们将44个raSNP与成千上万个结合位点交叉,结合位点数量减少了10倍,大大降低了我们检测富集的能力。

BCa-AVS对FOXA1、ESR1和H3K4me1的富集也是癌症和细胞类型特异性的。我们使用前列腺癌(PCa)、骨密度(BMD)和结直肠癌(CRC)的AVS分别控制FOXA1、ESR1和H3K4me1的富集(补充表12,1314). 前列腺癌的发展依赖于FOXA1,骨密度受雌激素信号的影响,结直肠癌AVS富含肿瘤样本中的H3K4me1表观基因组20这些AVS均未在乳腺癌细胞的靶池或表观基因组中富集,表明BCa-AVS对这些池和表观基因组的富集是癌症类型特异性的(图2g–i、和补充表15、16和17).

相反,检测乳腺癌AVS在前列腺、骨和结肠细胞系(LNCaP、VCaP、人类转移癌组织、U2OS和Caco-2)中的富集情况。在这些细胞系中评估的纤毛和表观基因组的因子和修饰,包括FOXA1、ESR2、AR和H3K4me1,没有显示BCa-AVS的富集,表明BCa-AVS的富集是细胞类型特异性的(图2f补充表18).

FOXA1调制

获得这些结果后,我们测试了BCa-raSNP/ldSNP簇破坏FOXA1向染色质正常募集的能力。我们将碱基对改变结合基序识别的机制称为亲和力调制。使用一种新的计算方法,即基因组内复制(IGR),我们能够准确预测SNP的亲和性调制。该方法描述了给定转录因子对SNP的参考和变异等位基因的亲和力,同时解释了其上下文序列。转录因子对长度为K(K-mer)的特定DNA序列的亲和力可以通过对该转录因子的全基因组ChIP-seq数据集中的结合数据进行平均来获得。我们将此测量称为该K-mer的亲和力模型。如果经典结合基序被变异等位基因改变,结合因子可以通过移动几个碱基或反转其方向来找到更高的亲和力配置。IGR通过在感兴趣的SNP周围的K-mers的滑动窗口上计算亲和力模型来解释位移效应(图3a). 通过这个过程,用于增加K值的亲和模型集合被放置在一个晶格结构中,该晶格结构连接相隔一个碱基对的K单体。构建了两个格子,每个格子对应一个变异等位基因(图3b). 然后根据其信噪比过滤每个格中的亲和模型(方法部分提供了详细描述)。格中剩余亲和模型的最大值用于计算IGR得分和p值(图3c). 根据SNP的基因组背景,最大值之间的比较代表了每个等位基因的最高亲和力。对于同一组256 K-mer,亲和力模型得分与位置加权矩阵(PWM)得分几乎没有相关性(图3d). 针对给定转录因子推导的模型在实验室和细胞系中是一致的(图3e–f). 由于染色质景观是转录因子和DNA之间相互作用的已知障碍,我们将K-mer搜索限制在有利于结合的染色质区域21当K-mer实例没有根据有利的染色质景观进行筛选时,高度排序的K-mer的亲和力被低估(图3g).

保存图片、插图等的外部文件。对象名为nihms-404261-f0003.jpg

基因内复制方法。()亲和力模型是在参考(C,蓝色)和变异等位基因(T,红色)的感兴趣SNP周围的K-mers滑动窗口上计算的。(b条)连通K-mer亲和模型的晶格结构。(c)对应于8-mers的晶格行。每个编号为1到8的单元格对应于一个亲和力模型。每个细胞右侧的顶部数字表示每个8 mer的基因组匹配数。底部数字表示所有8-mer匹配的平均绑定信号。灰色数字表示由于匹配数量不足而丢弃晶格中的单元格。彩色线条显示了以每个8-mer匹配为中心的400 bp窗口上的平均结合曲线。黑线显示了加扰的8-mer序列的平均结合曲线。(d日)基因内复制(IGR)一组256个8-mers的MCF7细胞中FOXA1的亲和力得分,与基于相同256个8 mers组的叉头(FKH)基序的位置加权矩阵(PWM)得分相对照。(e(电子))比较两个独立实验室获得的MCF7细胞FOXA1的IGR评分。((f))比较MCF7 BCa细胞和LNCaP PCa细胞中FOXA1的IGR评分。()使用或不使用H3K4me2可及性过滤器获得的MCF7细胞FOXA1 IGR评分的比较。

FOXA1的招募取决于对叉头(FKH)基序的识别(图4a). 我们通过生成30个10-mers的集合来探索FKH基序的亲和景观;FKH基序中十个位置的每一个可能变化对应一个(图4b–d). PWM有助于识别转录因子结合位点,但其分数与结合亲和力相关性较差(图4b,d–e). IGR方法可以准确预测30个10-mers的亲和力调节特性(图4c–e). 此外,转录因子和DNA之间的物理联系不能被单独考虑基序的每个碱基的PWM完全捕获。基序一侧的变化可以加剧或补偿另一侧的变化。我们将这种现象称为基序之间的相互作用效应。如果忽略上下文序列,这些影响可能非常显著,甚至可以逆转等位基因的亲和力调节特性(补充图1).

保存图片、插图等的外部文件。对象名为nihms-404261-f0004.jpg

BCa-raSNP rs4784227通过改变叉头(FKH)基序来调节FOXA1亲和力。()FKH图案的序列标志。(b、 c(c))FKH基序位置加权矩阵(PWM)和FOXA1基因组内复制(IGR)分数针对FKH基序的每个单个碱基变异。将值归一化为标准FKH基序(红线)的各自得分。灰色区域显示PWM得分的范围。(d日)FKH部位得分最高的每个变体的MCF7中的FOXA1 ChIP-qPCR。每次测量基于三个重复。通过ChIP-qPCR检测的每个位置的FKH变体以颜色和粗体突出显示b条c. (e(电子))MCF7中FOXA1 IGR评分和FOXA1 ChIP-Seq剖面之间比较的散点图和回归。插图显示了FKH PWM分数和ChIP-Seq配置文件之间的比较。((f))SNP rs6983267和rs4784227的IGR配置文件。彩色数字:实例之间的平均绑定。黑色:IGR获得的p值的-log10。灰色:基因组中K-mer实例的数量。

SNP rs4784227与BCa相关,预计会破坏一个未确定转录因子的结合22它也是一个直接映射到FOXA1结合位点的raSNP(图1a). 该raSNP位于FOXA1识别的FKH基序的第八位(图4a). 该SNP的上下文序列不同于典型的FKH基序;FKH基序的PWM预测,与参考C等位基因相比,变异T风险等位基因rs4784227的亲和力增加了9%(6.24 T等位基因vs.5.734 C等位,图4b). 考虑到基序位置之间的相互作用效应,IGR方法预测与参考C等位基因相比,变异T等位基因的亲和力增加了63%(倍数变化1.63,P<10e−10,图4f补充图1). 以前的报告显示,结肠癌细胞中风险相关rs6983267单核苷酸多态性的等位基因特异性TCF4募集2325.IGR验证了TCF4的rs6983267亲和力调制(折叠变化=1.59,P<10−10,图4f). TCF4评估的BCa-raSNP rs4784227和FOXA1评估的结肠癌raSNP rs6983267的IGR评分之间的比较表明,亲和力预测是因子特异性的(倍数变化~1;P>0.05,图4f).

在探测单个raSNP后,我们将IGR方法应用于所有raSNP/ldSNP簇,发现BCa-AVS富含FOXA1的亲和调节SNP(补充表19). 在BCa AVS中的44个raSNP/ldSNP簇中,33个包含映射到BCa细胞中FOXA1池蛋白或H3K4me2表观基因组的SNP。这些簇包含可以创建或销毁FOXA1结合位点的区域;这些是本分析中考虑的唯一集群4对于每个簇,我们计算了FOXA1或H3K4me2区域中所有SNP的IGR得分,并计算了每个簇中亲和力调节SNP的数量。然后,我们使用VSE方法为随机化簇集中的亲和力调制变体的数量生成一个零分布。亲和力调节的显著性阈值基于Bonferroni校正,该校正考虑了所有排列的所有测试(P<10e−6). 在映射到FOXA1或H3K4me2区域的33个簇中,有24个簇(73%)包含亲合力调制SNP(P=0.009,图5a). 这意味着一半以上与乳腺癌相关的SNP调节了FOXA1的亲和力。对四种乳腺癌细胞系(MCF7、BT474、T47D和ZR75-1)中被预测破坏FOXA1结合的SNP进行基因分型,在至少一种细胞系中鉴定出13个SNP(包括rs4784227变异体)杂合。77%(10/13)的预测SNP表明,FOXA1的等位基因特异性结合偏好是由体内等位基因特异性ChIP分析(图5b). 这种综合方法验证了IGR识别亲和调制SNP的能力。

保存图片、插图等的外部文件。对象名为nihms-404261-f0005.jpg

BCa-AVS富含亲和调节SNP。()FOXA1亲和力调节raSNP/ldSNP簇在BCa-raSNPs中具有定位到FOXA1或H3K4me2位点的SNPs的所有簇中的百分比。直方图显示了超过1000个MRVS的该百分比的零分布。(b条)在BCa细胞系中发现的13个杂合SNP的等位基因特异性ChIP-qPCR结果。轴表示每个SNP的变异和参考等位基因之间FOXA1结合水平的对数转换倍变化。红色表示显示IGR预测的FOXA1具有显著且一致的等位基因特异性结合偏好的SNP。

TOX3(TOX3)破坏,破坏

为了证明体内通过VSE和IGR方法鉴定的破坏性SNP可以促进BCa的发育,我们关注的是MCF7 BCa细胞中的BCa-raSNP rs4784227杂合子。杂合性使我们能够在自然基因组背景下确定变异体的等位基因特异性功能。SNP rs4784227与FOXA1结合位点内的FKH基序直接重叠,该结合位点位于距离基因18 kb的调控元件(标记为H3K4me2)中TOX3(TOX3)基因(也称为TNRC9公司复合年增长率9;图6a、b). IGR方法预测,与参考C等位基因相比,变异T等位基因将有利于FOXA1结合(图4f补充图1). 因此,等位基因特异性定向ChIP分析体内确认FOXA1优先招募为T风险等位基因(图6b). 这与H3K4me2的变化无关,H3K4me2是有利于FOXA1结合的表观遗传标记,因为MCF7 BCa细胞中rs4784227的T和C等位基因之间的H3K4 me2水平相等4(图6a). 虽然FOXA1通常促进基因表达,但与Groucho/TLE蛋白共同结合染色质会导致局部染色质浓缩和转录抑制26与C等位基因相比,与FOXA1结合增加相关的rs4784227的风险变异T等位基因也显著受Groucho/TLE的结合(图6c). 此外,与C等位基因相比,H3K9Ac(活性增强子的染色质特征)在T等位基因处的富集程度显著降低7(图6d).

保存图片、插图等的外部文件。对象名为nihms-404261-f0006.jpg

BCa-raSNP rs4784227通过FOXA1亲和性调制干扰增强子功能。(a–d)在rs4784227处进行H3K4me2组蛋白修饰(增强子)、FOXA1和TLE结合以及H3K9Ac(活性增强子)的ChIP-qPCR。C等位基因是参考基因,T等位基因则是风险变体。(e、 (f))3C测序结果显示了增强子处杂合SNP(rs4784227)和TOX3(TOX3)内含子(rs2193094)。()中两个等位基因的RNA和DNA水平之间的比率TOX3(TOX3)内含子。误差线,SEM来自三个重复测量。

使用BglII或MspI限制酶进行的染色质构象捕获分析(3C)表明,rs4784227区域与TOX3(TOX3)基因(图6e、f). 因此,TOX3(TOX3)是含有rs4784227的调控区的基因靶点。为了评估rs4784227等位基因对TOX3(TOX3)基因表达,我们在TOX3(TOX3)在MCF7细胞中。对3C产物进行测序表明,rs4784227的参考C等位基因和变异T等位基因分别与rs2193094的T和G等位基因有物理联系(图6e、f补充图2). 等位基因特异性表达分析表明,与G等位基因相比,rs2193094的T等位基因优先表达,表明变异T等位蛋白在rs4784227处具有抑制作用(图6g). 这与之前的结果一致在体外荧光素酶报告分析22.

MCF7细胞的RNA-Seq数据显示了6个基因(TOX3、CHD9、RBL2、AKTIP、RPGRIP1L和FTO)在以rs4784227 SNP为中心的~3.5 Mb基因组窗口中表达(补充图3). 除了第一个内含子中的rs2193094 SNP外TOX3(TOX3),我们在瑞士法郎9自由贸易组织(分别为rs35925303和rs11646260)。而rs2193094的变异G等位基因与TOX3(TOX3)与参考T等位基因相比,rs35925303的变异和参考等位基因的RNA水平没有显著差异(瑞士法郎9)或rs11646260(自由贸易组织)单核苷酸多态性(图7a). 此外,我们对11个ESR1+和FOXA1+乳腺癌细胞系中的rs4784227单核苷酸多态性进行了基因分型,并提取了其表达数据TOX3(TOX3)来自Neve乳腺癌细胞系数据库1只有一个细胞系T47D是rs4784227的T等位基因纯合子。相应地,T47D的TOX3(TOX3)将所有杂合(N=3)细胞系与纯合的rs4784227的C等位基因(N=7)细胞系进行比较,我们观察到rs4784277的T等位基因与TOX3(TOX3)(单侧p=0.046,图7b). 该关联与之前的一项研究一致,该研究确定了rs3803662 SNP与TOX3(TOX3)1401例欧洲血统乳腺癌患者的基因表达27在欧洲血统个体中,rs3803662 SNP与rs4784227 SNP在显著LD中(r2=0.864,D'=1,HapMap CEU)(补充表20). 事实上,rs4784227的T等位基因只与rs3803662的A等位基因分离,这也与TOX3基因表达减少有关,支持我们的结论,即rs4784277的功能性T等位蛋白与TOX3(TOX3)此外,我们还包括了其余五个基因(CHD9、RBL2、AKTIP、RPGRIP1L和FTO)在e-QTL分析中以rs4784227为中心的~3.5 Mb窗口中表达(图7b补充图3). rs4784227单核苷酸多态性与这些基因的表达没有显著相关性。总的来说,这表明等位基因特异性表达对于TOX3(TOX3)依赖于rs4784227单核苷酸多态性。

保存图片、插图等的外部文件。对象名为nihms-404261-f0007.jpg

BCa-raSNP rs4784227通过干扰细胞增殖TOX3(TOX3)基因表达。()每个SNP的DNA和RNA水平的变异和参考等位基因之间的比率(rs2193094TOX3(TOX3); rs35925303英寸瑞士法郎9; rs11646260英寸自由贸易组织). (b条)基于细胞系的SNP rs4784227的e-QTL结果和基因表达水平TOX3(TOX3)(rs4784227:T47D,T/T;HCC1428,C/T;MCF7,C/T,MDA-MB-415,C/T。UACC-812,C/C。(c)ZR75-1细胞中的TOX3沉默。(d日)2天后计数的细胞数TOX3(TOX3)沉默。N.S.,不显著;*,p≤0.05;**,p≤0.01;***,p≤0.001。误差线,SEM来自三个重复测量。

为了评估TOX3在乳腺癌细胞中的作用,我们在沉默后进行了细胞增殖试验TOX3(TOX3)我们使用了ZR75-1乳腺癌细胞系,因为它的高表达水平TOX3(TOX3).沉默TOX3(TOX3)与对照治疗(抗荧光素酶siRNA)相比,ZR75-1乳腺癌细胞的细胞增殖显著增加,表明TOX3在乳腺癌细胞中起抑癌作用(图7c、d).

讨论

BCa-raSNP的潜在机制尚不清楚。与大多数其他复杂性状一样,这些raSNP映射到基因组的非编码区域2在这里,我们证明BCa-raSNP富含FOXA1和ESR1转录因子结合位点以及H3K4me1组蛋白修饰。此外,我们发现这种富集是因子特异性的、细胞类型特异性的和癌症类型特异性的。支持GWAS raSNPs调控机制的证据正在稳步增长2831在转录起始位点100 bp内具有差异等位基因占有率的杂合位点已被证明与差异基因表达密切相关,并可富集GWAS SNP32FOXA1先驱因子的结合是染色质开放和核小体定位的中心,有利于转录因子募集4,11,12,33,34此外,FOXA1对ESR1阳性BCa细胞中雌激素刺激反应的转录程序的建立至关重要4,11,12,33,35,36.

在难以捉摸的BCa-raSNP中,rs4784227是研究最多的。16q12.1位点,包含rs4784227和TOX3(TOX3)在欧洲、亚洲和非洲血统人群中,该基因通过GWAS与乳腺癌相关374016q12.1基因座的精细定位显示,rs4784227是欧洲和亚洲人群中关联性最强的SNP22,41.体外实验表明,风险等位基因T降低荧光素酶活性并改变DNA蛋白结合模式,表明rs4784227具有调节作用22在功能上,TOX3属于染色质结构修饰蛋白的HMG-box家族42主要表达于上皮细胞,靶向抗凋亡和促凋亡转录物,防止细胞死亡43此外,它刺激雌激素反应元件(ERE)依赖性转录程序43.从统计角度来看,TOX3(TOX3)在复发为骨的乳腺癌中有差异表达44基因中包含的SNP与BRCA1或BRCA2的突变相互作用,增加乳腺癌风险45在这里,我们显示rs4784227的风险等位基因T使TOX3(TOX3)基因表达。这种减少是由于rs4784227所在增强子对FOXA1的亲和力增加。FOXA1结合与TLE阻遏物的招募有关,这会降低增强子的强度(H3K9Ac减少)。由染色质环介导TOX3(TOX3)启动子,减弱的rs4784227增强子下调基因的转录输出(图8). 癌症风险相关SNP的这种作用机制,即远端增强子处转录因子结合的中断和随后的基因表达变化,如结直肠癌中的报道,似乎是风险相关SNPs的一种常见作用机制2325.

保存图片、插图等的外部文件。对象名为nihms-404261-f0008.jpg

的示意图TOX3(TOX3)位点和16号染色体同源物之间和内部的物理相互作用。

与疾病相关的单核苷酸多态性的数量与功能性特征的单核苷酸多样性的数量(rs6983267、rs4784227和rs1859962)之间存在显著差异46,47因此,无法推断任何特定疾病的遗传风险促进的一般机制。这里,我们表明,对于BCa,大多数风险相关SNP调节FOXA1结合。首先,它们与FOXA1结合位点中包含的SNP处于完全连锁不平衡状态。其次,这些关联的SNP能够显著改变FOXA1的招募。FOXA1等先锋因子和ESR1等谱系特异性因子是建立细胞身份的转录程序的基础4因此,我们已经证明,大多数能够破坏正常乳腺细胞特性的SNP调节FOXA1先锋因子的结合。

是时候转向GWAS后人类遗传学阶段了48Freedman等人提出了一套用于GWAS后癌症风险位点功能表征的原则46但在实现这一转变之前,仍有一个主要障碍需要克服。GWAS raSNP的数量庞大且不断增长,每个raSNP都有数百或数千个ldSNP。此外,由于大多数ldSNP位于调控区域,每个ldSNP都有一系列潜在的基因靶点。这种分支泥沼使得对所有GWAS结果进行详尽的函数表征是不可行的。需要一种机制来优先考虑这一点,而不是假定的因果SNPs的丰度。本研究中开发和应用的方法提供了这种机制(补充图4). 首先,他们确定最有希望的转录因子、组蛋白修饰或其他基因组注释(VSE)。其次,他们在数千个ldSNP中确定候选SNP,用于实验性后续研究(IGR)。功能基因组数据的整合将使GWAS后风险位点的特征化得到牵引和推进。

URL。NHGRI GWAS目录,www.genome.gov/gwastudies网站; 核受体Cistrome项目,肉苁蓉.dfci.harvard.edu/NR_cistrome/.

联机方法

计算方法

变量集丰富

变异集富集(VSE)是一种计算方法,用于计算基因组注释中一组变异的富集或缺失分数和p值。基因组注释是染色体坐标的列表,特定的属性或功能属于该坐标。单核苷酸多态性(SNPs)用于全基因组关联研究(GWAS),以寻找潜在遗传特征和疾病的变异。尤其是疾病风险相关SNP(raSNP)是本研究的重点,也是用于富集测试的变体集的组成部分。包含在raSNP单倍型块中的SNP称为其ldSNP(连锁不平衡SNP)。每个单独的raSNP及其ldSNP集合称为raSNP/ldSNP簇。与单个性状或疾病相关的所有SNP的簇集又称为该性状或疾病的相关变异集(AVS)。

第一步是从GWAS目录中获取感兴趣疾病的所有raSNP(http://www.genome.gov/gwastudies网站/). 然后,我们通过使用HapMap项目数据(UCSC Genome Browser的CEPH-HapMap Linkage Disequibation Phase II表,hg18,hapmapLdPhCeu),确定每个raSNP的强LD(ldSNP)中所有SNP的列表。我们使用基于LOD>2和D'>0.99的高强度LD阈值。单倍型区块大小不均匀且多孔,即强LD值在区块中不连续,并且散布着无链接的变体(图1a). 计算的第一个指标是AVS和基因组注释之间的映射一致性。映射计数是AVS中至少有一个ldSNP与基因组注释重叠的raSNP/ldSNP簇的数量。BEDTools套件中的intersectBed程序用于计算染色体坐标之间的重叠。每个raSNP/ldSNP簇独立相交。定位计数是AVS和基因组注释之间功能关系的初步测量。映射计数也是混杂因素的函数,例如单倍型块的大小和结构以及基因组注释的丰度和分布。为了纠正这些因素,我们在随机排列AVS的基础上为映射计数建立一个空分布。

为了解释AVS中单倍型块的大小和结构,每个置换变体集逐簇与原始AVS匹配。为了解释注释的基因组异质性,从GWAS(Illumina HumanOmniExpress)中使用的标签变体的综合列表中随机抽取一组变体。对于每个随机采样的标签SNP(pseudo-raSNP),其ldSNP集合是从HapMap数据中插补的。每个集合都是由一组与AVS的大小和结构匹配的伪raSNP/ldSNP集群组成的。我们将其称为匹配随机变量集(MRVS)。通过这个过程,采样列表中具有给定数量LD变体的所有变体都被合并在一起。对于AVS中的每个raSNP,从与其LD变体数量相匹配的bin中随机选择一个伪raSNP。在每个料仓内进行替换取样,并检查其在料仓中的分布,以确保没有料仓耗尽。AVS中包含的所有raSNP都将从采样列表中删除。最后,获得了MRVS中所有伪raSNP和ldSNP变异体的染色体坐标。

然后,我们通过将MRVS集合与注释交叉,得出AVS和基因组注释之间映射符合的零分布(图1d–g,灰色直方图)。具体地说,我们估计了仅凭偶然机会就能找到一组映射计数等于观测到的变量的变量的概率。为了获得在基因组注释中可比较的富集分数,每个AVS映射计数以中位数为中心,并按其零分布的标准偏差进行缩放。因此,浓缩分数是映射计数偏离空映射计数平均值的标准偏差数。

如果AVS映射计数在空值范围内,则可以直接从空值分布中获得近似的p值。这被计算为具有比AVS更极值的MRVS的数量与MRVS的总数之间的比率。根据使用分布的哪一端,我们可以获得富集或耗尽的p值。当映射计数接近null范围的末尾时,它变得越来越不精确。当映射计数超出空值范围时,p值小于空值中MRVS数量的倒数。精确的p值需要将密度函数拟合到MRVS得出的零分布。Kolmogorov-Smirnov检验用于检查分布是否显著偏离正态性。如果零分布未通过Kolmogorov-Smirnov检验,则使用Box-Cox程序查找接近正态的零分布转换。如果Box-Cox程序未能规范化空值,则该测试被视为无意义。然后根据密度函数计算精确的p值。所有方法都是在R统计环境中实现的。使用的函数和包:box.cox(car)、ks.test(stats)、pnorm(stats”)。

非不相交raSNP/ldSNP簇的VSE

本研究中考虑的大多数AVS都有一个或多个raSNP与ldSNP的共同点。在这种情况下,必须对VSE使用特殊的评分程序,以确保当只有一个ldSNP映射到功能基因组元件时,不会多次计算raSNP。这将导致地图计数虚增,并可能导致误报。创建了一个程序LDXI(带交叉点的连接不平衡扩展),用于计算raSNP集合内的所有交叉点。由一个或多个raSNP共享的ldSNP成为单独的raSNP/ldSNP集群。我们将其称为集群的“交集”类,并在计算映射计数时将其单独处理。其余的ldSNP与VSE的标准版本一样被分为raSNP/ldSNP集群,并被添加到“unique”类中。因此,相交簇和唯一簇的列表是不相交的。非不相交VSE评分算法的工作原理如下。按照标准VSE中的方式统计所有唯一集群。在唯一计数中查找每个交叉点簇中的所有raSNP。如果集群中的所有raSNP都被占用,则丢弃集群。如果簇中至少有一个raSNP不在唯一计数中,请将簇向映射计数计数一次。这种计数机制确保了计数的每个raSNP都至少有一个假定的功能变体,以解释其与任何其他raSNP不共享的关联。

基因组内复制

基因组内复制(IGR)是一种计算方法,用于计算SNP在转录因子结合位点产生的亲和力调节。该方法需要转录因子ChIP-ChIP或ChIP-seq数据和人类基因组序列。K-mer和转录因子之间的亲和力可以通过以下方式从ChIP-seq数据中获得。首先,在全基因组范围内搜索K-mer的所有实例。其次,从ChIP-seq数据中检索K-mer每个实例的绑定信息。最后,对来自ChIP-seq数据集的信号在所有实例中进行平均,以获得该K-mer的亲和模型。每个模型都是根据K-mer的频率从不同数量的实例中导出的。

使用一组加扰K-mers获得每个模型的基线亲和力,并根据亲和力分离序列和组成的导入(补充图1,黑色型材)。在不同的K值上,每个K-mer的实例数可变,这会混淆滑动窗口之间的比较。我们选择了1000个实例的严格截止值,根据晶格中每个节点的信噪比丢弃不可靠的观测值(图3c). 此外,在K的可能值中,八个在实例数和序列特异性之间提供了一个很好的折衷。这两个8元亲和模型集合是基于实例数进行筛选的。在两个等位基因的其余窗口中,在两个等位基因晶格中比较亲和力。记录格中满足实例阈值的单元数,并根据评估的完整性过滤结果。最大值之间的比较代表了每个等位基因在其基因组背景下可能具有的最高亲和力。默认参数包括限制K-mer搜索到有利于结合的染色质区域;例如,仅考虑H3K4me2或DNaseI超敏区域内的K-mer匹配。为了进一步增加IGR的对比度,开放的染色质元件只允许包含K-mer的单个拷贝,以避免与染色质的协同结合。T检验用于评估具有最大亲和力的两个K-mers之间亲和力调制的统计显著性。

亲和调节SNP的富集

VSE和IGR方法可以结合起来计算亲和调节剂中一组变体的富集或耗尽的分数和p值。我们首先确定AVS中有多少SNP映射到有利于结合的转录因子结合位点或组蛋白修饰。这些代表了可以创建或销毁结合位点的监管区域;我们将其称为regSNP,其处理方式与ldSNP类似。然后我们计算调制器商。此商的分子是具有至少一个显著亲和力调节regSNP的raSNP/regSNP簇的数量。分母是AVS中raSNP/regSNP簇的数量。不包含regSNP的raSNP不在调制器商中考虑。然后使用MRVS集合上的调制器商零分布作为VSE,以计算亲和调制SNP中AVS富集的p值。

实验程序

核小体再溶ChIP-seq分析

用MNase(Sigma N3755)处理MCF7乳腺癌细胞,用H3K4me2抗体(Millipore CMA303)进行ChIP,如之前发表的34.根据制造商说明为Illumina基因组分析仪准备了文库。H3K4me2显著(P<10e−5)使用MACS软件使用默认参数检测富集区域49H3K4me2富集通过ChIP-qPCR进行验证。文件可在GEO上查阅,登录号:GSE31151标准.

体内等位基因特异性结合分析

如前所述进行ChIP分析4ChIP分析中使用的抗体包括:FoxA1(abcam:ab5089)、H3K4me2(Millipore 07-030)、TLE(santacruz biotech:sc-13373X)和H3K9Ac(abcam:ab4441)。如前所述,应用等位基因特异性MAMA-PCR基因分型技术评估杂合等位基因的差异ChIP富集47,50.

3C-qPCR分析

染色体构象捕获(3C)技术结合qPCR是根据已发表的协议进行的51简单地说,500万MCF7细胞使用相互作用的染色质片段的甲醛交联(1%,室温下10分钟)处理。随后进行BglII(或更高分辨率的MspI)消化(400单位,37°C过夜)和结扎(T4 DNA连接酶4000单位,16°C下4小时)。DNA片段用苯酚-氯仿清洗,然后用乙醇提取。qPCR用于定量连接的DNA片段。细菌人工染色体(BAC)克隆用于验证引物效率和归一化3C相互作用频率。

体内等位基因特异性基因表达

用rs2193094 SNP及其最近的MspI限制性内切酶位点外的一条引物和rs4784227 SNP及其最接近的Msp1位点外的引物PCR扩增MCF7细胞的MspI3C产物。PCR扩增产物首先克隆到一个空载体中,然后使用Sanger测序方法进行测序,这揭示了rs2193094和rs4784227 SNP的两个等位基因之间的连锁。使用QIAGEN Dneasy血液和组织试剂盒提取MCF7基因组DNA。使用Trizol(Invitrogen)提取MCF7核总RNA,然后通过RT反应将RNA转化为cDNA。使用围绕rs2193094、rs35925303和rs11646260 SNP的引物生成cDNA并用于PCR分析。进行Sanger测序以测量rs2193094、rs35925303和rs11646260单核苷酸多态性的每个等位基因的DNA和RNA水平。

基于细胞系的表达定量性状位点分析(e-QTL)

在11个ERα+和FOXA1+乳腺癌细胞系(T47D、HCC1428、MCF7、MDA-MB-415、UACC-812、ZR-75-1、BT-474、BT-483、MDA-MB-175VII、600MPE和ZR-75-30)中进行rs4784227 SNP基因分型。基因表达数据TOX3、AKTIP、CHD9、FTO、RBL2RPGRIP1系统从Neve乳腺癌细胞系数据库中提取这些细胞系中的(探针:214774_x_at、218373_at、212615_at、209702_at、211331_at和206608_at)52SNP基因型数据与上述每个基因的表达水平相关。

si后细胞增殖测定TOX3(TOX3)

TOX3(TOX3)被小干扰RNA双工体(siRNAs)沉默。两组siRNAs对抗TOX3(TOX3)是通过Dharmacon设计的(补充表21). 抗荧光素酶的siRNA被用作阴性对照(siLuc)。根据制造商的建议,使用RNeasy迷你试剂盒(QIA-GEN)从ZR75-1乳腺癌细胞中分离出RNA。如前所述进行实时逆转录PCR(RT-qPCR)4确认si的沉默效应TOX3(TOX3)RNA水平TOX3(TOX3)被标准化为28S核糖体RNA(R28S系列),并进一步规范化为siLuc。2天后计数ZR75-1乳腺癌细胞数TOX3(TOX3)沉默。以经siLuc处理的ZR75-1细胞为对照。

补充材料

1

单击此处查看。(334K,pdf格式)

2

单击此处查看。(84K,xlsx)

单击此处查看。(84K,xlsx)

4

单击此处查看。(88K,xlsx)

5

单击此处查看。(72K,xlsx)

6

单击此处查看。(68K,xlsx)

致谢

我们感谢Myles Brown博士和Matthew L.Freedman博士(达纳-法伯癌症研究所)、Mathieu Lemaire博士(耶鲁大学)的讨论,以及Benjamin G.Neel博士和Richard Marcotte博士的技术援助。我们感谢NCI(2P30CA023108-32)、ACS(IRG-82-003-27 to M.L.)、NIH(R01LM009012 to J.H.M和R01CA15504 to M.L..)和玛格丽特公主医院基金会(to M.L)的支持。

脚注

加入号码为本手稿生成的ChIP-seq文件可在GEO上获得:登录号:GSE31151标准

作者贡献所有实验都是由R.C-S.、X.Z.、J.E.、M.D.C.、J.H.M.和M.L.构思的。实验由X.Z进行,J.B.W.计算方法由R.C-S构思并在J.H.M的帮助下实现,M.L.计算分析由R.C-S-和S.D.B.完成。手稿由R.C-SS、X.Z和M.L在J.E.的帮助下编写。,M.D.C.和J.H.M.图形由R.C-S和X.Z设计和制作。

工具书类

1Frazer K,Murray S,Schork N,Topol E.人类遗传变异及其对复杂性状的贡献。《自然评论遗传学》。2009;10:241–251.[公共医学][谷歌学者]
2.Durbin R等人。人群规模测序的人类基因组变异图。自然。2010;467:1061–1073. [PMC免费文章][公共医学][谷歌学者]
三。Heintzman N等。人类基因组中转录启动子和增强子的独特和预测染色质特征。自然遗传学。2007;39:311–318.[公共医学][谷歌学者]
4Lupien M等。Foxa1将表观遗传标记转化为增强子驱动的谱系特异性转录。单元格。2008;132:958–970. [PMC免费文章][公共医学][谷歌学者]
5Heintzman N等。人类增强子的组蛋白修饰反映了全球细胞类型特异性基因表达。自然。2009;459:108. [PMC免费文章][公共医学][谷歌学者]
6Khalil A等。许多人类大基因间非编码rna与染色质修饰复合物相关并影响基因表达。美国国家科学院院刊。2009;106:11667. [PMC免费文章][公共医学][谷歌学者]
7Ernst J等人。九种人类细胞类型染色质状态动力学的绘图和分析。自然。2011;473:43–49. [PMC免费文章][公共医学][谷歌学者]
8Zentner G、Tesar P、Scacheri P。表观遗传学特征区分具有不同细胞功能的多种增强子。基因组研究。2011;21:1273–1283. [PMC免费文章][公共医学][谷歌学者]
9Lupien M,Brown M.激素依赖性癌症的Cistromics。内分泌相关癌症。2009;16:381.[公共医学][谷歌学者]
10Schmidt D等。凝集素在组织特异性转录中的ctcf依赖性作用。基因组研究。2010;20:578. [PMC免费文章][公共医学][谷歌学者]
11Carroll J等人。雌激素受体结合的染色体全方位定位揭示了需要叉头蛋白foxa1的长期调控。单元格。2005;122:33–43.[公共医学][谷歌学者]
12Carroll J等人。雌激素受体结合位点的全基因组分析。自然遗传学。2006;38:1289–1297.[公共医学][谷歌学者]
13Krum S等。独特的erα顺反子控制细胞类型特异性基因调控。分子内分泌学。2008;22:2393–2406. [PMC免费文章][公共医学][谷歌学者]
14Wang Q,等。雄激素受体在雄激素依赖性前列腺癌中调节独特的转录程序。单元格。2009;138:245–256. [PMC免费文章][公共医学][谷歌学者]
15Hindorff L、Junkins H、Mehta J、Manolio T等人。已发表的全基因组关联研究目录。[2012年1月查阅]。[谷歌学者]
16Grant S,Hakonarson H.微阵列技术及其在全基因组关联领域的应用。临床化学。2008;54:1116.[公共医学][谷歌学者]
17McClellan J,King M.人类疾病的遗传异质性。单元格。2010;141:210–217.[公共医学][谷歌学者]
18Hindorff L等人,全基因组关联位点对人类疾病和特征的潜在病因和功能影响。美国国家科学院院刊。2009;106:9362. [PMC免费文章][公共医学][谷歌学者]
19Johnson W等人。芯片芯片拼接阵列的基于模型的分析。美国国家科学院院刊。2006;103:12457. [PMC免费文章][公共医学][谷歌学者]
20.Akhtar-Zaidi B等。表观基因组增强子分析定义了结肠癌的特征。科学。2012;336:736–739. [PMC免费文章][公共医学][谷歌学者]
21Magnani L,Eeckhoute J,Lupien M.先锋因子:在染色质环境中指导转录调节器。遗传学趋势。2011[公共医学][谷歌学者]
22Long J等。16q12处功能性遗传变异的鉴定。乳腺癌风险1:来自亚洲乳腺癌协会的结果。PLoS遗传学。2010;6:e1001002。 [PMC免费文章][公共医学][谷歌学者]
23Pomerantz M等人。8q24癌症风险变体rs6983267在结直肠癌中显示出与myc的长期相互作用。自然遗传学。2009;41:882–884. [PMC免费文章][公共医学][谷歌学者]
24.Tuupanen S等。常见的结直肠癌易感性snp rs6983267位于染色体8q24,具有增强wnt信号的潜力。自然遗传学。2009;41:885–890.[公共医学][谷歌学者]
25Wright J,Brown S,Cole M.通过与结直肠癌细胞中癌症风险相关单核苷酸多态性相关的大染色质环上调顺式细胞中的c-myc。分子和细胞生物学。2010;30:1411. [PMC免费文章][公共医学][谷歌学者]
26Sekiya T,Zaret K。grucho/tle/grg蛋白抑制:基因组位点募集在体外产生致密染色质,并损害体内激活物结合。分子细胞。2007;28:291–303. [PMC免费文章][公共医学][谷歌学者]
27Riaz M等。乳腺癌易感基因座与患者特征、无转移生存率和最近基因mRNA表达的相关性。乳腺癌研究治疗。2011[公共医学][谷歌学者]
28De Gobbi M等人。一种调节性snp通过创建新的转录启动子导致人类遗传病。科学。2006;312:1215.[公共医学][谷歌学者]
29Gaulton K等人。人类胰岛开放染色质图。自然遗传学。2010;42:255–259. [PMC免费文章][公共医学][谷歌学者]
30Jia L等。基因缺陷8q24癌相关位点的功能增强因子。公共科学图书馆遗传学。2009;5:e1000597。 [PMC免费文章][公共医学][谷歌学者]
31McDaniell R等人。人类遗传性个体特异性和等位基因特异性染色质特征。科学。2010;328:235. [PMC免费文章][公共医学][谷歌学者]
32Reddy T等。序列变异对差异等位基因转录因子占有率和基因表达的影响。基因组研究。2012 [PMC免费文章][公共医学][谷歌学者]
33Eeckhoute J,Carroll J,Geistlinger T,Torres-Arzayus M,Brown M.乳腺癌细胞周期蛋白d1的雌激素调节和细胞周期进展所需的细胞类型特异性转录网络。基因与发育。2006;20:2513. [PMC免费文章][公共医学][谷歌学者]
34He H等。核小体动力学定义了转录增强子。自然遗传学。2010;42:343–347. [PMC免费文章][公共医学][谷歌学者]
35Laganière J等。雌激素受体α靶启动子的定位分析表明,fosa1定义了雌激素反应的一个域。美国国家科学院院刊。2005;102:11651. [PMC免费文章][公共医学][谷歌学者]
36Hurtado A、Holmes K、Ross-Innes C、Schmidt D、Carroll J.Foxa1是雌激素受体功能和内分泌反应的关键决定因素。自然遗传学。2010;43:27–33. [PMC免费文章][公共医学][谷歌学者]
37Easton D等。全基因组关联研究确定了新的乳腺癌易感性位点。自然。2007;447:1087–1093. [PMC免费文章][公共医学][谷歌学者]
38Stacey S等。染色体2q35和16q12上的常见变异导致对雌激素受体阳性乳腺癌的易感性。自然遗传学。2007;39:865–869.[公共医学][谷歌学者]
39Ruiz-Narváez E等,《tox3/loc643714基因座的多态性与非裔美国女性乳腺癌风险》。癌症流行病学生物标志物与预防。2010;19:1320. [PMC免费文章][公共医学][谷歌学者]
40Hutter C等人,《女性健康倡议非裔美国人共享研究中乳腺癌易感性位点的复制》。癌症流行病学生物标志物与预防。2011;20:1950–1959. [PMC免费文章][公共医学][谷歌学者]
41Udler M等人。乳腺癌16q12基因座的精细标度定位。人类分子遗传学。2010;19:2507–2515. [PMC免费文章][公共医学][谷歌学者]
42O'Flaherty E,Kaye J.Tox定义了hmg-box蛋白的一个保守亚家族。BMC基因组学。2003;4:13. [PMC免费文章][公共医学][谷歌学者]
43Dittmer S等。Tox3是一种神经元生存因子,它依赖于转录活性复合物中cited1或磷酸化creb的存在来诱导转录。细胞科学杂志。2011;124:252–260.[公共医学][谷歌学者]
44Smid M等。乳腺癌骨转移相关基因。临床肿瘤学杂志。2006;24:2261–2267.[公共医学][谷歌学者]
45Antoniou A等。brca1和brca2突变携带者中常见的乳腺癌前病变等位基因与乳腺癌风险相关。美国人类遗传学杂志。2008;82:937–948. [PMC免费文章][公共医学][谷歌学者]
46Freedman M等人。癌症风险位点的gwas后功能表征原则。自然遗传学。2011;43:513–518. [PMC免费文章][公共医学][谷歌学者]
47Zhang X等。综合功能基因组学确定了一个被17q24.3前列腺癌风险位点破坏的SOX9基因的增强子环。基因组研究。2012 [PMC免费文章][公共医学][谷歌学者]
48Park J等人。全基因组关联研究中效应大小分布的估计以及对未来发现的影响。自然遗传学。2010;42:570–575. [PMC免费文章][公共医学][谷歌学者]
49张勇,等。基于模型的ChIP-Seq分析(MACS)基因组生物学。2008;9:R137。 [PMC免费文章][公共医学][谷歌学者]
50Li B,Kadura I,Fu DJ,Watson DE。TaqMAMA基因分型。基因组学。2004;83:311–20.[公共医学][谷歌学者]
51Hagege H等.染色体构象捕获分析的定量分析(3C-qPCR)国家协议。2007;2:1722–33.[公共医学][谷歌学者]
52.Neve RM等。用于研究功能不同的癌症亚型的乳腺癌细胞系集合。癌细胞。2006;10:515–27. [PMC免费文章][公共医学][谷歌学者]