自然遗传学。作者手稿;PMC 2010年8月1日提供。
以最终编辑形式发布为:
预防性维修识别码:项目经理2850970
NIHMSID公司:美国国家卫生研究院165360
生殖中心起源的滤泡性和弥漫性大B细胞淋巴瘤中EZH2(Y641)的体细胞突变
,1 ,2 ,1 ,1 ,1 ,1 ,1 ,2 ,2 ,2 ,2 ,2 ,1 ,2 ,三 ,三 ,三 ,三 ,三 ,1 ,1 ,1 ,1 ,1 ,1 ,1 ,1 ,1 ,1 ,1 ,1 ,4 ,2 ,1 ,2 ,1 ,4和*,1,6
瑞安·D·莫林
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
纳塔莉·约翰逊
2不列颠哥伦比亚省癌症机构,600 W.10第个加拿大温哥华大道
泰萨·M·塞弗森
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
安德鲁·蒙格尔
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
安江宏
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
罗德里戈·戈雅
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
杰西卡·E·保罗
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
梅里尔·博伊尔
2不列颠哥伦比亚省癌症局,600 W.10第个加拿大温哥华大道
布鲁斯·沃尔科克
2不列颠哥伦比亚省癌症局,600 W.10第个加拿大温哥华大道
弗洛里安·库琴鲍尔
2不列颠哥伦比亚省癌症局,600 W.10第个加拿大温哥华大道
Damian Yap
2不列颠哥伦比亚省癌症局,600 W.10第个加拿大温哥华大道
R.基思·汉弗莱斯
2不列颠哥伦比亚省癌症局,600 W.10第个加拿大温哥华大道
奥比·格里菲斯
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
索赫拉布·沙阿
2不列颠哥伦比亚省癌症局,600 W.10第个Avenue,温哥华,加拿大
朱涵睿
三BPS Biosciences,圣路易斯安那州索伦托山谷路11526号。加利福尼亚州圣地亚哥A2,邮编92121
米歇尔·金巴拉
三安大略省索伦托谷路11526号BPS生物科学公司。加利福尼亚州圣地亚哥A2,邮编92121
帕维尔·沙希金
三BPS Biosciences,圣路易斯安那州索伦托山谷路11526号。加利福尼亚州圣地亚哥A2,邮编92121
让·查洛特
三BPS Biosciences,圣路易斯安那州索伦托山谷路11526号。加利福尼亚州圣地亚哥A2,邮编92121
玛丽安娜·切尔巴科夫
三BPS Biosciences,圣路易斯安那州索伦托山谷路11526号。加利福尼亚州圣地亚哥A2,邮编92121
理查德·科贝特
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
安吉拉·谭
1不列颠哥伦比亚省癌症机构基因组科学中心,675 W.10第个加拿大温哥华大道
理查德·沃霍尔
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
杜安·斯迈卢斯
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
米歇尔·莫克萨
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
赵永军
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
阿伦·德莱尼
1不列颠哥伦比亚省癌症机构基因组科学中心,675 W.10第个加拿大温哥华大道
洪谦(音)
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
Inanc Birol公司
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
杰奎琳·谢恩
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
毛利小五郎
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
罗伯特·贺尔特
1不列颠哥伦比亚省癌症机构基因组科学中心,675 W.10第个加拿大温哥华大道
道格·霍斯曼
4不列颠哥伦比亚大学病理学系和BC癌症机构,600 W.10第个加拿大温哥华大道
约瑟夫·康纳斯
2不列颠哥伦比亚省癌症局,600 W.10第个加拿大温哥华大道
史蒂文·琼斯
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
塞缪尔·阿帕里西奥
2不列颠哥伦比亚省癌症局,600 W.10第个加拿大温哥华大道
马丁·赫斯特
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
兰迪·D·加斯科因
4不列颠哥伦比亚大学病理学系和BC癌症机构,600 W.10第个加拿大温哥华大道
马可·马拉
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
6不列颠哥伦比亚大学医学遗传学系,675 W.10第个加拿大温哥华大道
1不列颠哥伦比亚省癌症局基因组科学中心,675 W.10第个加拿大温哥华大道
2不列颠哥伦比亚省癌症局,600 W.10第个加拿大温哥华大道
三BPS Biosciences,圣路易斯安那州索伦托山谷路11526号。A2,圣地亚哥,加利福尼亚州92121
4不列颠哥伦比亚大学病理学系和BC癌症机构,600 W.10第个加拿大温哥华大道
5不列颠哥伦比亚大学BC癌症研究所肿瘤医学部,600 W.10第个加拿大温哥华大道
6不列颠哥伦比亚大学医学遗传学系,675 W.10第个加拿大温哥华大道
*信件的收件人
关键词:RNA-seq、WTSS、PRC2、基因组、转录组、表观遗传
滤泡性淋巴瘤(FL)和弥漫性大B细胞淋巴瘤(DLBCL)的GCB亚型来源于生发中心B细胞1靶向性再测序研究揭示了NFkB途径中各种基因的突变2,三有助于激活B细胞(ABC)DLBCL亚型,但迄今为止,很少发现GCB特异性突变4在这里,我们报告了影响多梳组癌基因的复发性体细胞突变6
EZH2型,编码负责三甲基化H3K27的组蛋白甲基转移酶。最近在几种癌症类型中发现组蛋白H3K27me3去甲基化酶UTX突变后5,EZH2型是受癌症突变影响的第二种组蛋白甲基转移酶。这些突变取代EZH2蛋白(Y641)SET结构域中的单个酪氨酸,发生在21.7%的GCB DLBCL、7.2%的FL中,并且在ABC DLBCL中不存在。我们的数据与带有突变Y641的EZH2蛋白降低酶活性的概念一致在体外.
DNA测序技术的进展最近使基因组和转录组的特征能够以足够的分辨率识别体细胞点突变7–9为了对可能导致B细胞非霍奇金淋巴瘤(NHL)的新突变有新的认识,我们使用Illumina技术对从FL患者的恶性淋巴结活检中纯化的基因组DNA和RNA进行测序(“FL样本a”)(方法)。FL患者A经免疫组化鉴定为1级FL,共表达CD10、BCL2和BCL6。选择这个样本进行序列分析是因为它的核型异常简单(补充图1),缺少t(14;18)(q32;q21),以及其他大规模蚀变(补充图2-5;补充表1和2). 我们分析了该肿瘤的外显子序列中的基因组(WGSS)和转录组(WTSS)突变(和方法)。对FL患者匹配的结构DNA进行测序,以揭示“种系”序列变异(方法)。我们从肿瘤基因组文库中产生了25.6个对齐的千兆位酶(Gb),平均产生9.47倍的冗余碱基覆盖率,从WTSS文库中又产生了2.2 Gb的对齐序列,外显子内平均产生18.86倍的冗余碱覆盖率(; 方法)。我们重点分析了预测会影响蛋白质编码序列的新变化(方法)。在这些变体中(补充表3),我们发现了一个影响EZH2型该基因编码EZH2 SET结构域的一部分。EZH2是PRC2复合物的催化成分,负责将甲基添加到组蛋白3的赖氨酸27(H3K27)10从而抑制与含有三甲基H3K27的组蛋白相关的位点的转录。我们通过确认该突变存在于肿瘤DNA中,而不存在于构成性非肿瘤DNA中(方法),确定该突变在本质上是体细胞突变,预计将用组氨酸取代Y641。我们还确认了该患者样本中的突变是杂合的。
表1
库描述 | 原始读取(对) | 映射的读取 | 总序列覆盖率(bp) | 外显子平均覆盖深度 |
---|
FL样本A,匹配生殖系基因组DNA | 93473829个 | 163,216,278 | 7,986,844,356 | 2.80 |
FL样本A,肿瘤WTSS | 51,729,560 | 63,262,348 | 2277444528个 | 18.9 |
FL样本A,肿瘤基因组DNA | 351,666,782 | 563,762,488 | 27,024,661,976 | 9.47 |
要确定EZH2型在DLBCL样本的突变状态下,我们接下来使用WTSS对31例DLBCL患者样本和7个DLBCL细胞系的转录本进行测序。基于来源细胞(COO)表达分类11原发性淋巴瘤标本分为ABC(n=12)、GCB(n=15)和不可分亚型(n=2)(方法;补充表4). 覆盖范围EZH2型WTSS数据库中的数据一直很高,患者样本中的数据覆盖率从5.3倍到187倍不等(中位数为48.7倍)。密码子641的覆盖范围为5倍至295倍(中位数为46.5倍;补充表4). 我们在这31个患者样本中的4个和4个细胞系中发现了Y641突变(). 无其他突变EZH2型检测到所有突变均为杂合子。这些突变的惊人复发表明,Y641的突变EZH2型是淋巴瘤的常见特征。值得注意的是,尽管UTX基因座的平均碱基覆盖深度是11.4倍,但我们在这些文库中没有发现UTX突变的证据。
表2
所有突变的位置和影响EZH2型由WTSS确定的FL和DLBCL
样本ID | 样本类型或细胞系名称 | 年龄 | 性别 | t(14;18) | 基因组位置 | 突变* | 效果 |
---|
HS0804标准 | FL(样品A) | 44 | F类 | 不 | 电话:7:148139661 | T->C | Y->H |
第0639页 | DLBCL(DLBCL) | 60 | M(M) | 是的 | 电话:7:148139661 | T->C | Y->H |
HS0648型 | DLBCL(DLBCL) | 92 | F类 | 不 | 电话:7:148139661 | T->A型 | Y->N |
HS0640型 | DLBCL(DLBCL) | 68 | F类 | 是的 | chr7:148139660 | A->C | Y->S |
HS0942型 | DLBCL(DLBCL) | 73 | M(M) | 是的 | 电话:7:148139661 | T->A型 | 是->否 |
HS0798型 | 数据库 | 45 | M(M) | 是的 | 电话:7:148139661 | T->A型 | 是->否 |
HS0841型 | KARPAS卡帕斯422 | 73 | F类 | 是的 | 电话:7:148139661 | T->A型 | 是->否 |
HS0900型 | SU-DHL-6型 | 43 | M(M) | 是的 | 表7:148139661 | T->A型 | 是->否 |
HS0901型 | WSU-DLCL2型 | 41 | M(M) | 是的 | chr7:148139660 | A->T | Y->F |
HS1163型 | OCI-LY1型 | 不适用 | 不适用 | 是的 | 电话:7:148139661 | T->A | 是->否 |
我们通过Sanger测序251例FL样本中包含该密码子的外显子,确定了FL和DLBCL肿瘤中Y641突变的流行率,其中30例与组织学转化时采集的DLBCL样本相匹配,320例原始DLBCL样品(包括最初的31例患者样本)(补充表5). 这揭示了总共18个FL和35个DLBCL样本具有杂合Y641突变。值得注意的是,WTSS检测到的所有Y641突变都证明了这两个等位基因的表达(补充表4). 为了寻找该基因中的其他突变位点,我们还对该基因的所有外显子进行了测序EZH2型在24名FL患者中(除了FL患者A),仅发现一例EZH2型突变不影响Y641(;补充表5). 这种影响N635的突变与Y641突变一起被发现,我们证实这两种突变都是顺式的。我们确认,这些突变是在7个FL(包括“样本A”)和2个DLBCL患者中的体细胞突变,这些患者的生殖系DNA是可用的。
Y641的复发突变EZH2型(A) EZH2基因座的基因组组织、可选外显子和蛋白质结构域。影响Y641基因第15外显子突变的位置EZH2型基因和蛋白质用红色星号表示。(B) 测序结果图解。毛细血管测序(左)或Illumina WTSS(右)检测到不同淋巴瘤样本中密码子641的五种不同突变和氨基酸替换中的三种。(C) 多重对齐EZH2型、EZH1(其paralog)、果蝇属正交曲线E(Z)和其他六种人类SET结构域蛋白证明了SET结构区的谱内和谱间序列保守性。ClustalX报告的保护代码如上所示24. The predominant mutation inEZH2型影响保守的SET结构域(橙色)催化位点中的关键酪氨酸果蝇属正交曲线E(Z)。除了一个例外,所有EZH2型FL和DLBCL的突变改变了这种氨基酸。唯一的例外是一个双突变体(FL),第二个体细胞突变影响N635(蓝色)。所有突变体包含该密码子的8个可能的非同义变体中的5个(右下角,红色)。值得注意的是,观察到的五种氨基酸变化的频率不同。我们检测到Y641F(49%)略微富集,其次是Y641S(21%)、Y641N(15%)和Y641H(13%),只有一个Y641C(2%)的例子(补充表5). 在未观察到的变异体(D,蓝色)中,两个变异体将导致截短的蛋白质,而第三个则会引入天冬氨酸残基。这些变化的模式和性质(A->G,A->T,T->G,T->A)向我们表明,这些突变不太可能是由AID诱导的该位点的体细胞超突变引起的25.
为了排除这种突变也可能发生在非恶性生发中心B细胞或其他类型淋巴瘤中的可能性,我们对8个CD77的外显子15的这一区域进行了测序+-使用Sanger测序和靶向超深Illumina重新测序,从反应性扁桃体和23个反应性淋巴结(正常B细胞的来源)以及80个其他淋巴瘤类型的样本中富集成中心细胞样本(方法;补充图6;补充表6). 我们还对从另外两个正常成中心细胞样本生成的WTSS库进行了测序(补充表4). 与我们的假设相一致的是,Y641突变是恶性B细胞特有的,这些样本中没有一个显示出Y641或测序区域内其他地方发生突变的证据(). 值得注意的是,所有具有已知COO的DLBCL样本也为阳性EZH2型突变属于GCB亚型而非ABC亚型。这揭示了在DLBCL的GCB亚型中Y641突变的显著富集(; n=18/83 GCB vs 0/42 ABC,P=0.00168,双尾Fisher精确检验)。
表3
样品类型 | #分析的样品数量 | #样品数量EZH2型Y641突变 | Y641突变的流行率 |
---|
|
佛罗里达州 | | | |
1级 | 133 | 10 | 7.5% |
2级 | 60 | 4 | 6.7% |
3级 | 28 | 2 | 7.1% |
总飞行高度层 | 221 | 16 | 7.2% |
|
FL和DLBCL对* | | | |
佛罗里达州 | 30 | 2 | 6.7% |
DLBCL(DLBCL) | 30 | 4 | 13.3% |
总FL-衍生 | 60 | 6 | 10.0% |
|
DLBCL(DLBCL) | | | |
GCB公司 | 83 | 18 | 21.7% |
PMBCL公司 | 24 | 1 | 4.2% |
基础知识 | 42 | 0 | 0% |
U型 | 25 | 0 | 0% |
非GCB | 22 | 0 | 0% |
无法使用的§ | 124 | 12 | 9.7% |
主DLBCL合计 | 320 | 31 | 9.7% |
|
MCL公司 | 25 | 0 | 0% |
|
SLL公司 | 30 | 0 | 0% |
|
PTCL公司 | 25 | 0 | 0% |
|
细胞系 | | | |
GCB细胞系¥ | 7 | 5 | 71.4% |
ABC细胞系¥¥ | 2 | 0 | 0% |
|
温和的 | | | |
反应性淋巴结 | 23 | 0 | 0% |
纯化CD77+成中心细胞¶ | 8 | 0 | 0% |
|
主要NHL样品总数 | 681 | 53 | 7.8% |
细胞系总数 | 9 | 5 | 55.5% |
完全良性 | 31 | 0 | 0% |
接下来,我们通过生成计算模型来评估各种Y641突变对EZH2 SET结构域的结构和潜在功能的影响(补充图7)使用高度保守的MLL1 SET结构域的晶体结构12作为结构模板(方法)。我们的模型表明,Y641与H3组蛋白尾部的赖氨酸27侧链相互作用,正如其他SET结构域蛋白所建议的那样13虽然没有EZH2型SET结构域突变已在人类中报道,详细的突变表型已在果蝇属.一种突变将酪氨酸同源性改变为EZH2型Y641的特征在于果蝇属正交曲线E(z)在名为“E(z)”的等位基因中1”.果蝇属E(z)1突变蛋白被发现不能三甲基化H3K27在体外14.
我们试图在无细胞甲基化试验中直接确定Y641突变的EZH2是否影响PRC2的催化活性。单个克隆,每个克隆包含四种最常检测到的突变之一(),与PRC2的其他成分一起首次表达。纯化并测试了PRC2复合物在体外使用ELISA和H3K27me3特异性抗体检测H3K27三甲基化活性(方法)。结果()表明,与野生型EZH2相比,所有四个Y641突变体始终表现出H3K27肽三甲基化能力的显著降低(约7倍)。这一生化结果表明,在我们的测序研究中观察到的四种主要Y641变体可能导致PRC2复合物对三甲基H3K27的能力降低体内.
In-vitro公司突变型和野生型PRC2的组装和功能分析EZH2型(A) 野生型EZH2和四个Y641突变体中的每一个与野生型AEPB2、EED、SUZ12和RbAp48一起使用杆状病毒表达系统在SF9细胞中共同表达(方法)。这五种蛋白质结合在一起形成酶活性PRC2复合物在体外SF9细胞纯化的复合物显示了这些蛋白中的每一种的强表达,并证实了它们与PRC2的结合和组装。(B) Western blot证实了四个突变结构中每个结构的EZH2蛋白的表达。(C) 然后使用生物素化组蛋白H3(21-44)肽和S-腺苷蛋氨酸(在检测缓冲液中)对纯化的复合物进行检测,以检测酶活性。甲基化组蛋白H3是使用一种高度特异的抗体来测量的,该抗体只识别组蛋白H4的三甲基化K27残基(方法)。用时间分辨荧光(620nm)检测二级抗体,并用铕标记。以不同的纯化PRC2量(0至200ng)测试每个突变株(和野生型EZH2)的PRC2甲基化酶活性。计算出H、N、S和F突变体的四个突变体的比活性分别为0.001、0.0012、0.0011和0.0009 pmol/min/ug(平均值=0.00105)。野生型酶(蓝色)的比活性为0.0071(约为6.8倍)。误差条反映了三次测量的标准偏差。
其他报告表明EZH2型mRNA与组织中癌症进展相关EZH2型表达通常较低或检测不到,如乳腺和前列腺6,15然而,EZH2型mRNA在正常生发中心B细胞中丰富16和有条件地击倒老鼠EZH2型直系同源物表明,SET结构域是B细胞早期发育所必需的,包括免疫球蛋白重链的重排(IGH公司)轨迹17.鉴于以下明显要求EZH2型在生发中心B细胞中EZH2型与明显直接增加的EZH2型乳腺mRNA丰度观察6和前列腺15癌症。两者的表达EZH2型和BMI1公司(PRC1的催化成分)与B细胞NHL的恶性程度有关,这两种蛋白数量平衡的紊乱被认为是淋巴腺病的早期事件18然而EZH2型迄今为止,尚未与B细胞恶性肿瘤或任何其他癌症有关。
虽然其生物学机制尚不清楚,但我们的发现表明EZH2型Y641突变,可能是H3K27三甲基化减少,在GCB淋巴瘤的发病机制中起作用。经过仔细研究的苯丙氨酸/酪氨酸开关19已知该位点可以调节SET结构域蛋白可以添加的甲基数目,而不会影响其整体催化活性。虽然Y641残基与苯丙氨酸/酪氨酸开关位点不同,但我们体外实验的结果并不排除这些突变可能改变EZH2的产物(或靶点)特异性的可能性。鉴于最近的研究表明,与正常B细胞相比,淋巴瘤PRC2靶点的DNA甲基化增强,我们的发现尤其及时20,21H3K27通过PRC2的三甲基化可以是DNA甲基化的前体,并且在某些情况下,DNA甲基转移酶可以与PRC2物理偶联22因此,Y641突变可能导致在FL多梳靶点观察到的差异DNA甲基化20和DLBCL21.
总之,我们确定了影响EZH2型SET域和仅与GCB亚型的FL和DLBCL病例相关。我们的数据表明EZH2型SET结构域是t(14;18)(q32;q21)后GCB恶性肿瘤中最常见的遗传事件之一。突变的酪氨酸对应于EZH2蛋白活性位点中的一个关键残基,与果蝇类似突变的功能研究一致E(z)正交试验表明,含有突变EZH2蛋白的PRC2复合物表现出降低H3K27三甲基化活性在体外我们已经证明,所有Y641突变的样本中都存在EZH2的野生型拷贝,并且通过转录组测序检测到突变样本中这两个等位基因的表达。这一点,再加上所有发生突变的淋巴瘤EZH2型似乎有影响Y641的突变EZH2型除了UTX的突变失活模式外,UTX似乎表现为肿瘤抑制基因5.除了复发失活突变外UTX公司EZH2是唯一一个影响H3K27甲基化状态的蛋白,被确定为癌症体细胞突变的靶点,也是第一个SET结构域的复发突变似乎仅限于特定淋巴瘤亚型的蛋白。
方法
样品采集
使用了来自初始患者(FL患者A)的两个样本。根据流式细胞术检测到的CD19和lambda的共同表达,两者的肿瘤含量约为70%,均为“新鲜”冷冻源。第一个是在诊断时拍摄的,用于WTSS和WGSS。第二个是在进展时获得的,经过流式分选,纯度>95%。通过核型和荧光分析就地使用双色双融合探针进行杂交(FISH),以检测是否存在易位t(14;18)。通过阵列比较杂交(aCGH)和指纹图谱分析拷贝数变化26Affymetrix 500K阵列的杂合性丢失(LOH)。WTSS分析的所有DLBCL样本均为新鲜冷冻活组织,流式细胞术检测肿瘤含量>50%。本研究中使用的所有其他标本均在诊断时获得,取自存档的新鲜冷冻组织或冷冻肿瘤细胞悬液。使用Miltenyi磁珠(德国Bergisch-Gladbach,Miltenyi-Biotec)从活患者的外周血和CD19-阴性分类的肿瘤细胞悬液中为已故患者获取生殖系DNA。所有淋巴瘤样本均由血液病理学家(R.D.G.)根据2008年世界卫生组织标准进行诊断。良性标本包括反应性儿童扁桃体或使用Miltenyi珠从反应性扁桃体中分离出的纯化CD77阳性中心粒细胞(Miltenyi-Biotec,Bergisch-Gladbach,德国)。肿瘤标本是作为不列颠哥伦比亚大学不列颠哥伦比亚省癌症机构研究伦理委员会(BCCA REB)批准的研究项目的一部分收集的,符合赫尔辛基宣言。使用WTSS或WGSS分析样本的所有患者均获得知情同意。我们的协议规定,这些数据不会发布到公共领域,但可以通过分层访问机制提供给机构的指定调查员,这些调查员通过材料转让协议同意遵守BCCA REB要求的相同道德和隐私原则。
Illumina文库的制备和测序
使用AllPrep DNA/RNA Mini Kit(美国加利福尼亚州巴伦西亚的齐亚根)和DNaseI处理从总淋巴结切片中提取RNA。对于全转录组鸟枪测序(WTSS/RNA-seq)分析,我们使用了一种类似于我们之前描述的方案的改进方法7简单地说,PolyA+根据制造商的说明,使用MACS mRNA分离试剂盒(Miltenyi Biotec,Bergisch-Gradbach,Germany)从5-10 ug DNaseI处理的总RNA中纯化RNA。从纯化的polyA合成双标记cDNA+使用上标双链cDNA合成试剂盒(Invitrogen,Carlsbad,CA,USA)和浓度为5μM的随机六聚体引物(Invit罗gen)的RNA。该cDNA通过超声波破碎,并按照Illumina配对文库制备协议(Illuminia,Hayward,CA,USA)制备配对文库。
用于构建全基因组鸟枪测序(WGSS)文库的基因组DNA是使用Qiagen AllPrep DNA/RNA Mini Kit(美国加利福尼亚州巴伦西亚市Qiangen)从相同的活检材料中制备的。在构建文库之前,通过分光光度法(260/280和260/230)和凝胶电泳评估DNA质量。使用功率设置为“7”的Sonic Dismembrator 550,以30秒的脉冲间隔冷却30秒(加拿大安大略省渥太华市Fisher Scientific公司的Cup Horn),将DNA剪切10分钟,并在8%的PAGE凝胶上进行分析。将200-300bp的DNA部分从凝胶切片中分离出来,在4°C下用300μl洗脱缓冲液(5:1,LoTE缓冲液(3 mM Tris-HCl,pH 7.5,0.2 mM EDTA)-7.5 M醋酸铵)洗脱过夜,并使用Spin-X过滤管(Fisher Scientific)和乙醇沉淀进行纯化。WGSS文库是使用Illumina Inc.(Illuminia,Hayward,USA)提供的改良配对试剂盒协议进行准备的。这涉及DNA末端修复和使用Klenow片段(3′至5′外显子缺失)形成3′腺苷悬液,并连接到Illumina PE适配器(带5′悬液)。适配器连接产物在QIAquick自旋柱上纯化(QIAquick spin columns,Valencia,CA,USA),并使用Phusion DNA聚合酶(NEB,Ipswich,MA,USA。使用8%PAGE凝胶从适配器结扎伪影中纯化出所需大小范围的PCR产物。使用安捷伦DNA 1000系列II试验(安捷伦,加州圣克拉拉,美国)和Nanodrop 7500分光光度计(Nanodrot,威明顿,德国,美国)评估和量化DNA质量,随后将DNA稀释至10nM。使用Quant-iT dsDNA HS检测试剂盒和Qubit荧光计(Invitrogen,Carlsbad,CA,USA)确认最终浓度。为了进行测序,使用v1簇试剂在Illumina簇工作站上生成簇。使用Illumina GA上的v3测序试剂生成配对读取ii(ii)平台遵循制造商的说明。使用Illumina的基因组分析管道v1.0进行图像分析、基数计算和误差校准。配对的WTSS和WGSS文库被测序为36、50或76个周期。WGSS库由13条36纳米读取的流动单元通道、16条50纳米读取的通道和6条76纳米读取的路径组成。
使用读取索引进行有针对性的超深度重新测序
该程序描述了EZH2第15外显子的单个PCR扩增、单个扩增子的索引以及随后的汇集和测序。单个索引允许对来自多路复用库中单个样本的读取进行反褶积,这样可以在同一库中同时对多个样本进行排序。单个样本的基因组DNA标准化为5ng/uL,每个样本的5ng用Phusion DNA聚合酶(美国马萨诸塞州伊普斯威奇新英格兰生物实验室)以96-well格式用基因特异性引物(引物EZH2_015R3和引物EJH2_015F,补充表7)产生~300bp的扩增子。热启动PCR条件:98°C,60s,然后36个循环(98°C-10s,60°C-15s,72°C-30s),最终延伸72°C,5min。在Biomek F/X(Beckman Coulter,Fullerton,CA,USA)上使用AMPure珠(Beckman-Coulter,CA,US)清洁扩增子,并用40uL洗脱缓冲液EB洗脱(QIAGEN,US)。使用1X TAE缓冲液在1.2%SeaKem LE琼脂糖凝胶(Cambrex,East Rutherford,NJ,USA)上对清洁的扩增物进行QC测试。频带由QBit量化™荧光计(Invitrogen,Carlsbad,CA,USA)高灵敏度分析。然后在室温下30分钟(T4 DNA Pol 5U,DNA Pol I(Klenow)1U,T4 PNK 100U,dNTP混合物0.4mM(Invitrogen),在50uL反应中对大约500ng的每个扩增子DNA样品进行磷酸化和最终修复。使用AMPure珠清洁末端修复反应,并使用Klenow(exo-)5U和0.2mM dATP在1X Klenow缓冲液(Invitrogen)中在Tetrad热循环仪(MJ Research,USA)中在37°C下孵育30分钟,将dATP添加到3′-末端。使用Biomek FX再次清洁AMPure珠子上的DNA。使用0.03uM适配器(多路复用适配器1和2,补充表7),100ng DNA,T4 DNA连接酶5U,0.2mM ATP,1X T4 DNA连接酶缓冲液(Invitrogen),室温下30分钟。使用Biomek FX上的AMPure珠清洁连接的DNA。选择的DNA样本在QBit上进行量化™(Invitrogen)。使用引物1.0和2.0(IDT,美国)和96个自定义引物(引物索引如补充表6). PCR程序如下:98°C持续60s,然后是98°C、10s、65°C、15s、72°C、30s的15个循环。使用AMPure珠清洁PCR产物,并在40uL洗脱缓冲液EB(美国QIAGEN)中洗脱。产品质量通过QC凝胶进行评估:1.75%SeaKem LE琼脂糖1X TAE(每个扩增子0.2uL)和生物分析仪-1000(安捷伦科技,加州圣克拉拉,美国)。然后将每个板中的所有96~400bp扩增物(每个孔15uL)汇集到一个单独的1.5mL微量离心管中。因此,一个试管代表96个不同DNA模板的96个聚合和索引PCR产物。使用8%PAGE凝胶(1X TAE)纯化400bp DNA粒级,并在4°C下于400μl洗脱缓冲液(5:1,LoTE缓冲液(3 mM Tris-HCl,pH 7.5,0.2 mM EDTA)-7.5 M醋酸铵中从凝胶片中洗脱过夜。凝胶块使用Spin-X过滤管过滤(美国宾夕法尼亚州匹兹堡费希尔科学公司)。使用乙醇沉淀DNA,并使用安捷伦DNA 1000系列II分析(安捷伦科技,加州圣克拉拉,美国)定量,然后稀释至10nM。使用Quant-iT dsDNA HS检测试剂盒和QBit确认最终浓度™荧光计(Invitrogen)。从每个索引样本构建一个单独的文库(包含多达96个不同模板DNA的扩增子)。这些库中的每一个都在单个流动池通道上进行了测序。
肿瘤DNA和RNA序列的SNV分析
所有读取结果都与人类参考基因组(hg18)或(对于WTSS)与基因组文件进行了比对,该基因组文件使用MAQ比对器扩增了一组所有外显子-外显子连接序列27v0.7.1。使用与我们之前描述的方法类似的方法,在对齐的基因组序列读取和转录组读取中识别候选单核苷酸变体(SNV)7在本研究中,我们的变体调用的一个关键区别是我们小组目前正在开发的贝叶斯SNV识别算法(“SNVmix”)的应用(版本0.11.7;http://compbio.bccrc.ca/?page_id=204)28该方法能够识别覆盖率最低为两个高质量(Q20)基地的SNV。所有被评估为多态性(SNP)的位点都被忽略,包括与dbSNP或Venter个人基因组中的位置匹配的变体29,Watson,匿名亚洲人30和约鲁班31个人。此外,该患者生殖系DNA基因组序列中发现的所有候选突变均被忽略。对于目标重新排序实验,密码子641的覆盖率通常大于1000倍读取深度。因此,我们使用跨越该站点的所有明确映射的读取来确定质量不匹配的读取百分比(Illumina基本质量≥20)。报告中每个样本的这些百分比补充信息(补充表6).
用于SNV鉴定和Sanger序列验证的Amplicon测序
第15外显子EZH2型用EZH2_ASP_1和EZH2-ASP_2从基因组DNA中扩增。M13正向-21和M13反向的引物位点被添加到它们的5′端,以允许扩增子的直接Sanger测序。除非另有说明,扩增子是从肿瘤和匹配的正常患者DNA的基因组DNA中产生的。使用突变检测仪对所有毛细血管痕迹进行分析,并对所有变体进行目测检查,以确认其在肿瘤中的存在和生殖系痕迹中的缺失。
EZH2野生型和突变型SET结构域的计算建模
EZH2 SET结构域序列用于在蛋白质数据库中搜索同源建模的结构模板。MLL1 SET域的可用晶体结构(PDB ID 2w5z)12被确定为最佳模板(SET域的序列一致性为39%,没有对齐间隙)。通过蛋白质建模服务器SWISS-model构建EZH2 SET结构域的三维模型32由于MLL1是一种H3K4结合蛋白,有人担心EZH2(K27)的目标赖氨酸残基可能不在同一构象中。另一个问题是MLL1晶体结构为开放构象,与封闭构象相比,这种构象降低了甲基转移酶活性。构象变化可能会改变Y641的位置。为了证实这一点,我们使用其他结构作为模板构建了替代模型。我们使用了H3K9结合蛋白EHMT1(PDB ID 2RFI)、DIM-5(1PEG)、SUV39H2(2R3A)和G9a(2O8J)以及H3K36结合蛋白SETD2(3H6L)。与Y641相对应的保守酪氨酸残基的显著重叠证实,无论是开放构象还是闭合构象,Y641在所有蛋白质中的位置都保持不变。1PEG和2RFI中的共结晶H3肽帮助我们确认K4和K9在这些模型中的构象非常相似。因此,我们假设EZH2中的K27将形成接近模型所示的构象。
细胞系
数据库34,KARPAS卡帕斯42235,SU-DHL-636和WSU-DLCL237是从DSMZ和所有“OCI-LY”获得的细胞系38这些线来自NIH的L Staudt博士。
来源细胞(COO)测定
根据制造商的方案(Affymetrix),将总RNA反向转录(一个周期)并与U133-2 Plus阵列杂交。使用稳健的多芯片分析(RMA)规范化CEL文件。根据Lenz等人描述的185-基因模型,利用ABC和GCB的模型分数计算原始细胞(COO)。11以及Wright等人39.
肿瘤DNA拷贝数分析
如前所述,进行BAC阵列比较基因组杂交40并且没有发现任何显著的改变。如前所述,使用Affymetrix 500K SNP阵列分析肿瘤DNA的大拷贝数变化41使用外周血作为匹配的正常对照。测序数据也用于直接推断大规模缺失和扩增的存在。如前所述,这是通过概率识别正常和肿瘤基因组文库之间明确映射读取的比例偏差来实现的28。由于匹配正常组织的序列读取量较低,因此首先使用对齐参考读取来定义包含200个映射读取的等覆盖率基因组箱。正常基因组的测序深度提供了684029个bins,平均大小为3953 bp,代表了hg18组装的2.942 Gbases。使用隐马尔可夫模型(HMM)将连续区域划分为五种离散状态:拷贝数丢失(HMM 1)、中性(HMM 2)、增益(HMM 3)、扩增(HMM 4)和高水平扩增(HMM542。所有段及其HMM状态都包含在补充表2和显示在中补充图5.