跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
国家生物技术。作者手稿;PMC 2012年6月1日提供。
以最终编辑形式发布为:
2011年11月20日在线发布。 数字对象标识:10.1038/nbt.2049
预防性维修识别码:PMC3268007项目经理
NIHMSID公司:尼姆斯333656
PMID:22101486

高阶染色质结构决定了癌症中染色体改变的景观

关联数据

补充资料

癌症基因组结构信息的快速增长为更好地理解癌症基因组改变的突变机制以及作用于它们的选择力提供了机会。在这里,我们测试了两种主要力量的证据,即空间染色体结构和纯化(或阴性)选择,这两种力量塑造了癌症体细胞拷贝数改变(SCNA)的格局1使用最大似然框架,我们比较了由全基因组染色体构象捕获(HiC)确定的SCNA图和三维基因组结构,并用提出的分形球(FG)模型进行了描述2,这项分析提供了证据,表明癌症中染色体改变的分布与三维基因组结构在空间上相关,此外还表明,在癌症细胞的体细胞进化过程中,纯化选择和正向选择塑造了SCNA的景观。

体细胞拷贝数改变(SCNA)是在癌症中观察到的最常见的基因组改变之一,复发性改变已成功用于牵连致癌基因1.使用全基因组方法有效地发现致癌基因依赖于我们对癌症体细胞进化过程中如何产生新的基因组改变的理解47因此,我们检验了三维染色质组织和空间共定位影响癌症中观察到的体细胞拷贝数变化集的假设(图1A最近,前列腺癌研究中的癌症基因组数据表明8更普遍地讨论了空间邻近性和染色体重排912). 迄今为止,由于我们表征三维染色质结构的能力以及我们能够观察到癌症中SCNA的分辨率,在SCNA和癌症中三维染色质组织之间建立全基因组的明确连接受到了限制。在这里,我们问SCNA在癌症中的“前景”1根据最近开发的高通量染色体构象捕获HiC方法确定的3D染色质结构中的空间接触可以理解2或通过分形球(FG)模型进行理论描述(理论概念13,审阅). 具体来说,我们研究了图1A,并测试在间期由3D染色质结构在空间上靠近的遥远基因组位点是否更有可能发生结构改变,并成为癌症中观察到的扩增或缺失的终点。

保存图片、插图等的外部文件。对象名为nihms33656f1.jpg
3D接近作为SCNA形成机制

答:染色体结构和选择如何影响观察到的体细胞拷贝数变化模式的模型。环末端的第一个空间邻近性使SCNA更有可能在DNA损伤和修复后发生。其次,积极选择和净化选择的力量作用于已出现的SCNA,导致其最终固定或丢失。因此,在癌症中观察到的SCNA反映了突变和选择力。插图显示了模拟分形球状结构中的循环(坐标来自M.Imakaev)。两个接触点以球体突出显示,代表SCNA的潜在终点。

B。在26种组织学类型的3131例癌症标本中绘制的60580个少复发SCNA(39071个扩增,21509个缺失)的SCNA长度分布1平方表示以100 kb分辨率装箱后扩增(红色)或缺失(蓝色)SCNA的平均数(然后在对数间隔上取平均值)。浅品红线显示~1/L分布。灰色线条表示最适合净化选择(等式4)突变率均匀。深紫色线条最适合删除FG公司+sel(选择).

抄送:两个轨迹距离接触的概率以100kb的分辨率在染色体上分开。通过HiC方法表征的22条人类染色体(人类细胞系GM06690)的染色体内相互作用获得概率2。阴影区域显示了给定距离下100kb存储箱中计数数量的第5个和第95个百分位数的范围。平均接触概率用蓝线表示。浅品红线显示~1/染色质结构的分形球模型中也观察到缩放现象。蓝色虚线提供了在同一数据集中作为染色体间接触获得的接触频率的基线。

为此,我们根据作为进化过程的癌症背景下的空间染色质接触来检查SCNA的统计特性。在癌症的体细胞进化过程中14,15与其他进化过程一样,两种力量决定了基因组变化的积累(图1A):在人群中产生新的突变并固定这些突变。新SCNA的生成速度可能因遗传、表观遗传和细胞背景而异。SCNA发生后,根据其对细胞适应度的影响,可能会发生固定或丢失。如果SCNA为癌细胞提供适合性优势,则SCNA在癌症中的固定概率取决于正向选择和净化(即负向)选择之间的竞争,如果SCNA对细胞产生有害影响。因此,观察到特定SCNA的概率取决于其通过突变的发生率,以及改变所带来的选择性优势或劣势(图1A). 阳性、中性和纯化选择在癌症基因组中都很明显16.

我们对SCNA的统计分析表明,由于间期染色体组织和纯化选择导致的接触概率都有助于观察到癌症中SCNA的光谱。从年3131例癌症样本的全套SCNA报告中1,我们选择了39568个大于兆碱基的臂内SCNA(26022个扩增和13546个缺失)进行统计分析,不包括以着丝粒或端粒开始或结束的SCNA。为了证明我们的结果对作用于癌相关基因的阳性选择是稳健的,我们分析了24301个不跨越高表达SCNA区域的SCNA(16521个扩增和7789个缺失,分别占全组的63%和58%1,参见方法)。我们给出了较少复发SCNA的结果,并注意到我们的发现对所选SCNA的子集是稳健的。我们通过考虑染色体组织和纯化选择的各种模型来进行分析,这些模型用于计算根据模型观察到的SCNA的可能性。然后使用似然框架来区分竞争模型。使用排列测试进一步评估统计显著性。我们发现SCNA与高阶染色体结构之间的紧密联系不仅与目前对SCNA启动机制的理解一致17,但提供了如何通过染色体结构实现空间邻近性的见解,以及染色体结构对在基因组尺度上观察到的SCNA模式的重要性。

结果

SCNA景观中的三维染色质结构模式很明显

我们研究的最初动机是观察到局灶性SCNA的长度和染色体环的长度(即染色体内接触)具有相似的分布(图1B和1C),都在展出~1升缩放比例。人类细胞的HiC数据分析表明,所有基因座对的平均接触概率为一个距离染色体上的分裂是这样的HiC公司() ~ 1/对于一系列距离=0.5至7Mb2平均接触概率的标度与染色质结构的分形球(FG)模型一致。同样,观察长度为的焦点SCNA的平均概率大致为SCNA公司() ~ 1/对于相同的距离范围=0.5至10 Mb,如1数学上,观察到SCNA的平均概率随其长度衰减的现象非常显著。如果在一个染色体臂内随机选择两个SCNA末端,观察到长度为的SCNA的平均概率将保持不变。正选择倾向于放大癌基因或删除抑癌基因,同样不会产生平均值随长度减少的分布。要观察到这一结果,需要净化选择或依赖于长度的突变机制。

三维基因组结构和SCNA结构之间的联系超出了其长度分布的相似性:染色体接触概率较高的位点也更有可能成为SCNA终点(图2). 为了定量确定三维基因组结构和SCNA之间的关系,两个数据集被转换为相同的形式。对于每个染色体,我们将HiC数据表示为基因组位置之间的空间接触计数矩阵j个如在GM06990细胞系中使用1Mb的固定仓大小确定的2类似地,我们通过计算从基因组位置开始的扩增或缺失数量来构建SCNA矩阵并在位置处结束j个3131个肿瘤的相同染色体。图2显示17号染色体的HiC和SCNA矩阵(热图)。远离本分析中未考虑的着丝粒和端粒区域,SCNA热图类似于HiC热图(Pearson’s第页=.55,p<0.001,见补充表S1对于其他染色体)。特别是,3D交互丰富的地区似乎也经常出现SCNA。由于皮尔逊相关系数不适合描述SCNA等罕见概率事件,为了进一步分析,我们采用泊松似然法,这是一种广泛用于统计分析罕见事件的方法18.

保存图片、插图等的外部文件。对象名为nihms33656f2.jpg
分辨率为1Mb的17号染色体热图

答:。SCNA热图:站点的值(i、 j个)是从基因组位置开始的SCNA数量并在位置处结束j个在同一染色体上。UCSC浏览器中的染色体带结构显示在左侧,着丝粒带为红色。

B。HiC热图:站点(i、 j个)有报道的基因组位置之间的相互作用数量j个以Mb分辨率。HiC域结构如左侧所示。通过对HiC特征向量进行阈值化来确定域(如2,白色代表开放域,深灰色代表封闭域)。

C、。持续SCNA热图:如中所示A类,但在随机排列SCNA位置的同时保持SCNA长度不变。

从视觉上看,真正的SCNA热图与HiC类似(皮尔逊r=.55,p<0.001,见补充表S1对于其他染色体),显示“域”式组织。热图上方的漫画说明了映射的HiC片段和SCNA终点如何转化为基因组位置之间的相互作用j个由于在我们的统计分析中没有考虑到臂间SCNA、终末点靠近着丝粒或端粒的SCNA以及SCNAs<1Mb,因此热图的这些区域是灰色的。

似然分析表明,分形球状染色质结构最适合观察到的SCNA,并且在考虑纯化选择时,所有拟合都得到了改善

为了进一步测试染色体组织在SCNA生成中的作用,我们开发了一系列可能的SCNA生成过程的统计模型,计算了给定这些模型的SCNA数据的泊松概率(参见等式6),并使用其贝叶斯信息标准(BIC)值进行模型选择,该值是给定模型的对数似然,受其拟合参数数量的惩罚(参见等式7). 考虑的模型考虑了SCNA产生的不同机制,突变率为:长度一致(制服),由实验测定的染色质接触概率得出(HiC公司)或由分形球状染色质结构中的接触概率导出(FG公司). 我们注意到FG公司该模型指定了一个接触概率,该概率取决于基因组位点之间的距离,但不包括给定距离上的位置差异。

我们还考虑了SCNA因净化选择而可能产生的有害影响,这可能导致固定概率降低(参见等式1). SCNA对细胞适应性的有害影响可能来自基因或调控区域的破坏;因此,我们预计更长时间的SCNA将更加有害。SCNA长度与其对细胞适合性的有害影响之间的关系得到了观察结果的支持,即全臂SCNA不太可能用于较长的染色体臂1以及观察到随着扩增时间的延长,细菌生长率呈线性下降19如果我们假设SCNA的有害影响随其长度线性增加,并将癌症的体细胞进化视为莫兰过程15,20,我们发现注视概率随长度大致呈指数衰减,其速率反映了净化选择的强度(参见等式4,图1B). 将净化选择对固定概率的影响与突变模型相结合,得出以下六个模型:制服,制服+sel(选择)、HiC、HiC+sel(选择)、FG、FG+sel(选择),没有选择的模型没有拟合参数,只有一个拟合参数用于选择,其中附加参数通过BIC进行惩罚。

模型选择提供了两个主要结果(图3):首先,在SCNA产生的模型中,一个遵循分形球的染色体接触概率的模型(~1/)显著优于其他模型。其次,考虑到净化选择有助于适应远距离SCNA数量中观察到的翻转(>20Mb,图1B)当考虑到净化选择时,每个模型都得到了显著改善(通过自举p<0.001),这表明SCNA经历了净化选择。我们注意到,长距离SCNA数量的进一步下降可能是由于替代的染色质非依赖机制,进一步不利于形成超长SCNA。图3给出了模型(有和没有净化选择)相对于均匀模型的对数似然比。如果模型是在染色体对染色体的基础上拟合的(补充图2)我们观察到,对于长染色体FG公司模型比单纯的净化选择更适合。我们还发现描述纯化选择的最佳参数与染色体长度成正比(补充图2A). 由于最佳拟合参数的较小值对应更强的净化选择,这两个结果表明,短而基因丰富的染色体可能经历更大的净化选择。然而,我们注意到,与SCNA基因组长度成比例的净化选择比与受SCNA影响的基因数量成比例的纯化选择更符合数据(补充图3).

保存图片、插图等的外部文件。对象名称为nihms333656f3.jpg
选择SCNA形成模型

对于每种模型,显示了24310个观测到的SCNA的对数似然比(*BIC-corrected log-likelihood ratio),这些SCNA没有跨越下列高电流SCNA区域1考虑以下六种模型:制服,制服+sel(选择)、HiC、HiC+sel(选择)、FG、FG+sel(选择).HiC公司该模型假设突变率与实验测量的接触概率成正比,而FG公司该模型假设突变率与分形球状结构中的平均接触概率成正比(~1/L)。左y轴表示每个模型与。制服模型。每个模型都考虑了(+)和(−)净化选择。右y轴显示的数据与每个癌症样本(样本)与。制服误差条是通过引导获得的:正方形表示中值,条端表示第5和第95个百分位。FG模型显著优于SCNA形成的其他突变模型,并且当考虑到净化选择时,每个模型都得到了显著改进。

排列分析支持SCNA和实验确定的三维染色质结构之间的联系

接下来,我们测试了在实验性HiC数据中观察到的染色体接触的位置特异性结构,以及FG公司在SCNA景观中显而易见。使用排列分析进行测试(图4). 由于在HiC中观察到给定长度的SCNA的概率和染色体内接触的概率在很大程度上取决于距离,我们置换SCNA的方式保持了这种依赖性,但破坏了剩余的精细结构。这是通过在同一染色体臂内随机重新分配SCNA起始位置来实现的,同时保持其长度不变。我们发现HiC比它更适合于观察到的SCNA(图4,第页<.001). 单个染色体内的类似分析表明,在22条常染色体中,除10、11、16和19号染色体外,18条染色体的拟合度更好,且显著更好(第页<.01)用于9条染色体1、2、4、5、7、8、13、14和17(图4B). 而观察到的扩增和缺失分别比它们的置换对应物平均更适合(补充图5),删除比放大更适合(第页<0.001与。第页<0.05).

保存图片、插图等的外部文件。对象名为nihms33656f4.jpg
SCNA与HiC染色体相互作用巨基结构关系的排列分析

答:。在所有22个常染色体上随机排列的给予HiC的SCNA与给予HiC观察到的SCNA的对数似然比分布。观察到的SCNA(蓝色箭头)通过HiC接触概率更好地拟合第页<.001。排列是通过改变SCNA位置来执行的,同时保持SCNA长度不变。B类:单个染色体相同对数似然比的分布(与相应的观察到的SCNA,蓝线)。正方形代表中值,误差条分别代表5%至25%和75%至95%的范围。

最后,我们检查了染色体分区(域)的可能影响2)通过拟合模型,在模型中,如果两端位于相同类型的域中,则有利于SCNA的形成(参见方法)。最大化这两个参数的可能性FG公司+域模型显示,BIC修正后的似然比FG公司删除模型,而不是放大模型(补充图8和9). 最合适的域强度参数值有利于域内SCNA相对概率的小幅度增加(10–20%)。此外,最合适的FG公司+域根据置换测试的结果,该模型显示的位置特定信息量小于HiC(补充图8).

讨论

我们对HiC测量和癌症SCNA的全基因组分析发现,癌症中高阶基因组结构和重新排列之间存在多重联系。使用一个基于尖锐相似性的BIC框架,我们发现:(1)基于FG公司该模型比其他机械模型或单独的净化选择模型更好地解释了SCNA的长度分布;(2) 与置换数据的比较表明,在HiC和SCNA中观察到的megabase-level位置特异性3D染色质结构之间存在显著联系;(3) 支持域内SCNA的乘法模型除了FG公司模型,与HiC相比,其位置特定信息更少;(4) SCNA数据反映了突变机制和净化选择,以及通常认为的正向选择。

这些结果有力地证明了3D染色质组织在染色体改变形成中的重要性。虽然SCNA的分布可能依赖于复杂的突变和选择环境,而这仅仅与3D基因组结构相关,但通过3D基因组接触直接解释更为简约。沿着这些路线,最近对易位的两项实验研究表明,物理邻近性是基因组重排的关键决定因素之一21,22此外,对癌症易位的全基因组分析表明,染色体位点之间的易位丰富,实验确定的染色体接触次数更多23.

基因组结构可能因癌细胞起源类型和这些细胞的特定染色质状态而异24,25从而影响每种癌症类型中观察到的SCNA集;例如,发现前列腺癌中的重新排列断点与前列腺上皮细胞特定染色质状态的基因座相关8事实上,如果HiC数据与观察到的SCNA集合的肿瘤细胞类型来源相匹配,我们可能会发现细胞类型特定的实验3D接触比分形球模型更符合SCNA的观察分布。尽管存在这一局限性,但当我们对按癌症谱系(上皮、造血、肉瘤和神经)分组的SCNA进行排列分析时,我们仍然发现HiC在缺失方面与观察到的SCNA显著匹配,而在扩增方面与跨癌症谱系一致的排列SCNA相比,HiC更适合SCNA(补充图6).

放大和删除之间的差异(补充图4、5、6)可能反映了选择强度和基因组改变机制的差异:可以想象,染色体环的简单缺失可能导致缺失,而扩增可能通过更复杂的过程发生17并且可能需要与同系物和非同系物染色体相互作用,这些染色体不一定与间期内的染色体空间邻近性直接相关。

我们的结果表明,全面了解作用于癌症基因组的突变和选择力,不仅限于癌相关基因的正向选择,对于解释所观察到的SCNA分布非常重要。此外,通过比较SCNA分布的模型优劣,认为净化选择是一种常见现象,癌症中的许多SCNA可能是轻度有害的“乘客突变”(参见26,27). 我们注意到,虽然我们在SCNA的长度分布中发现了染色质组织和纯化选择的证据,但在我们的最佳拟合模型中,3D染色质结构解释了SCNA相对频率的约100倍,而纯化选择为长SCNA贡献了约3倍(>20–100Mb),对较短SCNA的频率几乎没有影响(<20Mb)。据推测,除净化选择之外的机制可能会导致对过长SCNA的额外抑制。然而,观察到的远距离SCNA数量的指数翻转不太可能是由SCNA映射引起的限制引起的,因为在高频下可以成功检测到全臂SCNA。

随着更多的HiC型数据集可用,比较基因组方法对染色体重排的敏感性和相关性只能增加。未来的研究将能够解决不同3D结构对观察到的跨细胞类型和细胞状态的染色体重排的重要性。也许更重要的是,癌症基因组测序数据将比目前基于阵列的方法进行更详细的分析,从而对SCNA的形成有更深入的机理了解。特别是,高通量全基因组测序数据将允许对染色体间重排进行高分辨率分析,并产生对序列特征、染色质修饰和3D基因组结构之间相互作用的洞察力。

方法

构建热图

我们根据Beroukhim等人的数据生成了SCNA热图。1世卫组织报告了3131份癌症标本中75700个扩增和55101个缺失事件;报告的事件是那些推断拷贝数变化>.1或<!的事件!。1,由于实验限制。我们将我们的分析局限于不在端粒/着丝粒区域附近开始/结束的臂内SCNA,这些端粒/着丝点区域被一个以上的百万碱基bin隔开,得到了一组39568个SCNA(26022个扩增和13546个缺失)。我们注意到,SCNA在着丝粒/端粒开始/结束(包括全臂增益/丢失)显示出与其他局灶性SCNA截然不同的发生模式,特别是在长度分布方面,这可能表明不同的突变机制。由于SCNA和HiC数据的分辨率限制,需要分离一个以上的兆基站(参见补充图1详细信息)。SCNA矩阵是通过计算从Mb开始的放大或删除数来构建的以Mb结束j个属于同一染色体。类似地,通过计算报告的相互作用数量来生成HiC热图2Mb之间j个人类细胞系GM06690的同一染色体。

SCNA的突变和进化模型

为了测试突变力和选择力对SCNA分布的各自贡献,我们考虑了在SCNA上观察到的开始和结束于的概率j个

ij公司μij公司 · π()
(1)

作为突变概率的乘积,即单个细胞中发生SCNAμij公司以及在癌细胞群π中固定这种突变的概率(),其中= |j个是SCNA长度。突变概率μij公司取决于描述导致染色体改变过程的模型:(制服)改变的两端从同一染色体臂上随机抽取μij公司制服=常数(HiC公司)改变的概率取决于HiC数据给出的端部之间3D接触的概率,μij公司HiC公司~ij公司HiC公司(FG公司)根据分形球模型,改变的概率取决于3D接触的概率,即SCNA的长度:μij公司FG公司=μFG公司()~1/固定的概率取决于突变细胞与非突变细胞的适应度(见下文)。每个突变模型都是单独考虑的,并结合纯化选择,给出了六个模型:制服、HiC、FG、制服+sel(选择)、HiC+sel(选择)、和FG公司+sel(选择)例如,ij公司FG公司=μFG公司(),ij公司FG公司+SEL公司=μFG公司()·π()描述选择的附加参数使用BIC(如下所述)进行说明。

我们还检查了一个突变模型,该模型结合了HiC测定的染色体间隔的影响2FG公司模型(FG公司+域). 通过假设SCNA端位于活动-活动、活动-非活动和非活动-活动域(两个独立参数)的不同可能性,将域引入我们的模型。然后将该畴结构乘以分形球接触概率,ij公司FG公司+=μFG公司()·D类ij公司,其中D类ij公司=1,如果j个在不同的域中,D类ij公司=κ,如果j个都在一个开放域中,并且D类ij公司=ν如果j个都在一个封闭域中。我们在结构域分析中排除了第4、5和15号染色体,因为这些染色体在HiC结构域之间的对应性较差(如最初的HiC分析所确定的那样2)以及HiC联系人映射。

选择对固定概率的影响

两种主要的选择力作用于SCNA:对扩增癌基因或删除抑癌基因的SCNA的正向选择,以及对所有改变起作用的净化选择。净化选择源于SCNA的有害影响,SCNA删除或放大与肿瘤进展无关的基因和基因组调控区域。我们假设SCNA的有害影响以及由此导致的细胞适应度下降ΔF类,与SCNA长度成正比:|ΔF类|⑪.

使用Moran过程作为癌症进化模型计算固定概率15,20:

π(ΔF类)=11/(1+ΔF类)11/(1+ΔF类)N个,
(2)

式中ΔF类是相对适应度差异(选择系数),N个是有效的人口规模。对于弱有害突变(ΔF类< 0,N个F类| ≫ 1, |ΔF类|≪1)

π(ΔF类)ΔF类1经验(ΔFN公司)
(3)

注意,对于足够有害的突变,这会导致固定概率呈指数抑制:π(ΔF类)?exp(ΔFN公司) (ΔF类<0),这是一个有用的直观概念。假设有害影响与SCNA长度呈线性关系,ΔF类= −/λ、 我们获得了作用于SCNA的净化选择的固定概率

π()=C经验(/α)1
(4)

其中C是通过标准化得到的任意常数P(升),且α=λ/N个是一个拟合参数,用于量化净化选择的强度。对于基于基因的净化选择,只是被改变的基因数量所取代。选择性中性突变没有长度依赖性,所以π() =C,因此ij公司~ μij公司.

阳性选择控制

作用于癌相关基因(如致癌基因和抑癌基因)的阳性选择为我们的分析提供了一个可能的混淆因素。为了确定我们的结果对作用于癌相关基因的阳性选择是稳健的,我们分析了39568个SCNA的子集(26022个扩增和13546个缺失),这些SCNA不跨越GISTIC识别的高电流SCNA区域,其错误发现率q值变化<.25,如Beroukhim等人。1,收集了24310个SCNA(16521个扩增和7789个缺失,分别占全组的63%和58%)。在移除跨越高电流区域的SCNA后,在被置换的SCNA不跨越任何高电流区域这一约束条件下执行置换。阳性选择也可以通过对推断的拷贝数变化设置阈值来进行控制,以筛选在个别癌症中可能经历过强阳性选择的SCNA。我们注意到,我们的研究结果对选定的SCNA子集是稳健的,很可能是因为驾驶员SCNA比乘客SCNA少很多(补充图7).

基于泊松对数似然、贝叶斯信息准则的模型选择

自发生特定SCNA以来结束于j个这是一个罕见的事件,我们通过计算给定模型的数据的泊松对数似然来评估模型预测SCNA观测分布的相对能力:

日志(SCNA公司|模型)=日志((j个)>1经验(ij公司模型)(ij公司模型)SCNA公司ij公司(SCNA公司ij公司)!)=(j个)>1ij公司模型+SCNA公司ij公司日志(ij公司模型)+常数.
(6)

哪里ij公司模式1由上述模型决定,并且SCNA公司ij公司是以i和j开始和结束的SCNA的数量。由于扩增和缺失的重复区域不同,我们分别计算扩增和删除的对数似然,然后在这两类SCNA之间进行聚合。在对数似然计算之后,使用贝叶斯信息准则(BIC)对模型进行排序和模型选择。BIC根据模型的复杂性,即参数数量,对模型进行惩罚。惩罚k个的附加参数n个使用贝叶斯信息标准(BIC)观察到的SCNA很简单:

BIC=对数(SCNA|型号)-1.5k个日志(n个)
(7)

首选BIC较高的型号28对于置换分析,对数似然的计算方法是相同的,首先是针对观测到的SCNA,然后是针对SCNA的置换集。

补充材料

1

单击此处查看。(1.1M,文件)

致谢

我们感谢米尔尼实验室的成员进行了有益的对话,特别是与克里斯托弗·麦克法兰(Christopher McFarland)就净化选择和马克西姆·伊马卡耶夫(Maxim Imakaev)关于分形球的对话。我们感谢Craig Mermel对SCNA数据的介绍。我们感谢Vineeta Agarwala、Jesse Engrietz、Rachel McCord和Job Dekker提出的有益意见和建议。这项工作得到了麻省理工学院NIH/NCI物理科学肿瘤中心(U54CA143874)的支持

工具书类

1Beroukhim R等人。人类癌症中体细胞拷贝数变化的前景。自然。2010;463:899–905. [PMC免费文章][公共医学][谷歌学者]
2Lieberman-Aiden E等人。对长程相互作用的综合绘图揭示了人类基因组的折叠原理。科学。2009;326:289–293. [PMC免费文章][公共医学][谷歌学者]
3Mirny LA。作为细胞染色质结构模型的分形球。染色体研究。2011;19:37–51. [PMC免费文章][公共医学][谷歌学者]
4Greenman C等人。人类癌症基因组中的体细胞突变模式。自然。2007;446:153–158. [PMC免费文章][公共医学][谷歌学者]
5Wood LD等。人类乳腺癌和结直肠癌的基因组景观。科学。2007;318:1108–1113.[公共医学][谷歌学者]
6Beroukhim R等人。评估染色体畸变在癌症中的意义:方法学和在胶质瘤中的应用。美国国家科学院院刊。2007;104:20007–20012. [PMC免费文章][公共医学][谷歌学者]
7全面的基因组特征定义了人类胶质母细胞瘤基因和核心途径。自然。2008;455:1061–1068. [PMC免费文章][公共医学][谷歌学者]
8Berger MF等。原发性人类前列腺癌的基因组复杂性。自然。2011;470:214–220. [PMC免费文章][公共医学][谷歌学者]
9Wijchers PJ,de Laat W.基因组组织影响染色体重排的伴侣选择。遗传学趋势:TIG。2011;27:63–71.[公共医学][谷歌学者]
10Meaburn KJ,Misteli T,Soutoglou E.染色体易位形成中的空间基因组组织。癌症生物学研讨会。2007;17:80–90. [PMC免费文章][公共医学][谷歌学者]
11Nikiforova MN等。参与人类细胞辐射诱导重排的染色体位点的邻近性。科学。2000;290:138–141.[公共医学][谷歌学者]
12Branco MR,Pombo A.间期染色体区域的混合表明在易位和转录相关关联中的作用。《公共科学图书馆·生物学》。2006;4:e138。 [PMC免费文章][公共医学][谷歌学者]
13Grosberg AY、Nechaev SK、Shakhnovich EI。拓扑约束在大分子坍塌动力学中的作用。《身体杂志》。1988;49:2095–2100. [谷歌学者]
14Nowell PC。肿瘤细胞群的克隆进化。科学。1976;194:23–28.[公共医学][谷歌学者]
15Merlo LM、Pepper JW、Reid BJ、Maley CC。癌症是一个进化和生态过程。自然评论。癌症。2006;6:924–935。[公共医学][谷歌学者]
16Lee W等。肺癌患者配对基因组序列揭示的突变谱。自然。2010;465:473–477.[公共医学][谷歌学者]
17Hastings PJ、Lupski JR、Rosenberg SM、Ira G.基因拷贝数变化的机制。自然评论。遗传学。2009;10:551–564. [PMC免费文章][公共医学][谷歌学者]
18Armitage P、Berry G、Matthews JNS。医学研究中的统计方法。十一、。Malden,MA:布莱克威尔科学;2001年,第817页。[谷歌学者]
19Hastings PJ,Bull HJ,Klump JR,Rosenberg SM。适应性扩增:一种诱导性染色体不稳定机制。细胞。2000;103:723–731.[公共医学][谷歌学者]
20莫兰PAP。进化论的统计过程。牛津:克拉伦登出版社;1962年,第200页。[谷歌学者]
21Chiarle R等。全基因组易位测序揭示了B细胞染色体断裂和重排的机制。细胞。2011;147:107–119. [PMC免费文章][公共医学][谷歌学者]
22Klein IA等人。易位-捕获测序揭示了B淋巴细胞染色体重排的程度和性质。细胞。2011;147:95–106. [PMC免费文章][公共医学][谷歌学者]
23Jesse M,弗吉尼亚州Engreitz,Leonid A Mirny。三维基因组结构影响人类疾病中染色体易位的伴侣选择。2011提交。[PMC免费文章][公共医学][谷歌学者]
24Mayer R等。小鼠高阶染色质排列的常见主题和细胞类型特异性变化。BMC细胞生物学。2005年;6:44. [PMC免费文章][公共医学][谷歌学者]
25Roix JJ、McQueen PG、Munson PJ、Parada LA、Misteli T.人类淋巴瘤易易位基因座的空间接近性。自然遗传学。2003;34:287–291.[公共医学][谷歌学者]
26Stratton MR、Campbell PJ、Futreal PA。癌症基因组。自然。2009;458:719–724. [PMC免费文章][公共医学][谷歌学者]
27Haber DA,Settleman J.癌症:司机和乘客。自然。2007;446:145–146.[公共医学][谷歌学者]
28Schwarz G.估算模型的维数。《统计年鉴》。1978;6:461–464. [谷歌学者]