跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2011年;12(4):R41。
doi:10.1186/gb-2011-12-4-r41。 Epub 2011年4月28日。

GISTIC2.0有助于敏感而自信地定位人类癌症中局灶性体细胞拷贝数改变的靶点

附属公司

GISTIC2.0有助于敏感而自信地定位人类癌症中局灶性体细胞拷贝数改变的靶点

克雷格·默梅尔等。 基因组生物学. 2011.

摘要

我们描述了具有更强能力和特异性的方法,以识别由体细胞拷贝数改变(SCNA)靶向的基因,这些基因会驱动癌症生长。通过将SCNA特征分为基本的臂级和焦点变化,我们改进了对每个类别背景率的估计。我们还描述了一种概率方法,用于定义具有用户定义置信度的选定SCNA区域的边界。在这里,我们详细介绍了这种改进的计算方法GISTIC2.0,并在实际和模拟数据集中验证了其性能。

PubMed免责声明

数字

图1
图1
文号分析框架示意图概述。对我们的癌症拷贝数分析框架的高级概述,强调了原始GISTIC算法[15]和本手稿中描述的GISTIC 2.0管道之间的具体差异。第一步是准确识别每个样本中的拷贝数剖面,这对于GISTIC和GISTIC2.0来说是常见的。
图2
图2
陆军和焦点SCNA的计算分离.(a)箱线图显示了TCGA中178 GBM剖面上放大焦点(长度<染色体臂的98%)和臂水平(长度>染色体臂的98%)SCNA的拷贝数变化分布。黑色虚线表示用于消除人为SCNA的典型低电平振幅阈值,而绿色虚线表示用于消除臂级SCNA的先前版本的GISTIC中的典型高电平振幅阈值。(b)直方图显示了在178 GBM样本中观察给定长度SCNA的频率。仅占据一条染色体臂的高频率事件导致我们区分了局灶性SCNA和臂级SCNA。(c)热图显示TCGA GBM集合的总分段拷贝数剖面(最左侧面板),以及通过计算将这些样本分为臂级剖面(中间面板)和焦点剖面(最右侧面板)的结果,方法是将臂级和焦点SCNA相加。在每个热图中,染色体从上到下垂直排列,样本从左到右排列。红色和蓝色分别代表收益和损失。
图3
图3
基于幅度或基于长度的陆军级事件过滤对GISTIC结果的影响.(a-c)GISTIC放大(顶部)和删除(底部)图使用所有数据和低振幅阈值(a)、所有数据和高振幅阈值(b)以及焦点数据和低幅度阈值(c)。基因组从上到下垂直定向,每个基因座的GISTIC q值在对数尺度上从左到右绘制。绿线表示显著性阈值(q值=0.25)。对于每个图,当通过所有三个分析确定时,已知或感兴趣的候选基因以黑色突出显示,当通过高振幅或焦距分析确定时以红色突出显示,在通过低振幅或焦长分析确定时则以紫色突出显示,而当仅在焦距分析中确定时以绿色突出显示。
图4
图4
剥离对检测次要驱动因素事件的敏感性GISTIC使用标准剥离法(蓝线)或仲裁剥离法(红线)对两个模拟数据集显示了在独立(不包含主要驱动因素)峰值中恢复的次要驱动因素事件的平均分数。(a)数据来自300个样本中的1000条模拟染色体,其中10%的样本中存在一个主驱动事件,5%的样本中有一个距离固定的次驱动事件。(b)数据来自300个样本中的10000条模拟染色体,其中10%的样本中存在一个主驱动事件,5%的样本中有一个次驱动事件,其中与主驱动事件重叠的次驱动事件的比例在100%之间变化(完全相关;最左端)0%(完全独立;极右翼)。误差条表示平均值的平均值±标准误差(有些太小,无法看到)。
图5
图5
寻峰算法的灵敏度.(a)演示各种峰值查找方法的示意图。左侧面板显示了一条模拟染色体的GISTIC评分曲线,该模拟染色体包含涵盖指定目标基因的驾驶员事件和随机散布在染色体上的乘客事件的混合。右侧插图以更高的细节显示了最大G-score周围的区域(左侧面板中的灰色框)。MCR(红色虚线)被定义为线段重叠最大的区域,或G得分最高的区域。在依次删除每个样本并将MCR的最小和最大范围作为左边界和右边界后,通过重复计算MCR来获得删除k-out过程(此处显示的蓝色虚线表示k=1)。RegBounder的工作原理是试图找到一个区域(绿色虚线),在该区域上,边界和最大峰值得分之间的变化在局部范围分布的第gth个百分位内(附加文件1中的补充方法)。在这里,RegBounder生成的区域比MCR或leave-k-out过程更宽,但它是唯一一种边界包含真正驱动程序基因的方法。(b、c)峰值区域内包含的驾驶员事件的平均分数(条件是在10 Mb内找到GISTIC峰值)绘制为MCR(红色)、leave-1-out(蓝色)和RegBounder算法(后者在不同置信水平下:50%,洋红色;75%,绿色;95%,黑色)的驾驶员频率(b)或样本大小(c)的函数。在(b)中,数据来自500个样本中的10000条模拟染色体,其中驱动频率从1%到10%不等。在(c)中,数据来源于10000条模拟染色体,样本数量可变,其中驱动频率固定为5%。误差条表示平均值的平均值±标准误差(有些太小而看不见)。
图6
图6
RegBounder to MCR和leave-1-out程序应用于原发性肺腺癌的比较。RegBounder相对于之前的峰值发现程序的优势体现在GISTIC分析371例肺腺癌样本中确定的两个明确的癌基因峰,Affymetrix 250K StyI SNP阵列表征了这两个癌基因峰(如[16]所发布)。(a)染色体12p12.1上有一个清晰的扩增峰,MCR(红色虚线)靠近但不包含已知肺癌癌基因克拉斯。由于该地区有两个以上明显的乘客事件,离开尖峰(蓝色虚线)也不包含克拉斯然而,RegBounder(绿色虚线)产生了一个更宽的峰值,可以捕获克拉斯.(b)染色体5p15.33上的一个扩增峰包含小时人端粒酶全酶的催化亚单位,位于MCR(红色虚线)内。在这种情况下,RegBounder(绿色虚线)产生的峰区域比相应的leave-1-out峰(蓝色虚线)窄,这表明RegBounder's能够在峰区域大小和准确性之间实现更大的平衡。在(a)和(b)中,y轴表示扩增G分数,x轴表示沿着相应染色体的位置。
图7
图7
寻峰算法的特殊性.(a、b)MCR(红色)、leave-1-out(蓝色)和RegBounder(绿色,75%置信度)产生的峰值区域的中值大小显示为驱动频率(a)和样本大小(b)的函数。在(a)中,数据来自500个样本中的10000条模拟染色体,其中驱动频率从1%到10%不等。在(b)中,数据来源于10000条模拟染色体,样本数量可变,其中驱动频率固定为5%。(c)比较RegBounder(绿线)获得的峰区大小与理论上最小的峰区尺寸(黑线),理论上最小峰区尺寸可以通过具有类似置信水平的任何峰值查找算法获得(附加文件1中的补充方法)。误差条表示平均值的平均值±标准误差(有些太小,无法看到)。

类似文章

  • 比较分析从深度测序数据中识别体细胞拷贝数变化的方法。
    Alkodsi A、Louhimo R、Hautaniemi S。 Alkodsi A等人。 简要生物信息。2015年3月;16(2):242-54. doi:10.1093/bib/bbu004。Epub 2014年3月5日。 简要生物信息。2015 PMID:24599115
  • 人类癌症中的体细胞拷贝数改变。
    Beroukhim R、Mermel CH、Porter D、Wei G、Raychaudhuri S、Donovan J、Barretina J、Boehm JS、Dobson J、Urashima M、Mc Henry KT、Pinchback RM、Ligon AH、Cho YJ、Haery L、Greulich H、Reich M、Winckler W、Lawrence MS、Weir BA、Tanaka KE、Chiang DY、Bass AJ、Loo A、Hoffman C、Prensner J、Liefeld T、Gao Q、Yecies D、Signoretti S、Maher E、Kaye FJ、,Sasaki H、Tepper JE、Fletcher JA、Tabernero J、Baselga J、Tsao MS、Demichelis F、Rubin MA、Janne PA、Daly MJ、Nucera C、Levine RL、Ebert BL、Gabriel S、Rustgi AK、Antonescu CR、Ladanii M、Letai A、Garraway LA、Loda M、Beer DG、True LD、Okamoto A、Pomeroy SL、Singer S、Golub TR、Lander ES、Getz G、Sellers WR、Meyerson M。 Beroukhim R等人。 自然。2010年2月18日;463(7283):899-905. doi:10.1038/nature08822。 自然。2010 PMID:20164920 免费PMC文章。
  • 人类癌症体细胞拷贝数变化的基因组决定因素。
    Zhang Y、Xu H、Frishman D。 张毅等。 人类分子遗传学。2016年3月1日;25(5):1019-30. doi:10.1093/hmg/ddv623。Epub 2016年1月4日。 人类分子遗传学。2016 PMID:26732428
  • 使用SAAS-CNV从新一代测序和SNP阵列数据中检测和表征癌症基因组中的体细胞拷贝数变化。
    张Z、郝K。 张泽等。 方法分子生物学。2018;1833年29日至47日。doi:10.1007/978-1-4939-866-8_2。 方法分子生物学。2018 PMID:30039361 审查。
  • 肺炎性肌纤维母细胞瘤候选基因的拷贝数改变和表达谱。
    Jung SH、Yim SH、Hu HJ、Jung CK、Lee SH、Kim DH、Chung YJ。 Jung SH等人。 肺癌。2010年11月;70(2):152-7. doi:10.1016/j.lungcan.2010.01.019。Epub 2010年2月24日。 肺癌。2010 PMID:20185201 审查。

引用人

工具书类

    1. Hanahan D,Weinberg RA。癌症的特征。单元格。2000;100分57秒–70秒。doi:10.1016/S0092-8674(00)81683-9。-内政部-公共医学
    1. Stratton MR,Campbell PJ,Futreal PA。癌症基因组。自然。2009;458:719–724. doi:10.1038/nature07943。-内政部-项目管理咨询公司-公共医学
    1. Santarius T、Shipley J、Brewer D、Stratton MR、Cooper CS。人类癌症基因扩增和过度表达的普查。Nat Rev癌症。2010;10:59–64. doi:10.1038/nrc2771。-内政部-公共医学
    1. Beroukhim R、Mermel C、Porter D、Wei G、Raychaudhuri S、Donovan J、Barretina J、Boehm J、Dobson J、Urashima M。人类癌症中体细胞拷贝数变化的前景。自然。2010;463:899–905. doi:10.1038/nature08822。-内政部-项目管理咨询公司-公共医学
    1. Chiang D,Getz G,Jaffe D,O'Kelly M,Zhao X.利用大规模平行测序对拷贝数变化进行高分辨率绘图。自然方法。2009;6:99–103. doi:10.1038/nmeth.1276。-内政部-项目管理咨询公司-公共医学

出版物类型

物质

LinkOut-更多资源