跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2010;11(9):R92。
doi:10.1186/gb-2010-11-9-r92。 Epub 2010年9月21日。

从单核苷酸多态性基因分型数据中检测异质性肿瘤样本基因组畸变的统计方法

附属公司

从单核苷酸多态性基因分型数据中检测异质性肿瘤样本基因组畸变的统计方法

克里斯托弗·姚等。 基因组生物学. 2010.

摘要

我们描述了一种统计方法,用于表征从癌症基因组获得的单核苷酸多态性微阵列数据中的基因组畸变。我们的方法允许我们在一个统一的贝叶斯框架内模拟多倍体、正常DNA污染和肿瘤内异质性的联合效应。我们在许多数据集上证明了我们的方法的有效性,包括实验室生成的正常癌细胞系和真实原发肿瘤的混合物。

PubMed免责声明

数字

图1
图1
癌症SNP数据示例(顶面板)SNP数据显示了癌症细胞系(HCC1395)及其匹配正常细胞(HCC1935BL)的Log R Ratio(LRR)和B等位基因频率(BAF)值在第1染色体上的分布。正常样本的特征是典型的二倍体模式,平均LRR为零(拷贝数2),BAF值分布在0、0.5和1左右(基因型AA、AB和BB),偶尔由于拷贝种系数变异(CNV)而出现畸变。由于多种拷贝数改变和异相丢失事件,癌细胞系由LRR和BAF值的复杂模式组成。(底部面板)显示了各种正常癌细胞系稀释液在21号染色体上的单拷贝缺失和重复SNP数据。在存在正常DNA污染的情况下,缺失和重复的LRR信号在数量上减少,BAF值的分布反映了在每个SNP中混合正常和癌症基因型的聚集效应。注:为了便于说明,对对数R比值进行了平滑和细化。
图2
图2
说明统计模型.(a)肿瘤样本由未知数量的克隆(这里,我们展示了三个克隆)和不同比例的正常细胞的DNA贡献组成。每个克隆都有自己的一组肿瘤基因型,这些基因型是通过等位基因的丢失或复制从正常基因型中衍生出来的。(b)我们的统计模型假设,在每个基因座上都存在一个正常和常见的肿瘤基因型。OncoSNP从SNP数据中估计正常和常见肿瘤基因型以及每个基因型解释的样本比例。SNP 5中描述的情况涉及不同肿瘤基因型的克隆-这在我们的模型中没有考虑。
图3
图3
估计因倍性引起的基线对数比调整癌细胞系OncoSNP Log R比率基线调整(红色)(a)HL60(铬10),(b)HT29(第3章)和(c)SW1417(Chr8)。HL60具有近二倍体核型,OncoSNP已正确确定无需进行对数比基线调整。HT29和SW1417具有复杂的多倍体核型,将SNP数据转换为虚拟二倍体状态需要为Log R比率确定模糊基线。例如,在(b)和(c)中,确定了对数比为负的等位基因平衡区域。OncoSNP正确定位Log R Ratio的真实基线水平。(d)对所分析的10个癌细胞系进行的Log R Ratio基线调整估计值与每个细胞系的模式染色体数呈强线性相关。由于SNP数据是从不同版本的Illumina SNP阵列中获取的,因此基线调整是标准化的,以便与与拷贝数3相关的Log R Ratio水平进行比较。
图4
图4
正常癌细胞系(SW837)混合序列的实例分析结肠癌细胞系SW837第1染色体的拷贝数和LOH状态分类。
图5
图5
三种正常癌细胞系混合序列的OncoSNP分析三个正常癌细胞系混合序列的染色体数估计值、拷贝数和LOH状态误分类率。在测试的三种方法中,OncoSNP产生了最大的自一致性。红色-OncoSNP,绿色-GenoCN,蓝色-GAP。
图6
图6
使用OncoSNP模型的四种变体对全基因组拷贝数估计的比较。图中显示了我们模型的四个变体的全基因组拷贝数:(i)未进行Log R Ratio基线校正或正常污染的种系模型,(ii)所用基线校正的单倍模型估计,(iii)使用的正常DNA污染的正态模型估计(iv)完整的OncoSNP模型,包括基线和正常DNA污染评估。即使在正常DNA污染水平不断增加的情况下,完整模型也能够准确地为两种细胞系(SW837/SW403)复制相同的拷贝数。如果未使用正常污染或基线校正估计,则可能会给出不正确的拷贝数剖面。
图7
图7
原发性乳腺肿瘤的全基因组拷贝数分布。使用OncoSNP、GenoCN和基因组改变打印(GAP)对三种原发性乳腺肿瘤(非解剖和显微解剖)的基因组拷贝数分布。
图8
图8
一例倍体状态未知且DNA污染正常的肿瘤样本分析。似然等值线图显示,有三种模式,每种模式对应于SNP数据的另一种解释:(a)肿瘤具有近二倍体核型并且被50%的正常DNA含量污染,(b)肿瘤有一个四倍体核型,60%的正常DNA含量和(c)该肿瘤的核型接近三倍体,DNA含量可忽略不计。每种模式下的最大对数似然非常相似。

类似文章

引用人

  • 英国生物银行的综合胰腺癌风险预测模型。
    Ke TM、Lophatananon A、Muir KR。 Ke TM等人。 生物医学。2023年12月1日;11(12):3206. doi:10.3390/生物医学11123206。 生物医学。2023 PMID:38137427 免费PMC文章。
  • 膀胱癌起源于粘膜场效应。
    Bondaruk J、Jaksik R、Wang Z、Cogdell D、Lee S、Chen Y、Dinh KN、Majewski T、Zhang L、Cao S、Tian F、Yao H、Ku sh P、Chen H、Weinstein JN、Navai N、Dinney C、Gao J、Theodorescu D、Logothetis C、Guo CC、Wang W、McConkey D、Wei P、Kimmel M、Czerniak B。 Bondaruk J等人。 iScience。2022年6月7日;25(7):104551. doi:10.1016/j.isci.2022.104551。eCollection 2022年7月15日。 iScience。2022 PMID:35747385 免费PMC文章。
  • 低级别胶质瘤的拷贝数改变和基因表达之间的集合差异相互作用揭示了预后相关途径。
    Cho SB公司。 Cho SB公司。 熵(巴塞尔)。2020年12月18日;22(12):1434。doi:10.3390/e22121434。 熵(巴塞尔)。2020 PMID:33353229 免费PMC文章。
  • 肿瘤纯度的系统评估及其临床意义。
    Haider S、Tyekucheva S、Prandi D、Fox NS、Ahn J、Xu AW、Pantazi A、Park PJ、Laird PW、Sander C、Wang W、Demichelis F、Loda M、Boutros PC;癌症基因组图谱研究网络。 Haider S等人。 JCO Precis Oncol公司。2020年9月4日;4:PO.20.00016。doi:10.1200/PO.20.00016。eCollection 2020。 JCO Precis Oncol公司。2020 PMID:33015524 免费PMC文章。
  • 基因组不稳定性和TP53型基因组改变与抗增殖反应差和对芳香化酶抑制剂治疗的内在抗性有关。
    Schuster EF、Gellert P、Segal CV、López-Knowles E、Buus R、Cheang MCU、Morden J、Robertson J、Bliss JM、Smith I、Dowsett M;POETIC试验管理小组和试验员。 Schuster EF等人。 JCO Precis Oncol公司。2019年6月12日;3:PO.18.00286。doi:10.1200/PO.18.00286。2019年eCollection。 JCO Precis Oncol公司。2019 PMID:32914010 免费PMC文章。

工具书类

    1. Beroukhim R、Getz G、Nghiemphu L、Barretina J、Hsueh T、Linhart D、Vivanco I、Lee JC、Huang JH、Alexander S、Du J、Kau T、Thomas RK、Shah K、Soto H、Perner S、Prensner J、Debiasi RM、Demichelis F、Hatton C、Rubin MA、Garraway LA、Nelson SF、Liau L、Mischel PS、Cloughesy TF、Meyerson M、Golub TA、Lander ES、Mellinghoff IK。等。评估染色体畸变在癌症中的意义:方法学和在胶质瘤中的应用。美国国家科学院院刊2007;104:20007–20012。doi:10.1073/pnas.0710052104。-DOI程序-项目管理咨询公司-公共医学
    1. Weir BA、Woo MS、Getz G、Perner S、Ding L、Beroukhim R、Lin WM、Province MA、Kraja A、Johnson LA、Shah K、Sato M、Thomas RK、Barletta JA、Borecki IB、Broderick S、Chang AC、Chiang DY、Chirieac LR、Cho J、Fujii Y、Gazdar AF、Giordano T、Greulich H、Hanna M、Johnson BE、Kris MG、Lash A、Lin L、,Lindeman N.等人。描述肺腺癌中癌症基因组的特征。自然。2007;450:893–898. doi:10.1038/nature06358。-DOI程序-项目管理咨询公司-公共医学
    1. Caren H、Kryh H、Nethander M、Sjoberg RM、Trager C、Nilsson S、Abrahamsson J、Kogner P、Martinsson T。11q缺失的高危神经母细胞瘤表现出预后不良、染色体不稳定表型,发病较晚。美国国家科学院院刊2010;107:4323–4328. doi:10.1073/pnas.0910684107。-DOI程序-项目管理咨询公司-公共医学
    1. Waddell N、Arnold J、Cocciardi S、da Silva L、Marsh A、Riley J、Johnstone CN、Orloff M、Assie G、Eng C、Reid L、Keith P、Yan M、Fox S、Devilee P、Godwin AK、Hogervorst FB、Couch F、Grimmond S、Flanagan JM、Khanna K、Simpson PT、Lakhani SR、Chenevix-Trench G。通过表达和拷贝数分析揭示的家族性乳腺肿瘤的亚型。乳腺癌研究治疗。2010;123:661–677. doi:10.1007/s10549-009-0653-1。-DOI程序-公共医学
    1. Bignell GR、Greenman CD、Davies H、Butler AP、Edkins S、Andrews JM、Buck G、Chen L、Beare D、Latimer C、Widaa S、Hinton J、Fahey C、Fu B、Swamy S、Dalgliesh GL、Teh BT、Deloukas P、Yang F、Campbell PJ、Futreal PA、Stratton MR。癌症基因组突变和选择的特征。自然。2010;463:893–898。doi:10.1038/nature08768。-DOI程序-项目管理咨询公司-公共医学

出版物类型

LinkOut-更多资源