×

肿瘤异质性的贝叶斯特征分配模型。 (英语) Zbl 1397.62457号

摘要:我们开发了一个特征分配模型,用于使用下一代测序数据推断遗传肿瘤变异。具体来说,我们基于映射到人类参考基因组的短阅读记录单核苷酸变体(SNV),并通过定义为SNV在相同同源基因组上的支架的潜在单倍型来表征肿瘤异质性。对于来自单个肿瘤的多个样本,假设每个样本由这些单倍型的某些样本特定比例组成,然后我们拟合每个样本的SNV的观察到的变异等位基因片段,并估计单倍型比例。样本中单倍型比例的变化是肿瘤异质性的证据,因为这意味着细胞亚群的组成不同。从贝叶斯的角度出发,我们对所有相关未知量建立了一个先验概率模型,尤其包括一个关于表征潜在单倍型的二进制指标的先验概率模式。这些先前的模型称为特征分配模型。具体来说,我们定义了印度自助餐流程的简化版本,这是最传统的功能分配模型之一。该模型允许SNV在定义潜在单倍型时重叠聚集,这反映了肿瘤样本中亚克隆扩展的进化过程。

MSC公司:

第62页第10页 统计学在生物学和医学中的应用;元分析
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Broderick,T.、Pitman,J.和Jordan,M.I.(2013年)。特征分配、概率函数和画框。贝叶斯分析。8 801-836. ·兹比尔1329.62278 ·doi:10.1214/13-BA823
[2] Broderick,T.、Jordan,M.I.和Pitman,J.(2013)。组合随机过程的聚类和特征。统计师。科学。28 289-312. ·兹比尔1331.62124 ·doi:10.1214/13-STS434
[3] Casella,G.和Moreno,E.(2006年)。客观贝叶斯变量选择。J.Amer。统计师。协会101 157-167·Zbl 1118.62313号 ·doi:10.1198/0162145050000000646
[4] Church,D.M.,Schneider,V.A.,Graves,T.,Auger,K.,Cunningham,F.,Bouk,N.,Chen,H.-C.,Agarwala,R.,McLaren,W.M.,Ritchie,G.R.S.等人(2011年)。现代化的参考基因组组装。《公共科学图书馆·生物》。9 e1001091。
[5] Engle,L.J.、Simpson,C.L.和Landers,J.E.(2006)。使用高通量SNP技术研究癌症。癌基因25 1594-1601。
[6] Erichsen,H.和Chanock,S.(2004)。癌症研究和治疗中的SNP。英国癌症杂志90 747-751。
[7] Gerlinger,M.、Rowan,A.J.、Horswell,S.、Larkin,J.、Endesforder,D.、Gronroos,E.、Martinez,P.、Matthews,N.、Stewart,A.、Tarpey,P.,Varela,I.、Phillimore,B.、Begum,S.,McDonald,N.Q、Butler,A.、Jones,D.、Raine,K.、Latimer,C.、Santos,C.R.、Nohadani,M.,Eklund,A.C.、Spencer-Dene,B.、Clark,G.、Pickering,L.、Stamp,G.,Gore,M。,Z.Szallasi、J.Downward、P.A.Futreal和C.Swanton(2012)。多区域测序显示肿瘤内部异质性和分支进化。北英格兰。《医学杂志》,366 883-892。
[8] Green,P.J.(1995)。可逆跳跃马尔可夫链蒙特卡罗计算和贝叶斯模型确定。生物特征82 711-732·Zbl 0861.62023号 ·doi:10.1093/biomet/82.4.711
[9] Griffiths,T.和Ghahramani,Z.(2005年)。无限潜在特征模型和印度自助餐流程。《2005-001年技术报告》,盖茨比计算神经科学部,2005年。
[10] Ji,Y.,Xu,Y.、Zhang,Q.、Tsui,K.-W.、Yuan,Y.和Norris,C.Jr.、Liang,S.和Liang and H.(2011)。BM-map:下一代测序数据的多读贝叶斯映射。生物统计学67 1215-1224·Zbl 1266.92049号 ·文件编号:10.1111/j.1541-0420.2011.01605.x
[11] Kanehisa,M.、Goto,S.、Furumichi,M.和Tanabe,M.(2010年)。KEGG用于表示和分析涉及疾病和药物的分子网络。核酸研究38 D355-D360。
[12] Landau,D.A.、Carter,S.L.、Stojanov,P.、McKenna,A.、Stevenson,K.、Lawrence,M.S.、Sougnez,C.、Stewart,C.、Sivachenko,A.、Wang,L.、Wan,Y.、Zhang,W.、Shukla,S.A.、Vartanov,A.、Fernandes,S.M.、Saksena,G.、Cibulskis,K.,Tesar,B.、Gabriel,S.、Hacohen,N.、Meyerson,M.、Lander,E.S.、Neuberg,D.、Brown,J.R.、Getz,G.和Wu,C。J.(2013)。慢性淋巴细胞白血病亚克隆突变的演变和影响。电话:152 714-726·Zbl 0563.92005号 ·数字对象标识代码:10.1137/014089
[13] Larson,N.B.和Fridley,B.L.(2013)。PurBayes:估计下一代测序数据中的肿瘤细胞数和亚克隆数。生物信息学29 1888-1889。
[14] Lee,J.、Müller,P.、Gulukota,K.和Ji,Y.(2015)。补充“肿瘤异质性的贝叶斯特征分配模型”·Zbl 1397.62457号
[15] Li,H.和Durbin,R.(2009)。利用Burrows-Wheeler变换实现快速、准确的短读对齐。生物信息学25 1754-1760·Zbl 1022.68519号
[16] Li,H.、Handsaker,B.、Wysoker,A.、Fennell,T.、Ruan,J.、Homer,N.、Marth,G.、Abecasis,G.,Durbin,R.和1000基因组项目数据处理小组(2009年)。序列对齐/映射格式和SAMtools。生物信息学25 2078-2079·Zbl 1022.68519号
[17] Marusyk,A.和Polyak,K.(2010年)。肿瘤异质性:原因和后果。生物化学。生物物理学。行动。1085 1.
[18] McKenna,A.、Hanna,M.、Banks,E.、Sivachenko,A.、Cibulskis,K.、Kernytsky,A.、Garimella,K.,Altshuler,D.、Gabriel,S.、Daly,M.和DePristo,M.A.(2010年)。基因组分析工具包:用于分析下一代DNA测序数据的MapReduce框架。基因组研究20 1297-1303。
[19] Navin,N.、Krasnitz,A.、Rodgers,L.、Cook,K.、Meth,J.、Kendall,J.,Riggs,M.、Eberling,Y.、Troge,J.和Grubor,V.等人(2010年)。从基因组异质性推断肿瘤进展。基因组研究20 68-80。
[20] Ng,P.C.和Kirkness,E.F.(2010年)。全基因组测序。遗传变异215-226。纽约州施普林格。
[21] O'Hagan,A.(1995年)。模型比较的分数贝叶斯因子。J.R.统计社会服务。B.统计方法。57 99-138. ·Zbl 0813.62026号
[22] Roth,A.、Khattra,J.、Yap,D.、Wan,A.、Laks,E.、Bielle,J.,Ha,G.、Aparicio,S.、Bouchard-Cóte,A.和Shah,S.P.(2014)。Pyclone:癌症克隆群体结构的统计推断。自然方法11 396-398。
[23] Russnes,H.G.、Navin,N.、Hicks,J.和Borresen-Dale,A.-L.(2011)。通过下一代测序深入了解乳腺癌的异质性。临床杂志。投资。121 3810-3818。
[24] Su,X.,Zhang,L.,Zhang-J.,Meric-Bernstam,F.和Weinstein,J.N.(2012)。纯度评估:使用下一代测序数据评估人类肿瘤样本的纯度。生物信息学28 2265-2266。
[25] Teh,Y.W.,Görür,D.和Ghahramani,Z.(2007年)。印度自助餐过程的断棒结构。《国际人工智能与统计会议论文集》,第11卷。新泽西州人工智能与统计学会。
[26] Wersto,R.P.、Liblit,R.L.、Deitch,D.和Koss,L.G.(1991年)。人类结肠癌多个肿瘤样本中DNA测量的变异性。癌症67 106-115。
[27] Wheeler,D.A.、Srinivasan,M.、Egholm,M.,Shen,Y,Chen,L.、McGuire,A.、He,W.、Chen,Y.-J.、Makhijani,V.、Roth,G.T.等人(2008年)。通过大规模平行DNA测序获得的个人完整基因组。自然452 872-876。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。