×

ParticleMDI:多数据集聚类分析的粒子蒙特卡罗方法,用于癌症亚型识别。 (英语) Zbl 1474.62384号

摘要:我们提出了一种新的非参数贝叶斯方法,用于在观测单位具有来自多个来源的数据的情况下进行聚类分析。我们的方法使用粒子Gibbs采样器进行推断,其中簇分配是使用Gibbs取样器内的条件粒子过滤器联合更新的,从而改进了MCMC链的混合。我们开发了几种方法来提高算法的计算性能。这些方法可以在不牺牲准确性的情况下实现超过一个数量级的性能改进,并且可以更广泛地应用于具有单个数据集的混合模型的贝叶斯推理。我们使用癌症基因组图谱中的样本,将我们的算法应用于243名肾透明细胞癌患者的风险队列发现,其中包括基因表达、拷贝数变异、DNA甲基化、蛋白质表达和微小RNA数据。我们确定了4种不同的一致亚型,并表明它们是生存率的预后指标((p<0.0001))。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62H30型 分类和区分;聚类分析(统计方面)
65二氧化碳 蒙特卡罗方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Andrieu,C。;Doucet,A。;Holenstein,R.,《粒子马尔可夫链蒙特卡罗方法》,J R Stat Soc Ser B Stat Methodol,72,3,269-342(2010)·Zbl 1411.65020号 ·doi:10.1111/j.1467-9868.2009.00736.x
[2] Bernardo JM,Smith AF(2001)贝叶斯理论
[3] 布沙尔德·科特,A。;Doucet,A。;Roth,A.,《混合模型中贝叶斯推断的粒子吉布斯分裂大样本抽样》,J Mach Learn Res,18,28,1-39(2017)·Zbl 1439.62081号
[4] 肖邦,N.,《静态模型的序贯粒子滤波方法》,《生物统计学》,89,3,539-552(2002)·Zbl 1036.62062号 ·doi:10.1093/biomet/89.3.539
[5] 肖邦,N。;Singh,SS,《颗粒吉布斯取样》,伯努利,21,3,1855-1883(2015)·Zbl 1333.60164号 ·doi:10.3150/14-BEJ629
[6] 坎宁安N、格里芬JE、威尔德DL、李A(2019)《贝叶斯统计:新挑战和新一代》,2018年第卷,施普林格出版社
[7] Doucet,A。;Johansen,AM,《粒子滤波与平滑教程:十五年后》,Handb非线性滤波器,12656-704,3(2009)·Zbl 1513.60043号
[8] Fearnhead,P.,成分数量未知的混合模型的粒子过滤器,《统计计算》,14,1,11-21(2004)·doi:10.1023/B:STCO.0000009418.04621.cd
[9] Fisher,RA,《分类问题中多重测量的使用》,Ann Eugen,7,2,179-188(1936)·文件编号:10.1111/j.1469-1809.1936.tb02137.x
[10] 弗里奇,A。;Ickstadt,K.,基于后验相似矩阵的改进聚类标准,贝叶斯分析,4,2,367-391(2009)·Zbl 1330.62249号 ·doi:10.1214/09-BA414
[11] Gabasova,E。;Reid,J。;Wernisch,L.,《集群经济学:异构数据集的综合上下文相关聚类》,《公共科学图书馆·计算生物学》,13,10,e1005781(2017)·doi:10.1371/journal.pcbi.1005781
[12] 绿色,PJ;Richardson,S.,《利用和不利用Dirichlet过程模拟异质性》,《Scand J Stat》,28,2,355-375(2001)·Zbl 0973.62031号 ·doi:10.111/1467-9469.00242
[13] Griffin,J.,具有独立增量先验的归一化随机测量的混合物的序列蒙特卡罗方法,Stat-Comput,27,131-145(2014)·兹比尔1505.62168 ·doi:10.1007/s11222-015-9612-3
[14] Hol JD、Schon TB、Gustafsson F(2006)《粒子滤波器重采样算法》。In:非线性统计信号处理研讨会,2006 IEEE,IEEE,pp 79-82
[15] Ishwaran,H。;Zarepour,M.,Dirichlet过程的精确和近似和表示,Can J Stat,30,2,269-283(2002)·Zbl 1035.60048号 ·doi:10.2307/3315951
[16] Kassambara A、Kosinski M(2018)《survminer:使用“ggplot2”绘制生存曲线》。R包版本(4):2
[17] 柯克,P。;JE格里芬;萨维奇,RS;加赫拉马尼,Z。;Wild、DL、Bayesian相关聚类以集成多个数据集,生物信息学,28、24、3290-3297(2012)·doi:10.1093/bioinformatics/bts595
[18] 劳勒,N。;Fabbri,A。;关,P。;乔治·J。;Karuturi,RKM,multiclust:一个用于识别癌症转录组中生物相关簇的r-package,cancer Inf,15,CIN-S38000(2016)·doi:10.4137/CIN。8000英镑
[19] 李,H。;Han,D。;Hou,Y。;陈,H。;Chen,Z.,《两条交叉生存曲线的统计推断方法:方法的比较》,《公共科学图书馆·综合》,10,1,e0116774(2015)·doi:10.1371/journal.pone.0116774
[20] 刘,JS;Chen,R.,《通过顺序插补进行盲反褶积》,美国统计学会杂志,90,430,567-576(1995)·Zbl 0826.62062号 ·doi:10.1080/01621459.1995.10476549
[21] 锁定,EF;Dunson,DB,贝叶斯共识聚类,生物信息学,29,20,2610-2616(2013)·doi:10.1093/bioinformatics/btt425
[22] McParland,D。;IC Gormley;TH麦考密克;SJ克拉克;卡布杜拉,CW;马萨诸塞州科林森,《利用潜在变量模型根据南非家庭的资产状况对其进行聚类》,《Ann Appl Stat》,第8、2、747页(2014年)·Zbl 1454.62503号 ·doi:10.1214/14-AOAS726
[23] McParland,D。;菲利普斯,CM;布伦南,L。;罗氏,HM;Gormley,IC,聚类高维混合数据以揭示亚表型:表型和基因型数据的联合分析,Stat Med,36,28,4548-4569(2017)·doi:10.1002/sim.7371
[24] Medvedovic,M。;杨,K。;Bumgarner,R.,基于贝叶斯混合模型的复制微阵列数据聚类,生物信息学,20,8,1222-1232(2004)·doi:10.1093/bioinformatics/bth068
[25] 蒙蒂,S。;Tamayo,P。;梅西洛夫,J。;Golub,T.,《共识聚类:基于重采样的基因表达微阵列数据类别发现和可视化方法》,《马赫学习》,52,1-2,91-118(2003)·Zbl 1039.68103号 ·doi:10.1023/A:1023949509487
[26] Murphy KP(2007)高斯分布的共轭贝叶斯分析。技术代表
[27] Rand,WM,《聚类方法评估的客观标准》,美国统计协会杂志,66,336,846-850(1971)·doi:10.1080/01621459.1971.10482356
[28] 拉斯穆森,C。;de la Cruz,B。;加赫拉马尼,Z。;Wild,D.,使用Dirichlet过程混合物对基因表达簇中的不确定性进行建模和可视化,IEEE/ACM Trans-Comput Biol Bioinf,6,4,615-628(2009)·doi:10.1109/TCBB.2007.70269
[29] 卢梭,J。;Mengersen,K.,过量混合模型中后验分布的渐近行为,J R Stat Soc Ser B Stat Methodol,73,5,689-710(2011)·Zbl 1228.62034号 ·doi:10.1111/j.1467-9868.2011.00781.x
[30] Savage RS、Ghahramani Z、Griffin JE、Kirk P、Wild DL(2013)通过结合基因组、转录组学和表观基因组数据识别胶质母细胞瘤中的癌症亚型。arXiv预打印arXiv:1304.3577
[31] 沈,R。;奥尔申,AB;Ladanii,M.,使用联合潜在变量模型对多种基因组数据类型进行综合聚类,并应用于乳腺癌和肺癌亚型分析,生物信息学,25,22,2906-2912(2009)·doi:10.1093/bioinformatics/btp543
[32] 斯坦利,D。;Brusco,MJ,《聚类分析中变量的选择:八种程序的实证比较》,《心理测量学》,73,1,125(2008)·Zbl 1143.62327号 ·doi:10.1007/s11336-007-9019-y
[33] 塔隆,RE;Ware,J.,《关于生存分布相等性的无分布检验》,《生物统计学》,64,1,156-160(1977)·Zbl 0352.62046号 ·doi:10.1093/biomet/64.1.156
[34] 袁,Y。;范艾伦,EM;Omberg,L。;Wagle,N。;Amin-Mansour,A。;Sokolov,A。;拜尔斯,洛杉矶;Xu,Y。;肯塔基州赫斯;Diao,L.,《跨肿瘤类型评估癌症基因组和蛋白质组数据的临床效用》,《国家生物技术》,32,7,644(2014)·doi:10.1038/nbt.2940
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。