×

兹马思-数学第一资源

ParticleMDI:用于多个数据集聚类分析的粒子蒙特卡罗方法及其在癌症亚型识别中的应用。(英语) Zbl 07252412
摘要:我们提出了一种新的非参数贝叶斯方法,用于在观测单元具有来自多个来源的数据的情况下进行聚类分析。我们的方法使用粒子Gibbs采样器进行推理,其中在Gibbs采样器中使用条件粒子滤波器联合更新簇分配,从而改善MCMC链的混合。我们开发了几种提高算法计算性能的方法。这些方法可以在不牺牲精度的前提下,实现一个数量级的性能改进,并且可以更广泛地应用于具有单个数据集的混合模型的贝叶斯推理。我们将我们的算法应用于243例肾肾透明细胞癌患者的风险队列的发现,使用癌症基因组图谱中的样本,这些样本有基因表达、拷贝数变异、DNA甲基化、蛋白质表达和microRNA数据。我们确定了4种不同的一致性亚型,并显示它们是生存率的预后(p<0.0001)。
理学硕士:
62小时30分 分类和鉴别.聚类分析(统计方面)
第62页 统计学在生物学和医学科学中的应用;元分析
65摄氏度 蒙特卡罗方法
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Andrieu,C.;Doucet,A.;Holenstein,R.,《粒子马尔可夫链蒙特卡罗方法》,J R Stat Soc Ser B Stat Methodol,72,3,269-342(2010年)·Zbl 1411.65020
[2] Bernardo JM,Smith AF(2001)贝叶斯理论
[3] Bouchard-CôtéA.;Doucet,A.;Roth,A.,《混合模型中贝叶斯推断的粒子吉布斯分裂合并抽样》,J Mach Learn Res,18,28,1-39(2017年)·Zbl 1439.62081
[4] 肖邦,N.,静态模型的序贯粒子滤波方法,生物计量学,89,3539-552(2002)·Zbl 1036.62062
[5] 肖邦,N.;辛格,SS,关于粒子吉布斯取样,伯努利,21,3,1855-1883(2015)·Zbl 1333.60164号
[6] Cunningham N,Griffin JE,Wild DL,Lee A(2019年),《贝叶斯统计:新挑战和新世代》,2018卷,Springer
[7] Doucet,A.;Johansen,AM,《粒子滤波和平滑教程:十五年后》,Handb非线性滤波器,12656-704,3(2009)
[8] Fearnhead,P.,《具有未知数量组件的混合模型的粒子过滤器》,Stat Comput,14,1,11-21(2004)
[9] Fisher,RA,在分类学问题中使用多重测量,Ann Eugen,7,2,179-188(1936)
[10] Fritsch,A.;Ickstadt,K.,《基于后验相似性矩阵的聚类改进标准》,Bayesian Anal,4,2,367-391(2009)·Zbl 1330.62249
[11] Gabasova,E.;Reid,J.;Wernisch,L.,Clusternomics:异构数据集的整合上下文相关聚类,PLoS Comput Biol,13,10,e1005781(2017)
[12] Green,PJ;Richardson,S.,有无Dirichlet过程的非均匀性建模,Scand J Stat,28,2355-375(2001)·Zbl 0973.62031
[13] Griffin,J.,《具有独立增量先验的归一化随机测度混合物的序贯蒙特卡罗方法》,Stat Comput,27,1131-145(2014)·Zbl 06696856
[14] Hol JD,Schon-TB,Gustafsson F(2006),粒子滤波器的重采样算法。非线性统计信号处理研讨会,2006 IEEE,IEEE,79-82页
[15] Ishwaran,H.;Zarepoor,M.,《Dirichlet过程的精确和近似和表示》,Can J Stat,30,2,269-283(2002)·Zbl 1035.60048
[16] Kassambara A,Kosinski M(2018)survminer:使用“ggplot2”绘制生存曲线。R包版本(4):2
[17] Kirk,P.;Griffin,JE;Savage,RS;Ghahramani,Z.;Wild,DL,Bayesian correlated clustering to Integration multiple Dataset,生物信息学,28,24,3290-3297(2012年)
[18] Lawlor,N.;Fabbri,A.;Guan,P.;George,J.;Karuturi,RKM,multiclust:r-package for Identification Biological Related clusters in cancer transcriptome profiles,cancer Inf,15,CIN-S38000(2016年)
[19] Li,H.;Han,D.;Hou,Y.;Chen,H.;Chen,Z.,《两条交叉生存曲线的统计推断方法:方法比较》,PLoS One,10,1,e0116774(2015)
[20] Liu,JS;Chen,R.,通过序列插补进行盲反褶积,J Am Stat Assoc,90,430,567-576(1995)·Zbl 0826.62062
[21] Lock,EF;Dunson,DB,《贝叶斯共识聚类》,生物信息学,29,20,2610-2616(2013)
[22] 基于第7、第7、第74c、第四、第四、第四、第四、第四、第四、第四、第四、第四、第四、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第·Zbl 06333775
[23] McParland,D.;Phillips,CM;Brennan,L.;Roche,HM;Gormley,IC,《聚类高维混合数据以揭示亚表型:表型和基因型数据的联合分析》,Stat Med,36,28,4548-4569(2017年)
[24] Medvedovic,M.;Yeung,K.;Bumganner,R.,基于贝叶斯混合模型的复制微阵列数据聚类,生物信息学,20,8,1222-1232(2004)
[25] Monti,S.;Tamayo,P.;Mesirov,J.;Golub,T.,《共识聚类:基于重采样的基因表达微阵列数据的类发现和可视化方法》,Mach Learn,52,1-2,91-118(2003)·Zbl 1039.68103
[26] Murphy KP(2007)高斯分布的共轭贝叶斯分析。技术代表
[27] Rand,WM,聚类方法评价的客观标准,J Am Stat Assoc,66,336,846-850(1971)
[28] Rasmussen,C.;de la Cruz,B.;Ghahramani,Z.;Wild,D.,《使用Dirichlet过程混合物对基因表达簇中的不确定性进行建模和可视化》,IEEE/ACM Trans Comput Biol Bioinf,6,4,615-628(2009年)
[29] 后验分布(Method distribution of the Recurrent distribution of the Recursive distribution of the Recursive distribution of the Recursive distribution of the Recursive distribution of the Recursive distribution of the Recurrent distribution of the Recursive distribution of the Brother Stat·Zbl 1228.62034
[30] Savage RS,Ghahramani Z,Griffin JE,Kirk P,Wild DL(2013),通过结合基因组学、转录组学和表观遗传学数据识别胶质母细胞瘤中的癌症亚型。arXiv预印本arXiv:1304.3577
[31] Shen,R.;Olshen,AB;Ladanyi,M.,《使用联合潜在变量模型对多种基因组数据类型进行整合聚类,并应用于乳腺癌和肺癌亚型分析》,生物信息学,25,22,2906-2912(2009)
[32] Steinley,D.;Brusco,MJ.《聚类分析中变量的选择:八种程序的实证比较》,Psycometrika,73,1125(2008)·Zbl 1143.62327
[33] Tarone,RE;Ware,J.,《生存分布均等的无分布检验》,Biometrika,64,1156-160(1977)·Zbl 0352.62046
[34] Yuan,Y.;Van Allen,EM;Omberg,L.;Wagle,N.;Amin Mansour,A.;Sokolov,A.;Byers,LA;Xu,Y.;Hess,KR;Diao,L.,《评估癌症基因组学和蛋白质组学数据跨肿瘤类型的临床效用》,Nat Biotechnol,32,7,644(2014)
此参考列表基于出版商或数字数学图书馆提供的信息。它的数学和标识符可能包含启发式匹配的数据项。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。