×

用数据驱动的马尔可夫链蒙特卡罗对基因表达数据进行分区。 (英语) 兹比尔1514.62846

摘要:在这篇文章中,我们介绍了一种用于分割基因表达数据的具有未知分量数的贝叶斯混合模型。利用所提出的数据驱动马尔可夫链蒙特卡罗对所有未知参数进行推断。该算法本质上是Gibbs采样中的Metropolis-Hastings算法。执行Metropolis-Hastings以使用一对拆分大型移动来更改邻域(k+1)和(k-1)中的分区数。我们的分裂策略基于数据,其中分配概率是根据先前分配的观测值的边际似然函数计算的。如果条件为\(k\),分区标签将通过Gibbs采样进行更新。该算法的两个主要优点是易于实现,且分裂大型运动的接受概率仅取决于观测数据。我们在模拟数据上检验了该算法的性能,然后分析了两个公开可用的基因表达数据集。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] C.E.Antoniak,过程Dirichlet的混合及其在贝叶斯非参数问题中的应用《Ann.Stat.2》(1984年),第1152-1174页。doi:10.1214/aos/1176342871·Zbl 0335.60034号 ·doi:10.1214操作系统/11763428871
[2] S.M.Arfin、A.D.Long、E.T.Ito、L.Tolleri、M.M Riehle、E.S.Paegle和G.W.Hatfield,大肠杆菌K12全局基因表达谱分析《生物学杂志》。化学。275(2000),第29672-29684页。doi:10.1074/jbc。M002247200号·doi:10.1074/jbc。M002247200号
[3] P.Baldi和D.A.Long,微阵列表达数据分析的贝叶斯框架:基因变化的正则化t检验和统计推断《生物信息学》17(2001),第509-519页。doi:10.1093/bioinformatics/17.6.509·doi:10.1093/bioinformatics/17.6.509
[4] S.Bhattacharya,基于Gibbs抽样的未知组分混合物贝叶斯分析,Sankhya 70-B(2008),第133-155页·兹比尔1192.62073
[5] G.Celeux、M.Hurn和C.P.Robert,混合后验分布的计算和推断困难,J.Amer。统计人员。《协会》第95卷(2000年),第957-970页。doi:10.1080/01621459.2000.10474285·Zbl 0999.62020号
[6] S.Chib和E.Greenberg,了解Metropolis-Hastings算法阿默尔。统计人员。49(1995年),第327-335页。
[7] W.F.Eddy,一种新的平面集凸壳算法,ACM变速器。数学。柔和。3(1997年),第398-403页。数字对象标识代码:10.1145/355759.355766·Zbl 0374.68036号 ·数字对象标识代码:10.1145/355759.355766
[8] M.B.Eisen、P.T.Spellman、P.O.Brown和D.Botstein,全基因组表达模式的聚类分析和显示,程序。美国国家科学院。《美国社会》95(1998),第14863-14868页。doi:10.1073/pnas.95.25.14863·doi:10.1073/pnas.95.25.14863
[9] M.D.Escobar和M.West,混合贝叶斯密度估计与推理,J.艾默。统计人员。Assoc.90(1995),第577-588页。网址:10.1080/01621459.1995.10476550·Zbl 0826.62021号
[10] S.T.Ferguson,一些非参数问题的贝叶斯分析《Ann.Stat.2》(1973年),第209-230页。doi:10.1214/aos/1176342360·Zbl 0255.62037号 ·doi:10.1214/aos/1176342360
[11] S.Frühwirth-Schnatter,经典和动态切换及混合模型的Markov Cahin Monte Carlo估计,J.Amer。统计人员。协会96(2001),第194-209页。doi:10.1198/016214501750333063·Zbl 1015.62022号
[12] S.Jain和R.M.Neal,Dirichlet过程混合模型的分裂马尔可夫链蒙特卡罗方法,J.计算。图表。《美国联邦法律大全》第13卷(2004年),第158-182页。doi:10.1198/1061860043001
[13] A.Jasra、C.C.Holmes和D.A.Stephens,马尔可夫链蒙特卡罗方法与贝叶斯混合建模中的标签切换问题,统计。科学。20(2005),第50-67页。doi:10.1214/088342305000000016·Zbl 1100.62032号 ·doi:10.1214/088342305000000016
[14] J.MacQueen,多元观测数据的分类和分析方法《第五届伯克利数理统计与概率研讨会论文集》,第1卷:统计学,281-297,加利福尼亚大学出版社,伯克利,CA,1967年·Zbl 0214.46201号
[15] J.M.Marín和M.T Rodríguez-Bernal,多假设检验和非中心混合t分布聚类在微阵列数据分析中的应用,计算。统计数据分析。56(2012),第1898-1907页。doi:10.1016/j.csda.2011.11.016·Zbl 1242.62079号 ·doi:10.1016/j.csda.2011.11.016
[16] M.Medvedovic和S.Sivaganesan,基于贝叶斯无限混合模型的基因表达谱聚类《生物信息学》18(2002),第1194-1206页。doi:10.1093/bioinformatics/18.9.1194·doi:10.1093/bioinformatics/18.9.1194
[17] R.M.尼尔,Dirichlet过程混合模型的马尔可夫链抽样方法,J.计算。图表。《美国联邦法律大全》第9卷(2000年),第249-265页。
[18] A.Nobile和A.T.Fearnside,成分数目未知的贝叶斯有限混合:分配采样器,统计计算。17(2007),第147-162页。doi:10.1007/s11222-006-9014-7·doi:10.1007/s11222-006-9014-7
[19] D.Pelleg和A.Moore,X-Means:扩展K-Means并有效估计簇数《第17届机器学习国际会议论文集》,Morhan Kaufmann,旧金山,2000年,第727-734页。
[20] Z.S.奎因,利用加权中餐厅过程聚类微阵列基因表达数据《生物信息学》22(2006),第1988-1997页。doi:10.1093/生物信息学/btl284·doi:10.1093/bioinformatics/btl284
[21] S.Richardson和P.J.Green,成分个数未知的混合物的贝叶斯分析J.R.统计。Soc.59(1997),第731-792页。数字标识代码:10.1111/1467-9868.00095·Zbl 0891.62020号 ·数字标识代码:10.1111/1467-9868.00095
[22] E.F.Saraiva和洛杉矶米兰,使用后分割-出生程序聚类基因表达数据,扫描。《美国联邦法律大全》第30卷(2012年),第399-415页。doi:10.1111/j.1467-9469.2011.00765.x·Zbl 1323.60097号 ·doi:10.1111/j.1467-9469.2011.00765.x
[23] D.J.Spiegelhalter、N.G.Best、B.P.Carlin和A.Van der Linde,模型复杂性和拟合的贝叶斯测度J.R.统计。Soc.序列号。B 64(2002),第583-640页。数字对象标识代码:10.1111/1467-9868.00353·Zbl 1067.62010年 ·数字对象标识代码:10.1111/1467-9868.00353
[24] M.Stephens,成分数目未知的混合模型的贝叶斯分析——可逆跳跃法的一种替代方法,Ann.Stat.34(2000),第187-220页。
[25] M.Stephens,混合模型中标签切换的处理J.R.统计。Soc.B 62(2000),第795-809页。doi:10.1111/1467-9868.00265·Zbl 0957.62020号 ·doi:10.1111/1467-9868.00265
[26] S.Tavazoie、J.D.Hughes、M.J.Campbell、R.J.Cho和G.M.Church,遗传网络结构的系统确定《自然基因》。22(1999),第281-285页。doi:10.1038/10343·doi:10.1038/10343
[27] C.Zhou和J.Wakefield,分割基因表达数据的贝叶斯混合模型《生物统计学》第62卷(1996年),第515-525页。doi:10.1111/j.1541-0420.2005.00492.x·Zbl 1097.62140号 ·doi:10.1111/j.1541-0420.2005.00492.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。