×

基于半参数贝叶斯推理的双聚类。 (英语) Zbl 07809995号

摘要:受基因表达数据分析中常见问题的启发,我们提出了一种半参数贝叶斯模型来检测双聚类,即在一组条件下共享相似模式的个体子集。我们的方法基于著名的格子模型拉兹泽尼A.欧文[《Stat.Sin.12》,第1期,第61-86页(2002年;Zbl 1004.62084号)]. 通过假设一个截断的破胶先验,我们还发现了作为推断的一部分,数据中存在的双聚类数。仿真研究表明,该模型能够正确检测双聚类,与一些竞争方法相比性能良好。通过应用于基因表达数据(连续反应)和组蛋白修饰数据(计数反应)的分析,证明了该先验知识的灵活性。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Albert,J.H.和Chib,S.(1993年)。“二进制和多光子响应数据的贝叶斯分析。”美国统计协会杂志, 88(422): 669-679. ·Zbl 0774.62031号 ·doi:10.1080/01621459.1993.10476321
[2] Ashburner,M.、Ball,C.A.、Blake,J.A.、Botstein,D.、Butler,H.、Cherry,J.M.、Davis,A.P.、Dolinski,K.、Dwight,S.S.、Eppig,J.T.、Harris,M.A.、Hill,D.P.、Issel-Tarver,L.、Kasarskis,A.、Lewis,S.、Matese,J.C.、Richardson,J.E.、Ringwald,M.,Rubin,G.和Sherlock,G.(2000)。“基因本体:生物学统一的工具。”自然遗传学, 25: 25-29.
[3] Barski,A.、Cuddapah,S.、Cui,K.、Roh,T.、Schones,D.、Wang,Z.、Wei,G.、Chepelev,I.和Zhao,K.(2007年)。“人类基因组组蛋白甲基化的高分辨率分析。”单元格, 129(4): 823-837.
[4] Besag,J.(1974年)。“空间相互作用和晶格系统的统计分析。”英国皇家统计学会杂志。B.系列方法, 36: 192-236. 由D.R.Cox、A.G.Hawkes、P.Clifford、P.Whittle、K.Ord、R.Mead、J.M.Hammersley和M.S.Bartlett讨论,并由作者回复·Zbl 0327.60067号
[5] Bouveyron,C.、Celeux,G.、Murphy,T.B.和Raftery,A.E.(2019)。基于模型的数据科学聚类和分类剑桥统计与概率数学系列。剑桥大学出版社,剑桥。应用程序在R中·Zbl 1436.62006年 ·doi:10.1017/9781108644181
[6] Caldas,J.和Kaski,S.(2008年)。“贝叶斯双聚类与格子模型。”2008年IEEE信号处理机器学习研讨会, 291-296.
[7] Chekouo,T.和Murua,A.(2015a)。“惩罚双聚类模型和相关算法。”应用统计学杂志, 42(6): 1255-1277. ·Zbl 1514.62474号 ·doi:10.1080/02664763.2014.999647
[8] Chekouo,T.和Murua,A.(2015b)。“缺陷的双簇格子模型。”网址:http://www.dms.umontreal.ca/murua/software/speniptedplaid.zip。软件。
[9] Chekouo,T.、Murua,A.和Raffelsberger,W.(2015)。“吉布斯格子双簇模型。”应用统计学年鉴, 9(3): 1643-1670. ·Zbl 1454.62316号 ·doi:10.1214/15-AOAS854
[10] Cheng,Y.和Church,G.(2000)。“表达式数据的双聚类。”In第八届分子生物学智能系统国际会议论文集,第1卷,93-103。
[11] Cho,R.J.,Campbell,M.J.、Winzeler,E.A.,L.,S.、Conway,A.、Wodicka,L.、Wolfsberg,T.G.、Gabrielian,A.E.、Landsman,D.、Lockhart,D.J.和Davis,R.W.(1998)。“有丝分裂细胞周期的全基因组转录分析。”分子细胞, 2(1): 65-73.
[12] Delyfer,M.N.、Raffelsberger,W.、Mercier,D.、Korobelnik,J.F.、Gaudric,A.、Charteris,D.G.、Tadayoni,R.、Metge,F.、Caputo,G.、Barale,P.O.、Ripp,R.,Muller,J.D.、Poch,O.、Sahel,J.A.和Léveillard,T.(2011)。“人类视网膜脱离的转录组分析揭示了炎症反应和光感受器死亡。”公共科学图书馆一号,6(12):e28791。
[13] Edgar,R.、Domrachev,M.和Lash,A.E.(2002年)。“基因表达综合:NCBI基因表达和杂交阵列数据存储库。”核酸研究, 30(1): 207-210. http://www.ncbi.nlm.nih.gov/geo。
[14] Eisen,M.、Spellman,P.、Brown,P.和Botstein,D.(1998年)。“全基因组表达模式的聚类分析和显示。”遗传学, 95: 14863-14868.
[15] Fernández,D.、Arnold,R.、Pledger,S.、Liu,I.和Costilla,R.(2019年)。“离散型多元数据的有限混合双聚类。”高级数据分析。分类。, 13(1): 117-143. ·Zbl 1474.62083号 ·doi:10.1007/s11634-018-0324-3
[16] Getz,G.、Levine,E.和Domany,E.(2000年)。“基因微阵列数据的耦合双向聚类分析。”美国国家科学院院刊, 97(22): 12079-12084.
[17] Govaert,G.和Nadif,M.(2014年)。协同聚类:模型、算法和应用.威利-伊斯特。
[18] Gu,J.和Liu,J.S.(2008)。“基因表达数据的贝叶斯双聚类。”BMC基因组学,9(补充I):S4(1):1-10。
[19] Hartigan,J.A.(1972年)。“数据矩阵的直接聚类。”美国统计协会杂志, 67(337): 123-129.
[20] Ishwaran,H.和James,L.F.(2001)。“破胶前期吉布斯采样方法”美国统计协会杂志, 96(453): 161-173. ·Zbl 1014.62006年 ·doi:10.1198/016214501750332758
[21] Kaiser,S.和Leisch,F.(2008年)。“R.双团簇分析工具箱”inCOMPSTAT 2008年计算统计论文集,201-208,只读光盘。Physica Verlag/Springer,海德堡。
[22] Kasim,A.、Mayr,A.、Mitterecker,A.、Lin,D.、Clevert,D.-A.、Göhlmann,H.W.H.、Bijnens,L.、He-usel,M.、Hochreiter,S.、Van Sanden,S.,Khamiakova,T.、Bodenhofer,U.、Talloen,W.和Shkedy,Z.(2010)。“FABIA:双集群收购的因子分析。”生物信息学, 26(12): 1520-1527.
[23] Kasim,A.、Shkedy,Z.、Kaiser,S.、Hochreiter,S.和Talloen,W.(2017年)。大维和高维数据的实用双聚类方法CRC出版社,佛罗里达州博卡拉顿。
[24] Khintchine,A.(1938年)。“关于单峰分布。”Izvestiya Nauchnolssledoverl’s Koyo Instituta Matematiki i Mekka研究所, 2: 1.
[25] Lazzeroni,L.和Owen,A.(2002年)。“基因表达数据的Plaid模型。”中国统计局, 12(1): 61-86. 生物信息学专刊·Zbl 1004.62084号
[26] Li,Y.、Bandyopadhyay,D.、Xie,F.和Xu,Y.(2020)。“BAREB:牙周数据的贝叶斯排斥双聚类模型。”医学统计学, 39(16): 2139-2151. ·数字对象标识代码:10.1002/sim.8536
[27] Lin,D.(1998)。“相似性的信息理论定义”第十五届机器学习国际会议论文集,Morgan Kaufmann,加利福尼亚州旧金山,296-304。
[28] Mewes,H.W.、Heumann,K.、Kaps,A.、Mayer,K.,Pfeiffer,F.、Stocker,S.和Frishman,D.(1999)。“MIPS:基因组和蛋白质序列数据库。”核酸研究, 27(1): 44-48.
[29] Murua,A.和Quintana,F.A.(2021年)。“补充材料:通过半参数贝叶斯推断进行双聚类。”贝叶斯分析. ·doi:10.1214/21-BA1284SUPP文件
[30] Ni,Y.,Müller,P.和Ji,Y..(2020年)。“电子健康记录表型的贝叶斯双特征分配。”美国统计协会杂志, 115(532): 1620-1634. ·Zbl 1452.62835号 ·doi:10.1080/01621459.2019.1686985
[31] Paez,M.S.和Walker,S.G.(2018年)。“用一大类单峰多元分布建模。”应用统计学杂志, 45(10): 1823-1845. ·兹比尔1516.62526 ·doi:10.1080/02664763.2017.1396296
[32] Pontes,B.、Giráldez,R.和Aguilar-Ruiz,J.S.(2015)。“表达数据的双聚类:综述。”生物医学信息学杂志, 57: 163-180.
[33] Ren,Y.、Sivaganesan,S.、Altaye,M.、Amin,R.S.和Szczesniak,R.D.(2020年)。“使用非参数层次贝叶斯模型对医疗监测数据进行双聚类。”统计,9(1):e279·Zbl 07851166号 ·doi:10.1002/sta4.279
[34] Resnik,P.(1995)。“使用信息内容评估分类法中的语义相似性。”第十四届国际人工智能联合会议论文集, 448-453.
[35] Roberts,G.O.和Rosenthal,J.S.(2009年)。“自适应MCMC示例。”计算与图形统计杂志, 18(2): 349-367. ·doi:10.1198/jcgs.2009.06134
[36] Santamaria,R.、Quintales,L.和Theron,R.(2007)。“微阵列数据中的双聚类验证和比较方法。”柏林-海德堡施普林格.
[37] Sethuraman,J.(1994)。“Dirichlet Priors的建设性定义。”中国统计局, 4(2): 639-650. ·Zbl 0823.62007号
[38] Sivaganesan,S.、Laud,P.W.和Müller,P.(2011)。“使用零富集Polya urn方案进行贝叶斯亚组分析。”医学统计学, 30(4): 312-323. ·doi:10.1002/sim.4108
[39] Stanberry,L.、Murua,A.和Cordes,D.(2008年)。“使用铁磁波茨自旋模型进行功能连通性映射。”人脑映射, 422-440.
[40] Tanay,A.、Sharan,R.和Shamir,R.(2002年)。“在基因表达数据中发现具有统计意义的双聚类。”生物信息学,18(补充1):S136-S144。
[41] Tang,C.和Zhang,A.(2005)。“相互关联的双向聚类及其在基因表达数据中的应用。”国际人工智能工具杂志, 14(04): 577-597.
[42] Tavazoie,S.、Hughes,J.D.、Campbell,M.J.、Cho,R.J.和Church,G.M.(1999)。“遗传网络结构的系统决定。”自然遗传学, 22: 281-285.
[43] Turner,H.、Bailey,T.和Krzanowski,W.(2005a)。“通过系统性能测试证明改进了微阵列数据的双聚类。”计算统计与数据分析, 48(2): 235-254. ·Zbl 1429.62267号 ·doi:10.1016/j.csda.2004.02.003
[44] Turner,H.、Bailey,T.和Krzanowski,W.(2005年b)。“通过系统性能测试证明改进了微阵列数据的双聚类。”计算统计与数据分析, 48: 235-254. ·Zbl 1429.62267号
[45] Wang,Z.、Zang,C.、Rosenfeld,J.、Schones,D.、Barski,A.、Cuddapah,S.、Cui,K.、Roh,T.、Peng,W.、Zhang,M.和Zhao,K.(2008)。“人类基因组中组蛋白乙酰化和甲基化的组合模式。”自然遗传学, 40(7): 897-903.
[46] Xu,Y.、Lee,J.、Yuan,Y.,Mitra,R.、Liang,S.、Müller,P.和Ji,Y.(2013)。“下一代测序计数数据的非参数贝叶斯双聚类。”贝叶斯分析, 8(4): 759-780. ·Zbl 1329.62180号 ·doi:10.1214/13-BA822
[47] Yeung,K.Y.、Fraley,C.、Murua,A.、Raftery,A.E.和Ruzzo,W.L.(2001)。“基因表达数据的基于模型的聚类和数据转换。”生物信息学, 17(10): 977-987.
[48] 张杰(2010)。“应用程序双聚类的贝叶斯模型。”英国皇家统计学会杂志。C系列应用统计, 59(4): 635-656. ·文件编号:10.1111/j.1467-9876.2010.00716.x
[49] 周,F.,何,K.,李,Q.,查普金,R.S.,倪,Y.(2021)。“通过多项式矩阵分解对微生物宏基因组测序数据进行贝叶斯双聚类。”生物统计学.Kxab002。统一资源定位地址https://doi.org/10.1093/biostatistics/kxab002
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。