×

使用数据深度测量的双聚类散点图。 (英语) Zbl 07260355号

摘要:双聚类优于传统的一维聚类,已广泛应用于生物信息学和文本挖掘等领域。然而,现有的双聚类方法只能处理标量数据矩阵。在本文中,我们介绍了一种可以处理散点图数据矩阵的双聚类过程。为了更准确地反映数据的性质,我们引入了一种基于“数据深度”的差异性统计,以测量两个双变量分布之间的差异,而不会过分简化潜在模式的性质。然后,我们将假设检验与搜索算法相结合,同时对散点图数据矩阵的行和列进行聚类。我们还提出了新的绘制指标,并构建了热图,以实现双星团的可视化。通过模拟研究和应用于微生物-宿主相互作用研究,我们证明了我们提出的双聚类方法的实用性和威力。

MSC公司:

62至XX 统计
68倍 计算机科学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] P.J.Turnbaugh、R.E.Ley、M.Hamady、C.M.FraserLiggett、R.Knight和J.I.Gordon,人类微生物组项目,《自然》449(2007),804-810。
[2] S.C.Madeira和A.L.Oliveira,《生物数据分析的双聚类算法:调查》,IEEE Trans-Comput Biol Bioinf 1(1)(2004),24-45。
[3] Y.Cheng和G.Church,表达数据的双聚类,第八届ISMB会议论文集,AAAI出版社,2000年,93-103。
[4] G.Getz、E.Levine和E.Domany,基因微阵列数据的耦合双向聚类分析,PNAS 97(22)(2000),12079-12084。
[5] A.Tanay、R.Sharan和R.Shamir,《在基因表达数据中发现具有统计意义的双聚类》,《生物信息学》18(90001)(2002年),S136-S144。
[6] Y.Kluger、R.Basri、J.T.Chang和M.Gerstein,微阵列数据的光谱双聚类:共聚类基因和条件,基因组研究13(4)(2003),703-716。
[7] J.Ihmels、S.Bergmann和N.Barkai,使用大规模基因表达数据定义转录模块,生物信息学20(13)(2004),1993-2003。
[8] I.Dhillon、S.Mallela和D.Modha,《信息论联合聚类》,载《ACM SIGKDD学报》,2003年,第89-98页。
[9] H.Shan和A.Banerjee,贝叶斯联合聚类,《IEEE ICDM学报》,2008年,530-539。
[10] I.V.Mechelen、H.-H.Bock和P.D.Boeck,《双模聚类方法:结构化概述》,《统计方法医学研究》第13期(2004年),第363-394页·Zbl 1053.62078号
[11] A.Prelic、S.Bleuler、P.Zimmermann、A.Wille、P.B–uhlmann、W.Gruissem、L.Hennig、L.Thiele和E.Zitzler,基因表达数据双聚类方法的系统比较和评估,生物信息学22(9)(2006),1122-1129。
[12] S.Busygin、O.Prokopyev和P.M.Pardalos,《数据挖掘中的双聚类》,《计算操作研究》35(9)(2008),2964-2987·Zbl 1144.68309号
[13] Z.Zhang、X.Cui、D.R.Jeske、X.Li、J.Braun和J.Borneman,使用数据深度测量对散点图进行聚类,第六届国际数据挖掘会议(DMIN'10),美国拉斯维加斯,2010年,327-333。
[14] R.Y.Liu和K.Singh,基于数据深度和多元秩检验的质量指数,美国统计协会杂志88(421)(1993),252-260·Zbl 0772.62031号
[15] Zuo Y.Zuo和X.He,关于多元深度秩和统计量的极限分布及相关检验,《统计年鉴》34(6)(2006),2879-2896·Zbl 1114.62020年
[16] S.Holm,《简单顺序拒绝多重试验程序》,《Scand J Stat 6(2)》(1979),65-70·Zbl 0402.62058号
[17] X.Li、L.LeBlanc、D.Elashoff、J.Borneman、L.Goodglick和J.Braun,《通过人类粘膜界面元蛋白组分析检测疾病相关生物邻域》,《肠胃病学》138(2010),S13。
[18] J.M.Reimund、Y.Arondel、G.Escalin、G.Finck、R.Baumann和B.Duclos,《成年克罗恩病患者的免疫激活和营养状况》,《消化性肝病》37(6)(2005)424-431。
[19] L.L.Presley、J.Ye、X.Li、J.Leblanc、Z.Zhang、P.M.Ruegger、J.Allard、D.McGovern、A.Ippoliti、B.Roth、X.Cui、D.R.Jeske、D.Elashoff、L.Goodglick、J.Braun和J.Borneman,通过对粘膜-腔界面的细菌和化蛋白组学分析检测到的炎症性肠病中的宿主-微生物关系,炎症性肠胃疾病。doi:10.1002/ibd.21793.2011。
[20] D.Zhou和T.Shi,基于经验分布之间距离的统计推断,应用于AIRS 3级数据,《NASA智能数据理解会议论文集》,2011年。
[21] P.J.Rousseeuw,《剪影:裁判员分析解释和验证的图形辅助》,《计算机应用数学杂志》20(1987),53-65·Zbl 0636.62059号
[22] P.C.Mahalanobis,《关于统计学中的广义距离》,印度国家科学院院刊12(1936),49-55·Zbl 0015.03302号
[23] J.W.Tukey,《数学与图像数据》,《1974年国际数学家大会论文集》,第2卷,温哥华,1974年,第523-531页·Zbl 0347.6202号
[24] 刘瑞英,《基于随机单形的数据深度概念》,《Ann Stat》18(1990),405-414·Zbl 0701.62063号
[25] O.Ahrenstedt,L.Knutson,B.Nilsson,K.Nilsson-Ekdahl,B.Odlind,and R.H¨allgren,克罗恩病患者小肠补体成分局部生成增强,《新英格兰医学杂志》322(19)(1990),1345-1349。
[26] U.L.Fagerberg、L.L¨o¨of、J.Lindholm、L.o.Hansson和Y.Finkel,《粪便钙保护蛋白:炎症性肠病儿童结肠炎症的定量标志物》,《儿科胃肠营养杂志》45(4)(2007),414-420。
[27] A.E.Larsson、S.Melgar、E.Rehnstr¨om、E.Micha¨elsson、L.Svensson、P.Hockings和L.E.Olsson,实验性小鼠结肠炎的磁共振成像及其与炎症活动的关系,炎症性肠病12(2006),478-485。
[28] B.Ripoll´es Piquer、H.Nazih、A.Bourreille、J.P.Segain、J.M.Huvelin、J.P.Galmiche和J.M.Bard,《炎症性肠病中脂质、载脂蛋白和脂蛋白的改变:使用Fu5AH细胞系统对血清胆固醇流出能力的影响》,新陈代谢55(2006),980-988。
[29] D.Foell、T.Kucharzik、M.Kraft、T.Vogl、C.Sorg、W.Domschke和J.Roth,中性粒细胞衍生的人类S100A12(EN-RAGE)在慢性活动性炎症性肠病期间强烈表达,《肠道》52(6)(2003),847-853。
[30] D.Foell、H.Wittkowski和J.Roth,《通过粪便分析监测疾病活动:从隐血到肠道炎症和损伤的分子标记物》,《肠道》58(6)(2009),859-868。
[31] T.S.Halstensen和P.Brandtzaeg,炎症性肠病中的局部补体激活,《免疫学研究》10(1991),485-492。
[32] T.S.Halstensen、T.E.Mollnes、P.Garred、O.Fausa和P.Brandtzaeg,克罗恩病和溃疡性结肠炎中补体的表面上皮相关激活不同,《肠道》33(7)(1992),902-908。
[33] J.Laufer、R.Oren、I.Goldberg、A.Horwitz、J.Kopolovic、Y.Chowers和J.H.Passwell,克罗恩病患者肠道标本补体C3和C4转录物的细胞定位,临床实验免疫学120(1)(2000),30-37。
[34] T.Ueki、M.Mizuno、T.Uesu、T.Kiso、J.Nasu、T.Inaba、Y.Kihara、Y.Matsuoka、H.Okada、T.Fujita和T.Tsuji,溃疡性结肠炎(UC)结肠粘膜中活化补体C3b及其降解片段iC3b/C3dg的分布,Clin-Exp Immunol 104(2)(1996),286-292。
[35] G.Conyers、L.Milks、M.Conklyn、H.Showell和E.Cramer,血清中的一种因子降低MDCK细胞的阻力并打开紧密连接,《美国生理学杂志》259(4)(1990),C577-C585。
[36] H.J.Lachmann、H.J..Goodman、J.A.Gilbertson、J.R.Gallimore、C.A.Sabin、J.D.Gillmore和P.N.Hawkins,系统性AA淀粉样变的自然史和结果,《新英格兰医学杂志》356(2007),2361-2371。
[37] A.E.Torrence、T.Brabb、J.L.Viney、H.BielefeldtOhmann、P.Treuting、A.Seamons、R.Drivdahl、W.Zeng和L.Maggio-Price,细菌性炎症性肠病小鼠模型中的血清生物标记物,炎症性肠胃病14(4)(2008),480-490。
[38] A.Tripathi、K.M.Lammers、S.Goldblum、T.SheaDonohue、S.Netzel-Arnett、M.S.Buzza、T.M.Antalis、S.N.Vogel、A.Zhao、S.Yang、M.C.Arrietta、J.B.Meddings和A.Fasano,《紧密连接的生理调节剂人类带状蛋白的鉴定》,见Prehapoglobin2,美国国家科学院学报106(39)(2009),16799-16804。
[39] M.Papp,P.L.Lakatos,匈牙利IBD研究小组K.Palatka,I.Foldi,M.Udvardy,J.Harsfalvi,I.Tornai,Z.Vitalis,T.Dinya,A.Kovacs,T.Molnar,P.Demeter,J.Papp.,L.Lakatos,and I。Altorjay,结合珠蛋白多态性与匈牙利患者的克罗恩病、疾病行为和肠外表现相关,《消化疾病科学》52(5),(2007),1279-1284。
[40] V.Sciola、S.Massironi、D.Conte、F.Caprioli、S.Ferrero、C.Ciafardini、M.Peracchi、M.T.Bardella和L.Piodi,炎症性肠病患者血浆嗜铬粒蛋白a,《炎症性肠胃病》15(6)(2009),867-871。
[41] N.Yamaguchi、H.Isomoto、H.Mukae、H.石本浩、K.Ohnita、S.Shikuwa、Y.Mizuta、M.Nakazato和
[42] C.A.de la Motte、V.C.Hascall、J.Drazba、S.K.Bandyopadhyay和S.A.Strong,单核白细胞与经聚肌苷酸治疗的结肠粘膜平滑肌细胞上的特定透明质酸结构结合:多囊藻酸:α-胰蛋白酶间抑制剂对结构和功能至关重要,《美国病理杂志》163(1)(2003),121-133。
[43] S.K.Bandyopadhyay、C.A.de la Motte、S.P.Kessler、V.C.Hascall、D.R.Hill和S.A.Strong,透明质酸介导的白细胞粘附和葡聚糖硫酸钠诱导的结肠炎在缺乏信号转导器和转录激活剂的情况下会减弱,《美国病理学杂志》173(5)(2008),1361-1368。
[44] J.Agnholt、J.Kelsen、L.Schack、C.L.Hvas、J.F.Dahlerup和E.S.Sörensen,骨桥蛋白,一种具有细胞因子样特性的蛋白质,与克罗恩病炎症相关,《Scand J Immunol 65(5)》(2007),453-460。
[45] L.Kruidenier、T.T.MacDonald、J.E.Collins、S.L.Pender和I.R.Sanderson,肌成纤维细胞基质金属蛋白酶激活肠上皮细胞的中性粒细胞趋化因子CXCL7,《肠胃病学》130(1)(2006),127-136。
[46] M.Zissis、A.Afroudakis、G.Galanopoulos、L.Palermos、X.Boura、S.Michopoulos和A.Archimanditis,B2微球蛋白:它是炎症性肠病活动的可靠标志物吗?《美国胃肠病学杂志》96(7)(2001),2177-2183。
[47] S.F.Altschul、T.L.Madden、A.A.Sch¨affer、J.Zhang、W.Miller和D.J.Lipman,《Gapped BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序》,《NuclAcidsRes25(17)》(1997),第3389-3402页。
[48] M.Baumgart、B.Dogan、M.Rishniw、G.Weitzman、B.Bosworth、R.Yantiss、R.H.Orsi、M.Wiedmann、P.McDonough、S.G.Kim、D.Berg、Y.Schukken、E.Scherl和K.W.Simpson,回肠粘膜的非培养分析显示,相对于涉及回肠的克罗恩病中梭状芽孢杆菌的耗竭,侵袭性大肠杆菌新系统发育的选择性增加,ISME J 1(5)(2007),403-418。
[49] M.Martinez-Medina、X.Aldeguer、F.Gonzalez-Huix、D.Acero和L.J.Garcia-Gil,聚合酶链反应结合梯度凝胶电泳揭示的克罗恩病患者回结肠粘膜的异常微生物群组成,炎症肠病12(12)(2006),1136-1145。
[50] H.Sokol、P.Seksik、J.P.Furet、O.Firmesse、I.NionLarmurier、L.Beaugrie、J.Cosnes、G.Corthier、P.Marteau和J.Dore´e,《大肠杆菌中的粪杆菌低计数》,肠道炎症15(8)(2009),1183-1189。
[51] A.Swidsinski、V.Loening-Baucke、M.Vaneechoutte和Y.Doerffel,《活动性克罗恩病和溃疡性结肠炎》可根据粪便菌群的生物结构进行具体诊断和监测,《炎症性肠病》14(2)(2008),147-161。
[52] B。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。