×

基于Fréchet距离的多维功能数据聚类分析。 (英语) Zbl 1517.62025号

摘要:随着时间的推移,对患者的各种记录进行测量,多维功能数据分析已成为当代医学研究的一个研究课题。我们提出了两种使用Fréchet距离对多维函数数据进行聚类的方法。第一种方法将现有的K均值类型方法从一维扩展到多维纵向数据。第二种方法在对观察到的轨迹进行分组时加强了函数变量的稀疏性,并使我们能够评估每个变量的贡献。这两种方法都利用广义Fréchet距离来测量不规则间隔和异步测量的轨迹之间的距离。我们通过使用各种仿真实例的比较研究,证明了所提方法的有效性。然后,我们将稀疏聚类方法应用于在韩国收集的多维甲状腺癌数据。它产生可解释的簇并衡量函数变量的重要性。

MSC公司:

62-08 统计问题的计算方法
62H30型 分类和区分;聚类分析(统计方面)
62兰特 功能数据分析
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 亚伯拉罕,C。;Cornillon,P-A;Matzner-Löber,E。;Molinari,N.,《使用b样条的无监督曲线聚类》,Scand。《统计杂志》,30,3,581-595(2003)·Zbl 1039.91067号 ·doi:10.1111/1467-9469.00350
[2] Aneiros,G。;Vieu,P.,无限维问题中的变量选择,Stat.Probab。莱特。,94, 12-20 (2014) ·Zbl 1320.62163号 ·doi:10.1016/j.spl.2014.06.025
[3] Boelaert,K。;Horacek,J。;持有人,R。;Watkinson,J。;Sheppard,M。;Franklyn,J.,血清促甲状腺素浓度作为细针抽吸研究甲状腺结节恶性肿瘤的新预测因子,J.Clin。内分泌。元数据。,91, 11, 4295-4301 (2006) ·文件编号:10.1210/jc.2006-0527
[4] 布尼亚,F。;MH Wegkamp;Auguste,A.,《通过多重检验进行高维回归中的一致变量选择》,J.Stat.Plann。推理,136,12,4349-4364(2006)·Zbl 1112.62062号 ·doi:10.1016/j.jspi.2005.03.011
[5] MG卡斯塔尼亚;马伊诺,F。;Cipri,C。;贝拉迪尼,V。;Theodoropoulou,A。;塞维尼尼,G。;Pacini,F.,《延迟风险分层,包括对初始治疗(手术和放射性碘消融)的反应》,《欧洲内分泌杂志》。,165, 3, 441 (2011) ·doi:10.1530/EJE-11-0466
[6] Cho,Y。;孔,S-Y;Shin,A。;Lee,J。;Lee,EK;李,YJ;Kim,J.,《预测甲状腺癌高危人群的甲状腺功能和自身免疫生物标记物:巢式病例对照研究》,BMC癌症,14,1,1-10(2014)·数字对象标识代码:10.1186/1471-2407-14-873
[7] 克拉克·P。;Franklyn,J.,我们能解释血清甲状腺球蛋白结果吗?,临床年鉴。生物化学。,49, 4, 313-322 (2012) ·doi:10.1258/acb.2011.011248
[8] JAA科拉佐斯;直径,R。;Zambom,AZ,《函数回归模型的一致变量选择》,J.Multivar。分析。,146, 63-71 (2016) ·Zbl 1334.62056号 ·doi:10.1016/j.jmva.2015.06.007
[9] da Silveira Duval,马萨诸塞州;Zanella,AB;克里斯托,美联社;Faccin,CS;Graudenz,理学硕士;Maia,AL,血清促甲状腺激素和抗甲状腺球蛋白抗体水平对分化型甲状腺癌患者淋巴结细针抽吸甲状腺球蛋白测量的影响,《欧洲甲状腺杂志》,6,6292-297(2017)·doi:10.11159/00479682
[10] 大卫·A。;布洛塔,A。;Bondanelli,M。;罗西,R。;罗蒂,E。;布拉弗曼,LE;Busutti,L。;Degli Uberti,EC,《分化型甲状腺癌患者服用重组人甲状腺刺激激素后的血清甲状腺球蛋白浓度和131i全身扫描结果》,J.Nucl。医学,4211470-1475(2001)
[11] Dowson,D.C.,Landau,B.V.:多元正态分布之间的fréchet距离。《多元分析杂志》。12(3), 450-455 (1982) ·Zbl 0501.62038号
[12] 伊迪丝,T。;斯塔里奇,GH;Mazzaferri,EL,《敏感促甲状腺素测定在门诊患者甲状腺疾病诊断中的敏感性、特异性和成本效益》,Arch。实习生。医学,149,3526-532(1989)·doi:10.1001/archente.1989.00390030032006
[13] 费拉蒂,F。;Vieu,P.,《非参数函数数据分析:理论与实践》(Springer Series in Statistics)(2006年),柏林,海德堡:Springer,柏林,海德堡·Zbl 1119.62046号
[14] 菲奥雷,E。;Vitti,P.,血清tsh与结节性甲状腺疾病中甲状腺乳头状癌的风险,临床杂志。内分泌。元数据。,97, 4, 1134-1145 (2012) ·doi:10.1210/jc.2011-2735
[15] Floriello,D。;维泰利,V.,《功能数据的稀疏聚类》,J.Multivar。分析。,154, 1-18 (2017) ·Zbl 1353.62069号 ·doi:10.1016/j.jmva.2016.10.008
[16] R·弗雷曼。;Gimenez,Y。;Marcela,S.,功能数据的特征选择,J.Multivar。分析。,146, 191-208 (2016) ·Zbl 1335.62097号 ·doi:10.1016/j.jmva.2015.09.006
[17] Genolini,C。;Falissard,B.,Kml:纵向数据的k平均值7,计算。统计人员。,25, 317-328 (2010) ·兹比尔1221.62094 ·doi:10.1007/s00180-009-0178-4
[18] Genolini,C。;Falissard,B.,Kml:纵向数据聚类软件包,计算。方法生物识别程序。,104, 3, 112-121 (2011) ·doi:10.1016/j.cmpb.2011.05.008
[19] Genolini,C。;Pingault,J-B;德里斯,T。;南卡罗来纳州科特。;特伦布雷,RE;维塔罗,F。;阿诺,C。;Falissard,B.,Kml3d:聚类关节轨迹的非参数算法,计算。方法生物识别程序。,109, 1, 104-111 (2013) ·doi:10.1016/j.cmpb.2012.08.016
[20] Genolini,C。;Ecochard,R。;Benghezal,M。;Driss,T。;Andrieu,S。;Subtil,F.,kmlshape:一种根据纵向数据(时间序列)形状对其进行聚类的有效方法,《公共科学图书馆·综合》,11,6,0150738(2016)·doi:10.1371/journal.pone.0150738
[21] Gerthiss,J。;Maity,A。;Staicu,A-M,广义函数线性模型中的变量选择,Stat,2,1,86-101(2013)·doi:10.1002/sta4.20
[22] 马里兰州Haymart;补偿器,DJ;莱弗森,通用电气;艾尔森,DF;西佩尔,RS;Jaume,JC;Chen,H.,甲状腺结节患者血清促甲状腺激素水平越高,分化型甲状腺癌和晚期肿瘤的风险越大,临床杂志。内分泌。元数据。,93, 3, 809-814 (2008) ·doi:10.1210/jc.2007-2215
[23] Z.Hong。;Lian,H.,使用带有套索惩罚的函数回归从时间进程表达数据推断遗传网络,Commun。Stat.-理论方法,40,10,1768-1779(2011)·Zbl 1216.62170号 ·doi:10.1080/03610921003650424
[24] Horváth,L。;Kokoszka,P.,《函数数据与应用的推断》(2012),纽约:Springer,纽约·Zbl 1279.62017号 ·doi:10.1007/978-1-4614-3655-3
[25] 休伯特,L。;Arabie,P.,比较分区,J.分类,2,1,193-218(1985)·Zbl 0587.62128号 ·doi:10.1007/BF01908075
[26] 休伯特,M。;罗素,PJ;Segaert,P.,多元函数异常值检测,统计方法应用。,24177-202(2015年)·Zbl 1441.62124号 ·doi:10.1007/s10260-015-0297-8
[27] 伊娃·F。;帕加诺尼,AM;皮戈利,D。;Vitelli,V.,心电图曲线形态分析的多元功能聚类,J.Roy。统计社会:序号。C(应用统计),62,3,401-418(2013)
[28] Indrasena,BSH,甲状腺球蛋白作为肿瘤标记物的使用,世界生物杂志。化学。,8, 1, 81 (2017) ·doi:10.4331/wjbc.v8.i1.81
[29] James,总经理;Wang,J。;Zhu,J.,《可解释的函数线性回归》,《Ann.Stat.》,37,2083-2108(2009)·Zbl 1171.62041号 ·doi:10.1214/08-AOS641
[30] Jeon,MJ;金,WG;公园,WR;韩,吉咪;Kim,TY;宋,DE;钟,K-W;刘,J-S;洪,SJ;Shong,YK,利用分化型甲状腺癌患者对初始治疗的反应预测复发的改良动态风险分层,《欧洲内分泌杂志》。,170, 1, 23-30 (2013) ·doi:10.1530/EJE-13-0524
[31] 钟,K-W;赢了,Y-J;洪,S。;孔,H-J;Lee,ES,《2020年韩国癌症发病率和死亡率预测》,《癌症研究与治疗》。Off.J.韩国癌症协会,52,2,351(2020)
[32] Kim,S-J;Koh,K。;博伊德,S。;Gorinevsky,D.,\(\ell_1\)趋势过滤,SIAM修订版,51,2339-360(2009)·Zbl 1171.37033号 ·doi:10.1137/070690274
[33] 科马雷克,A。;Komárková,L.,多元连续和离散纵向数据的聚类,Annals Appl。统计,7,1,177-200(2013)·Zbl 1454.62197号 ·doi:10.1214/12-AOAS580
[34] 李,ER;Park,BU,函数线性回归中的稀疏估计,J.Multivar。分析。,105, 1-18 (2012) ·Zbl 1236.62032号 ·doi:10.1016/j.jmva.2011.08.005
[35] Lim,Y。;张,YK;Oh,H-S,离散多元纵向数据功能聚类的推广,《统计方法医学研究》,29,11,3205-3217(2020)·doi:10.1177/0962280220921912
[36] Matsui,H.,通过多类逻辑回归建模进行功能数据的变量和边界选择,计算。统计数据分析。,78, 176-185 (2014) ·Zbl 1506.62127号 ·doi:10.1016/j.csda.2014.04.015
[37] 松井,H。;Konishi,S.,通过l1正则化选择函数回归模型的变量,计算。统计数据分析。,55, 12, 3304-3310 (2011) ·Zbl 1271.62140号 ·doi:10.1016/j.csda.2011.06.016
[38] 南澳州纳瓦罗·西尔维拉;米勒,AB;Rohan,TE,甲状腺癌的风险因素:一项前瞻性队列研究,国际癌症杂志,116,3,433-438(2005)·doi:10.1002/ijc.21079
[39] Nguyen,QT;Lee,EJ;黄,MG;公园,YI;Khullar,A。;Plodkowski,RA,甲状腺癌患者的诊断和治疗,美国健康药物效益,8,1,30(2015)
[40] Pellegriti,G.、Frasca,F.、Regalbuto,C.、Squatrito,S.、Vigneri,R.:甲状腺癌的全球发病率增加:流行病学和风险因素更新。癌症流行病学杂志。2013 (2013)
[41] 骨膜炎,G。;曼纳里诺,C。;鲁索,M。;特拉诺瓦共和国。;马图拉诺,I。;维格内里(Vigneri),R。;Belfiore,A.,与graves病相关的分化型甲状腺癌患者死亡率增加,临床杂志。内分泌。元数据。,981014-1021(2013年)·doi:10.1210/jc.2012-2843
[42] 彼得森,E。;De,P。;Nuttall,R.,Bmi,饮食和女性生殖因素对甲状腺癌的风险:系统综述,《公共科学图书馆·综合》,7,1,29177(2012)·doi:10.1371/journal.pone.0029177
[43] JO Ramsay,《当数据是函数时》,《心理测量学》,47,379-396(1982)·Zbl 0512.62004号 ·doi:10.1007/BF02293704
[44] JO拉姆齐;CJ Dalzell,《功能数据分析的一些工具》,J.Roy。统计社会:序号。B(Methodol.),53539-572(1991)·Zbl 0800.62314号
[45] JO拉姆齐;Silverman,BW,《应用功能数据分析:方法和案例研究》(2002),纽约:Springer,纽约·Zbl 1011.62002号 ·doi:10.1007/b98886
[46] JO拉姆齐;Silverman,BW,功能数据分析(2005),纽约:Springer,纽约·Zbl 1079.62006号 ·doi:10.1007/b98888
[47] Rand,WM,《聚类方法评估的客观标准》,美国统计协会期刊,66,336,846-850(1971)·doi:10.1080/01621459.1971.10482356
[48] Rothacker,KM;布朗,SJ;北卡罗来纳州哈德洛;Wardrop,R。;Walsh,JP,调和tsh-free t4关系的对数和非对数性质:对大量人群的诱导内分析,J.Clin。内分泌。元数据。,101, 3, 1151-1158 (2016) ·doi:10.1210/jc.2015-4011
[49] Shivaraj,G。;普拉卡什,BD;Sonal,V。;Shruthi,K。;Vinayak,H。;Avinash,M.,《甲状腺功能测试:综述》,欧洲医学会药理学评论。科学。,1341-349(2009年)
[50] 大豆,S-B;Aw,T-C,甲状腺条件的实验室测试——陷阱和临床效用,《医学年鉴》,39,1,3-14(2019)·doi:10.3343/alm.2019.39.1.3
[51] 田,TS;James,GM,分类功能数据的可解释维度缩减,计算。统计数据分析。,57282-296(2013年)·Zbl 1365.62248号 ·doi:10.1016/j.csda.2012.06.017
[52] 塔特尔,RM;塔拉,H。;沙阿·J。;勒博夫,R。;戈塞因,R。;戈恩,M。;Brokhin,M。;Omry,G。;费金,JA;Shaha,A.,《甲状腺全切除术和放射性碘残留消融术后分化型甲状腺癌复发风险的评估:使用对治疗变量的反应来修改美国甲状腺协会新分期系统预测的初始风险评估》,甲状腺,20,12,1341-1349(2010)·doi:10.1089/thy.2010.0178
[53] Vaisman,F。;塔拉,H。;格雷瓦尔(R.Grewal)。;Tuttle,RM,《分化型甲状腺癌中,与仅甲状腺球蛋白反应不完全相比,治疗后结构反应不完全与临床结果显著较差相关》,《甲状腺》,21,12,1317-1322(2011)·doi:10.1089/thy.2011.0232
[54] Vaisman,F。;莫梅索,D。;DA Bulzico;瑞士佩索阿;直径,F。;Corbo,R。;维斯曼,M。;Tuttle,RM,甲状腺癌患者对初始治疗生化不完全反应后的自发缓解,临床。内分泌。,77, 1, 132-138 (2012) ·文件编号:10.1111/j.1365-2265.2012.04342.x
[55] Van Deventer,高等教育;门杜,博士;雷马里,AT;Soldin,SJ,通过直接模拟免疫分析和串联质谱测定甲状腺刺激激素和游离甲状腺素之间的反向对数线性关系,临床。化学。,57, 1, 122-127 (2011) ·doi:10.1373/clinchem.2010.154088
[56] HM Verkooijen;菲奥雷塔,G。;帕奇,J-C;弗朗西斯基,S。;雷蒙德,L。;舒伯特,H。;Bouchardy,C.,《诊断变化是日内瓦甲状腺乳头状癌发病率增加的原因》,瑞士,癌症原因控制,14,1,13-17(2003)·doi:10.1023/A:1022593923603
[57] Vinh,N.X.,Epps,J.,Bailey,J.:聚类比较的信息理论度量:是否有必要进行机会修正?摘自:第26届国际机器学习年会论文集,第1073-1080页(2009)
[58] Vitelli,V.:功能数据联合稀疏聚类和对齐的新框架。arXiv(2019)。doi:10.48550/ARXIV.1912.00687
[59] Wang,H。;Kai,B.,《功能稀疏性:全局与局部》,Stat.Sin。,25, 1337-1354 (2015) ·Zbl 1377.62119号
[60] 维滕,DM;Tibshirani,R.,《聚类中特征选择的框架》,美国统计协会,105,490,713-726(2010)·Zbl 1392.62194号 ·doi:10.1198/jasa.2010.tm09415
[61] Yaun,K.M.,Kennedy,A.:在诊断甲状腺功能异常时,Ft4应取代tsh。《麦吉尔医学杂志》第15卷第1期(2017年)
[62] Yeh,N.-C.,Chou,C.-W.,Weng,S.-F.,Yang,C.-Y.,Yen,F.-C.,Lee,S-Y.,Wang,J.-J.,Tien,K.-J.:甲亢和甲状腺癌风险:一项基于人群的队列研究。实验临床。内分泌。糖尿病121(07),402-406(2013)
[63] 曾,P。;青石,J。;Kim,W-S,多维功能数据的同时注册和聚类,J.Compute。图表。《统计》,第28、4、943-953页(2019年)·Zbl 07499038号 ·doi:10.1080/10618600.2019.1607744
[64] Zhang,JT,《功能数据方差分析》(2013),伦敦:查普曼和霍尔出版社,伦敦·兹比尔1281.62160 ·doi:10.1201/b15005
[65] 张,L。;李,H。;季,Q-H;朱,Y-X;Wang,Z-Y;Wang,Y。;黄,C-P;沈(音)。;李,D-S;Wu,Y.,桥本氏病高发地区桥本氏甲状腺炎患者乳头状甲状腺癌的临床特征,BMC癌症,12,1,1-8(2012)·doi:10.186/1471-2407-12-610
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。