×

通过假设检验的功能数据聚类\(k\)-均值。 (英语) Zbl 1417.62181号

总结:功能数据聚类程序旨在识别形状相似的曲线子集,并估计每个此类子集的代表性平均曲线。在这项工作中,我们提出了一种新的基于并行性假设检验和平均值相等检验的函数数据聚类方法。这些测试使用来自底层功能模型的所有观察结果来计算一个度量,该度量确定每个受试者的数据属于哪个平滑的聚类中心。该度量被合并到一个改进的(k)-均值算法中,以将主题划分为簇并找到簇中心。虽然竞争算法需要对所有曲线进行固定数量的平滑,但所提出的基于测试的程序对具有不同平滑度的曲线执行无监督聚类。对大量的数值实验进行了检验,在模拟和实际数据集上的结果表明,该算法在大多数情况下都优于其他聚类方法。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abraham C,Cornillon PA,Matzner-Lber E,Molinari N(2003)使用B样条的无监督曲线聚类。扫描J统计30:581-595·Zbl 1039.91067号 ·doi:10.1111/1467-9469.00350
[2] Aguilera AM、Escabias M、Valderrama MJ、Aguilera-Morillo MC(2013)《化学计量学数据的功能分析》。打开J Stat 3:334-343·Zbl 1367.62183号 ·doi:10.4236/ojs.2013.35039
[3] Akritas M,Papadatos N(2004)异方差单因素方差分析和无方差检验。美国统计协会杂志99:368-382·Zbl 1117.62481号 ·doi:10.1198/016214500000412
[4] Alter O,Brown P,Botstein D(2000)全基因组表达处理和建模的奇异值分解。国家科学院院刊97:10101-10106·doi:10.1073/pnas.97.18.10101
[5] Arthur D,Vassilvitskii \[S(2007)k\]k-Means++:细心播种的优势。摘自:第十八届ACM-SIAM离散算法年会论文集。工业和应用数学学会,美国宾夕法尼亚州费城,第1027-1035页·Zbl 1302.68273号
[6] Boulle M(2012)通过分段常数非参数密度估计进行函数数据聚类。图案识别45:4389-4401·Zbl 1248.68398号 ·doi:10.1016/j.patcog.2012.05.016
[7] Bongiorno EG,Goia A(2016)基于替代密度的希尔伯特数据分类方法。计算统计数据分析99:204-222·Zbl 1468.62030号 ·doi:10.1016/j.csda.2016.01.019
[8] Boulle M,Guigoure的R,Rossi F(2014)函数数据的非参数层次聚类。Adv Knowl Discov Manag Stud计算机智能527:15-35
[9] Bouveyron C,Brunet-Saumard C(2014),基于模型的高维数据聚类:综述。计算统计数据分析71:52-78·Zbl 1471.62032号 ·doi:10.1016/j.csda.2012.12.008
[10] Bouveyron C、Come E、Jacques J(2014)《自行车共享系统分析的区分功能混合模型》。巴黎笛卡尔大学预印HAL编号01024186·Zbl 1397.62511号
[11] Bouveyron C,Jacques J(2011),基于模型的特定群功能子空间时间序列聚类。高级数据分析分类5:281-300·Zbl 1274.62416号 ·doi:10.1007/s11634-011-0095-6
[12] Bowman FD,Guo Y,Derado G(2007)功能神经成像数据的统计方法。神经影像临床N Am 17:441-458 viii·doi:10.1016/j.nic.2007.09.002
[13] Chiou JM,Li PL(2007)功能聚类和识别纵向数据的子结构。J R统计Soc B 69:679-699·Zbl 07555371号 ·文件编号:10.1111/j.1467-9868.2007.00605.x
[14] Ciollaro M,Genovese CR,Wang D(2016)使用伪密度对功能数据进行非参数聚类。电子杂志统计10:2922-2972·Zbl 1357.62162号 ·doi:10.1214/16-EJS1198
[15] Febrero-Bande M,de la Fuente MO(2012)功能数据分析中的统计计算:R包fda.usc。J Stat Softw杂志51:1-28。https://doi.org/10.18637/jss.v051.i04 ·doi:10.18637/jss.v051.i04
[16] Ferraty F,Vieu P(2006),非参数函数数据分析。统计学中的斯普林格系列。纽约州施普林格·Zbl 1271.62085号
[17] Ferreira L,Hitchcock DB(2009)《聚类功能数据的分层方法比较》。公共统计模拟计算38:1925-1949·Zbl 1182.62135号 ·doi:10.1080/03610910903168603
[18] Floriello D(2011)功能稀疏\[KK\]-表示聚类。论文,米兰理工大学
[19] Fraiman R、Ghattas B、Svarc M(2013)《使用无监督二叉树的可解释聚类》。高级数据分析类7:125-145·兹比尔1267.62075 ·doi:10.1007/s11634-013-0129-3
[20] Garcia ML、Garcia-Rodenas R、Gomez AG【(2015)k】k-Means函数数据算法。神经计算151:231-245·doi:10.1016/j.neucom.2014.09.048
[21] Giacocci M,Lambert Lacroix S,Marot G,Picard F(2013)基于小波的高维混合效应函数模型聚类。生物统计学69:31-40·Zbl 1274.62774号 ·doi:10.1111/j.1541-0420.2012.01828.x
[22] Hartigan JA(1975)聚类算法。纽约威利·Zbl 0372.62040号
[23] Hartigan JA,Wong MA(1979)A\[k\]k-means聚类算法。J R Stat Soc系列C 28:100-108·Zbl 0447.62062号
[24] Hasenstab K、Schefler A、Telesca D、Sugar CA、Jeste S、DiStefano C、Senturk D(2017)《脑电图数据的多维功能主成分分析》。生物计量学73:999-1009·Zbl 1522.62142号 ·doi:10.1111/biom.12635
[25] Horvth L,Kokoszka P(2012)功能数据与应用的推断。统计学中的斯普林格系列。纽约州施普林格·Zbl 1279.62017号 ·doi:10.1007/978-1-4614-3655-3
[26] Hsing T,Eubank R(2015)《函数数据分析的理论基础》,线性算子简介。概率统计中的威利级数·Zbl 1338.62009号
[27] Ivanescu AE(2017)二维功能数据的功能对功能回归。收录:《统计通信——模拟和计算》,第1-14页。https://doi.org/10.1080/03610918.2017.1353619
[28] Jacques J,Preda C(2013)使用函数随机变量密度近似的曲线聚类方法。神经计算112:164-171·doi:10.1016/j.neucom.2012.11.042
[29] Jacques J,Preda C(2014),基于模型的多元函数数据聚类。计算统计数据分析71:92-106·Zbl 1471.62096号 ·doi:10.1016/j.csda.2012.12.004
[30] Jacques J,Preda C(2014b)功能数据聚类:一项调查。高级数据分析类8:231-255·Zbl 1414.62018年 ·doi:10.1007/s11634-013-0158-y
[31] James GM,Sugar CA(2003),稀疏采样功能数据的聚类。美国统计协会杂志98:397-408·Zbl 1041.62052号 ·doi:10.1198/016214503000189
[32] Kalivas JH(1997)两组近红外光谱数据。化学计量学智能实验室系统37:255-259·doi:10.1016/S0169-7439(97)00038-5
[33] Kokoszka P、Reimherr M(2017)《功能数据分析导论》。Chapman和Hall/CRC统计科学文本,伦敦·Zbl 1274.62600号 ·doi:10.1201/9781315117416
[34] Ieva F,Paganoni AM,Pigoli D,Vitelli V(2013)心电图曲线形态分析的多变量功能聚类。J R Stat Soc系列C 62:401-418·doi:10.1111/j.1467-9876.2012.01062.x文件
[35] Ma P,Castillo-Davis C,Zhong W,Liu JS(2006)时间进程基因表达数据的数据驱动聚类方法。核酸研究34:1261-1269·doi:10.1093/nar/gkl013
[36] Ramsay JO,Silverman BW(1997),功能数据分析。统计学中的斯普林格系列。纽约州施普林格·Zbl 0882.6202号 ·doi:10.1007/978-14757-7107-7
[37] Reif U(1997)加权Sobolev空间中基数B样条的正交性。SIAM数学分析杂志28:1258-1263·Zbl 0884.41009号 ·doi:10.1137/S0036141096296851
[38] Reimherr M,Nicolae D(2014)遗传关联研究的功能数据分析方法。安应用统计8:406-429·Zbl 1454.62385号 ·doi:10.1214/13-AOAS692
[39] Rodriguez A、Dunson DB、Gelfand AE(2009)通过密度估计进行贝叶斯非参数函数数据分析。生物特征96:149-162·Zbl 1163.62027号 ·doi:10.1093/biomet/asn054
[40] Salvo F,Ruggieri M,Plaia A(2015)多元多维环境数据的功能主成分分析。环境经济统计22:739-757·doi:10.1007/s10651-015-0317-8
[41] Saeys W,Ketelaere B,Darius P(2008)功能数据分析在化学计量学中的潜在应用。化学杂志22:335-344·doi:10.1002/cem.1129
[42] Serban N,Jiang H(2012)多层次功能聚类分析。生物统计学68:805-814·兹比尔1272.62085 ·doi:10.1111/j.1541-0420.2011.01714.x
[43] Silverman BW(1986)统计和数据分析密度估计。查普曼和霍尔,伦敦·兹比尔0617.62042 ·doi:10.1007/978-1-4899-3324-9
[44] Tarpey T,Kinateder KJ(2003),聚类功能数据。J类20:93-114·Zbl 1112.62327号 ·doi:10.1007/s00357-003-0007-3
[45] Tokushige S,Yadohisa H,Inada K(2007)多元函数数据的Crisp和fuzzy K-means聚类算法。计算统计22:1-16·Zbl 1196.62089号 ·doi:10.1007/s00180-006-0013-0
[46] Ternynck C、Alaya MAB、Chebana F、Dabo Niang S、Ouarda TBMJ(2016)《使用功能数据分析进行水流过程线分类》。《水文气象杂志》。https://doi.org/10.1175/JHM-D-14-0200.1(中文) ·doi:10.1175/JHM-D-14-020.1
[47] Wang J,Chiou J,Muller H(2016)功能数据分析。年度修订统计申请3:257-295·doi:10.1146/annurev-statistics-041715-033624
[48] Wang G,Lin N,Zhang B(2014)函数\[k\]k-均值逆回归。计算统计数据分析70:172-182·Zbl 1471.62207号 ·doi:10.1016/j.csda.2013.09.004
[49] Wang X,Nan B,Zhu J,Koeppe R(2014b)通过Haar小波对脑图像数据进行正则化3D函数回归。安应用统计8:1045-1064·Zbl 1454.62415号 ·doi:10.1214/14-AOAS736
[50] Wang H,Neill J,Miller F(2008),功能数据的非参数聚类。统计接口1:47-62·Zbl 1230.62087号 ·doi:10.4310/SII.2008.v1.n1.a5
[51] Ward JHJ(1963)优化目标函数的分层分组。美国统计协会杂志58:236-244·doi:10.1080/01621459.1963.10500845
[52] Yamamoto M(2012)低维子空间中函数数据的聚类。高级数据分析类6:219-247·Zbl 1254.62077号 ·doi:10.1007/s11634-012-0113-3
[53] Yamamoto M,Terada Y(2014)函数阶乘-k-means分析。计算统计数据分析79:133-148·Zbl 1506.62200号 ·doi:10.1016/j.csda.2014.05.010
[54] Younga DL,Fields S(2015)功能数据在解释遗传变异影响中的作用。分子生物学细胞26:3904-3908·doi:10.1091/mbc。E15-03-0153号
[55] Zambom AZ,Akritas MG(2014),非参数缺失测试和一致变量选择。统计Sin 24:1838-1858·Zbl 1480.62080号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。