×

通过形状不变模型对时间相关数据进行共聚类。 (英语) Zbl 07473953号

摘要:多变量时间相关数据在许多应用领域中越来越广泛,其中随着时间的推移,可以观察到一组个体的多种特征。为了对这些数据建模,我们需要考虑时间瞬间和变量之间的关系,同时还要考虑主题的异质性。我们提出了一种新的共同聚类方法,用于同时对个体和变量进行分组,旨在处理函数数据和纵向数据。我们的方法借鉴了曲线配准通过嵌入形状不变模型在中潜在块体模型,通过适当修改SEM-Gibbs算法进行估计。由此产生的过程允许对集群概念进行多个用户定义的规范,这些规范可以根据实际情况进行选择,并通过将数据矩阵划分为同质块来提供复杂时间相关数据的简约摘要。随着时间演化的明确建模,这些方面允许对集群进行简单的解释,低维设置也可能从中受益。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 安德鲁奇,L。;Viroli,C.,多元异质纵向数据分析的协方差模式混合模型,应用统计年鉴,9,2,777-800(2015)·Zbl 1397.62214号
[2] Ben Slimen,YS;阿利奥,S。;Jacques,J.,功能数据的基于模型的联合聚类,神经计算,291,97-108(2018)
[3] 比尔纳基,C。;Celeux,G。;Govaert,G.,《用综合完全似然评估聚类的混合模型》,IEEE模式分析和机器智能汇刊,22,7,719-725(2000)
[4] Bouveyron,C。;Jacques,J.,《特定群体功能子空间中基于模型的时间序列聚类》,《数据分析和分类进展》,5,4,281-300(2011)·Zbl 1274.62416号
[5] Bouveyron,C。;科特迪瓦,E。;Jacques,J.,用于共享单车系统比较分析的判别函数混合模型,《应用统计学年鉴》,9,4,1726-1760(2015)·Zbl 1397.62511号
[6] Bouveyron,C。;Bozzi,L。;雅克·J。;Jollois,FX,《电力消费曲线联合聚类的功能潜在块模型》,《皇家统计学会杂志:C辑(应用统计)》,67,4,897-915(2018)
[7] Bouveyron,C.等人。;Celeux,G。;墨菲,TB;Raftery,AE,《数据科学的基于模型的聚类和分类:在R中的应用》(2019),剑桥:剑桥大学出版社,剑桥·Zbl 1436.62006年
[8] Bouveyron,C.、Jacques,J.、Schmutz,A.、Simoes,F.和Bottini,S.(2020年)。用于分析法国南部空气污染的多元函数数据的协聚类。HAL预印本HAL-02862177。
[9] Brauner,J.M.、Mindermann,S.、Sharma,M.、Johnston,D.、Salvatier,J.、Gavenčiak,T.、Stephenson,A.B.、Leech,G.、Altman,G.、Mikulik,V.等人(2021)。推断政府干预新冠肺炎的有效性。《科学》,371(6531)。
[10] Corneli,M.和Erosheva,E.(2020年)。纵向数据混合中聚类和精确有限样本模型选择的贝叶斯方法。HAL预印本HAL-02310069v2。
[11] 科内利,M。;Bouveyron,C。;Latouche,P.,通过潜在连续随机变量对有序数据进行共聚类,在随机条目中不缺失,计算与图形统计杂志,29,4,771-785(2020)·Zbl 07500356号
[12] De Boor,C.,《样条曲线实用指南》(1978),纽约:Springer-Verlag,纽约·兹比尔0406.41003
[13] De la Cruz-Mesía,R。;FA金塔纳;Marshall,G.,基于模型的纵向数据聚类,计算统计与数据分析,52,3,1441-1457(2008)·Zbl 1452.62454号
[14] 特拉特,M。;拉维耶,M。;Poursat,M.,关于混合效应模型中BIC的注释,《电子统计杂志》,8,1,456-475(2014)·Zbl 1348.62186号
[15] 阿联酋登普斯特;新墨西哥州莱尔德;Rubin,DB,通过em算法从不完整数据中获取最大似然,《皇家统计学会杂志:B辑(方法学)》,39,1,1-22(1977)·Zbl 0364.62022号
[16] Diggle,PJ;Heagerty,P。;KY梁;赫格蒂,PJ;Zeger,S.,《纵向数据分析》(2002),牛津:牛津大学出版社,牛津·Zbl 1031.62002号
[17] 埃洛舍娃,E。;Matsueda,RL;Telesca,D.,《彻底失败:犯罪学、发展心理学及其他领域二十年的生命历程数据分析》,《统计及其应用年度回顾》,1301-332(2014)
[18] 弗拉克斯曼,S。;米什拉,S。;甘地,A。;安文,HJT;梅兰,TA;库普兰,H。;惠塔克,C。;朱,H。;贝拉,T。;Eaton,JW,《欧洲非药物干预对新型冠状病毒肺炎影响的评估》,《自然》,584,7820,257-261(2020)
[19] 弗雷利,C。;Raftery,AE,基于模型的聚类、判别分析和密度估计,美国统计协会杂志,97,458,611-631(2002)·Zbl 1073.62545号
[20] Frühwirth-Schnatter,S.,面板数据分析:基于模型的时间序列聚类调查,数据分析和分类进展,5,4,251-280(2011)·Zbl 1274.62591号
[21] 戈瓦特,G。;Nadif,M.,用块混合模型聚类,模式识别,36,2,463-473(2003)·Zbl 1452.62444号
[22] 戈瓦特,G。;模型,MNadif,不同方法的贝努利混合比较的块聚类,计算统计与数据分析,52,6,3233-3245(2008)·Zbl 1452.62444号
[23] 戈瓦特,G。;Nadif,M.,列联表的潜在块模型,统计学中的通信——理论和方法,39,3,416-425(2010)·Zbl 1187.62117号
[24] Govaert,G.和Nadif,M.(2013年)。协同集群:模型、算法和应用,纽约威利·Zbl 1416.62309号
[25] Hale,T.、Angrist,N.、Cameron-Blake,E.、Hallas,L.、Kira,B.、Majumdar,S.、Petherick,T.,Phillips,A.、Tatlow,H.和Webster,S.(2020年)。牛津COVID-19政府反应追踪,布拉瓦尼克政府学院。https://www.bsg.ox.ac.uk/research/researc-projects/coronavirus-government-response-tracker http://www.bsg.ox-ac.uk/research/research-项目/冠状病毒-政府-https://www.bsg.ox.ac.uk/research/researc-projects/coronavirus-government-response-tracker response-tacker。
[26] 哈林,JR;Liu,J.,《模型错误指定和数据稀疏下非线性混合效应模型估计方法的比较:模拟研究》,《现代应用统计方法杂志》,15,1,27(2016)
[27] 休伯特,L。;Arabie,P.,比较分区,分类杂志,2,1,193-218(1985)·Zbl 0587.62128号
[28] 雅克·J。;Biernacki,C.,基于模型的有序数据联合聚类,计算统计与数据分析,123,101-115(2018)·Zbl 1469.62086号
[29] 雅克,J。;Preda,C.,《功能数据聚类:一项调查》,《数据分析和分类进展》,8,3,231-255(2014)·Zbl 1414.62018年
[30] James,总经理;Sugar,CA,稀疏抽样功能数据的聚类,美国统计协会杂志,98,462,397-408(2003)·Zbl 1041.62052号
[31] 克里宾,C。;Brault,V.公司。;Celeux,G。;Govaert,G.,分类数据上潜在块模型的估计和选择,统计与计算,25,6,1201-1216(2015)·Zbl 1331.62149号
[32] Keribin,C.、Celeux,G.和Robert,V.(2017年)。潜在块模型:高维数据的有用模型。HAL预印HAL-01658589。
[33] Kneip,A。;Gasser,T.,自建模非线性回归的收敛性和一致性结果,《统计年鉴》,16,1,82-112(1988)·Zbl 0725.62060号
[34] WH劳顿;西尔维斯特,EA;Maggio,MS,自建模非线性回归,技术计量学,14,3,513-532(1972)·Zbl 0239.62045号
[35] Liao,TW,时间序列数据的聚类——一项调查,模式识别,38,11,1857-1874(2005)·Zbl 1077.68803号
[36] 林德斯特罗姆(Lindstrom),MJ,《随机位移和尺度参数以及自由结样条曲线形状函数的自建模》,《医学统计学》,第14、18、2009-2021页(1995年)
[37] 林德斯特罗姆,MJ;Bates,D.,重复测量数据的非线性混合效应模型,生物统计学,46,3,673-687(1990)
[38] Lomet,A.(2012年)。分类方法选择继续进行。Compiègne博士论文。
[39] 麦克尼古拉斯,PD;Murphy,TB,基于模型的纵向数据聚类,加拿大统计杂志,38,1,153-168(2010)·Zbl 1190.62120号
[40] Nagin,D.,《基于群体的发展建模》(2009),剑桥:哈佛大学出版社,剑桥
[41] 皮涅罗,J。;Bates,D.,非线性混合效应模型中对数似然函数的近似,计算与图形统计学杂志,4,1,12-35(1995)
[42] 皮涅罗,J。;Bates,D.,《S和S-PLUS中的混合效应模型》(2006),柏林:Springer科学与商业媒体,柏林·Zbl 0953.62065号
[43] Pinheiro,J.、Bates,D.、DebRoy,S.、Sarkar,D.和R核心团队。(2019). nlme:线性和非线性混合效应模型。https://CRAN.R-project.org/package=nlme。R软件包版本3.1-139。
[44] R核心团队。(2019). R: 用于统计计算的语言和环境。R统计计算基金会,奥地利维也纳。https://www.R-project.org/。
[45] JO拉姆齐;Li,X.,曲线登记,《皇家统计学会杂志:B辑(方法学)》,60,2,351-363(1998)·Zbl 0909.62033号
[46] 拉姆齐,乔;Silverman,BW,功能数据分析(2005),纽约:Springer,纽约·Zbl 1079.62006号
[47] Rice,JA,《功能和纵向数据分析:平滑的观点》,《中国统计》,第14期,第3期,第631-647页(2004年)·Zbl 1073.62033号
[48] 罗伯特·V。;Vasseur,Y。;Brault,V.,《比较高维分区与联合聚类调整后的兰德指数》,《分类杂志》,38,158-186(2021)·Zbl 07370657号
[49] 塞洛西,M。;雅克·J。;Biernacki,C.,混合类型数据的基于模型的联合聚类,计算统计与数据分析,144106866(2020)·Zbl 1504.62084号
[50] Telesca,D。;Inoue,LYT,贝叶斯层次曲线注册,美国统计协会杂志,103,481,328-339(2008)·Zbl 1471.62560号
[51] Telesca,D。;埃洛舍娃,E。;Kreager,DA;Matsueda,RL,《将犯罪职业建模为偏离单一人口年龄犯罪曲线:大麻使用案例》,《美国统计协会杂志》,1075001427-1440(2012)·Zbl 1258.62127号
[52] van Dijk,B.、van Rosmalen,J.和Paap,R.(2009)。双模式聚类的贝叶斯方法。在技术报告中,经济计量研究所报告了埃拉斯谟大学鹿特丹分校。
[53] Viroli,C.,《用于分类三向数据的矩阵正态分布有限混合》,《统计与计算》,21,4,511-522(2011)·Zbl 1221.62083号
[54] Viroli,C.,基于模型的三向数据结构聚类,贝叶斯分析,6,4,573-602(2011)·兹比尔1330.62262
[55] Wyse,J。;Friel,N.,《具有坍塌潜在块模型的块聚类》,《统计与计算》,22,2,415-428(2012)·Zbl 1322.62046号
[56] Wyse,J。;弗里尔,N。;Latouche,P.,使用潜在块模型和精确ICL推断二分网络中的结构,网络科学,5,1,45-69(2017)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。