×

面板数据分析:基于模型的时间序列聚类调查。 (英语) Zbl 1274.62591号

摘要:聚类是一种广泛使用的统计工具,用于确定给定数据集中的子集。常用的聚类方法大多基于距离度量,不容易扩展到面板或纵向数据集中的聚类时间序列。本文回顾了最近提出的基于有限混合模型的面板或纵向数据基于模型聚类方法。考虑了几种适用于连续和分类时间序列观测的方法。详细描述了通过马尔可夫链蒙特卡罗方法进行的贝叶斯估计,并回顾了选择簇数的各种标准。青少年使用大麻小组的申请就是一个例证。

MSC公司:

62M10个 统计学中的时间序列、自相关、回归等(GARCH)
62H30型 分类和区分;聚类分析(统计方面)
62-02 与统计有关的研究展览(专著、调查文章)
68吨10 模式识别、语音识别
91C20个 社会和行为科学中的集群
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agresti A(1990)分类数据分析。奇切斯特·威利·Zbl 0716.62001号
[2] Akaike H(1974)统计模型识别的新视角。IEEE Trans Autom控制19:716–723·Zbl 0314.62039号 ·doi:10.1109/TAC.1974.1100705
[3] Aßmann C,Boysen-Hogrefe J(2011)二元面板概率模型基于模型聚类的贝叶斯方法。计算机统计数据分析55:261–279·Zbl 1247.62152号 ·doi:10.1016/j.csda.2010.04.016
[4] 巴什蒂尔克·N、巴普·R、范·迪克·D(2011)《经济增长中的结构差异:内生集群方法》。Appl Econ XX,即将推出
[5] Banfield JD,Raftery AE(1993),基于模型的高斯和非高斯聚类。生物统计学49:803–821·Zbl 0794.62034号 ·doi:10.2307/2532201
[6] Bauwens L,Rambouts JVK(2007),许多GARCH模型的贝叶斯聚类。经济评论26:365–386·Zbl 1112.62016年 ·doi:10.1080/07474930701220576
[7] Biernacki C,Celeux G,Govaert G(2010)潜在类模型综合可能性的精确和蒙特卡罗计算。J Stat Plan推断140:2991–3002·兹比尔1203.62027 ·doi:10.1016/j.jspi.2010.03.042
[8] Biernacki C,Govaert G(1997)使用分类似然来选择簇数。计算科学统计29:451–457
[9] Binder DA(1978)贝叶斯聚类分析。生物特征65:31–38·Zbl 0376.62007号 ·doi:10.1093/biomet/65.1.31
[10] Bouveyron C,Jacques J(2011),基于模型的特定群功能子空间时间序列聚类。高级数据分析分类。本期,doi:10.1007/s11634-011-0095-6·Zbl 1274.62416号
[11] Cadez I、Heckerman D、Meek C、Smyth P、White S(2003)基于模型的网站导航模式聚类和可视化。数据最小知识发现7(4):399–424·doi:10.1023/A:1024992613384
[12] Canova F(2004)《融合俱乐部人均收入测试:预测密度法》。国际经济评论45:49-77·文件编号:10.1111/j.1468-2354.2004.00117.x
[13] Celeux G、Forbes F、Robert CP、Titterington DM(2006)缺失数据模型的偏差信息标准。贝叶斯分析1:651–674·Zbl 1331.62329号 ·doi:10.1214/06-BA122
[14] Diebolt J,Robert CP(1994)通过贝叶斯抽样估计有限混合分布。皇家统计学会期刊B 56:363–375·Zbl 0796.62028号
[15] Diggle PJ,Heagerty P,Liang K-Y,Zeger SL(2002)《纵向数据分析》,第2版。牛津大学出版社
[16] Everitt BS(1979)聚类分析中未解决的问题。生物计量学35:169–181·兹比尔0406.62042 ·doi:10.2307/2529943
[17] Everitt BS、Landau S、Leese M(2001)《聚类分析》,第4版。爱德华·阿诺德,伦敦·Zbl 1205.62076号
[18] Fougère D,Kamionka T(2003)连续时间移动层模型的贝叶斯推断及其在劳动力市场转型数据中的应用。应用经济学杂志18:697–723·doi:10.1002/jae.727
[19] Fraley C、Raftery AE(2002),基于模型的聚类、判别分析和密度估计。美国统计协会J Am Stat Assoc 97:611–631·Zbl 1073.62545号 ·doi:10.1198/016214502760047131
[20] Frühwirth-Schnatter S(2004)使用桥式抽样技术估计混合和马尔可夫切换模型的边际可能性。《经济学杂志》7:143–167·Zbl 1053.62087号 ·doi:10.1111/j.1368-423X.2004.00125.x
[21] Frühwirth-Schnatter S(2006)有限混合和马尔可夫切换模型。纽约州施普林格·Zbl 1108.6202号
[22] Frühwirth-Schnatter S(2011)处理模型不确定性下的标签转换。In:Mengersen K,Robert CP,Titterington D(eds)混合物估计与应用,第10章。奇切斯特·威利,第193-218页
[23] Frühwirth-Schnatter S,Frü的hwirth R(2010)二元和多项式logit模型的数据增强和MCMC。收录:Kneib T,Tutz G(编辑)统计建模和回归结构-Festschrift In Honour of Ludwig Fahrmeir。海德堡物理杂志,第111-132页
[24] Frühwirth-Schnatter S,Kaufmann S(2006)货币政策的变化如何影响银行贷款?奥地利银行数据分析。应用经济学杂志21:275–305·doi:10.1002/jae.830
[25] Frühwirth-Schnatter S,Kaufmann S(2008)基于模型的多时间序列聚类。J公共汽车经济统计26:78–89·doi:10.1198/07350010700000006
[26] Frühwirth Schnatter S,Pamminger C,Weber A,Winter Ebmer R(2011)劳动力市场进入和收益动态:使用专家混合马尔可夫链聚类的贝叶斯推断。J Appl Econom 26,即将出版
[27] Frühwirth-Schnatter S,Pyne S(2010)关于单变量和多元斜正态分布和斜t分布有限混合的贝叶斯推断。生物统计学11:317–336·doi:10.1093/biostatistics/kxp062
[28] Frühwirth-Schnatter S,Tüchler R,Otter T(2004)异质性模型的贝叶斯分析。J公共汽车经济统计22:2–15·doi:10.1198/073500103288619331
[29] Frydman H(2005)以不同速度移动的马尔可夫链的混合估计。美国统计协会期刊100:1046–1053·Zbl 1117.62337号 ·doi:10.1198/0162145000000024
[30] Gamerman D,Lopes HF(2006)马尔可夫链蒙特卡罗。贝叶斯推断的随机模拟,第二版。查普曼&霍尔/CRC,博卡拉顿·Zbl 1137.62011年
[31] García-Escudero L,Gordaliza a,Matrán C,Mayo-Iscar a(2010)稳健聚类方法综述。高级数据分析分类4:89–109·Zbl 1284.62375号 ·doi:10.1007/s11634-010-0064-5
[32] Greene W,Hensher D(2003)离散选择分析的潜在类模型:与混合逻辑的对比。运输研究B部分37:681–698·doi:10.1016/S0191-2615(02)00046-2
[33] Grün B,Leisch F(2008)具有可变和固定效应的多项式logit模型有限混合的可识别性。J类25:225–247·兹比尔1276.62021 ·doi:10.1007/s00357-008-9022-8
[34] Heard NA、Holmes CC、Stephens DA(2006)《疟蚊免疫反应相关基因调控的定量研究:贝叶斯层次聚类曲线的应用》。美国统计协会J Am Stat Assoc 101:18–29·Zbl 1118.62368号 ·doi:10.1198/01621450050000187
[35] 萧C(2003)面板数据分析,第2版。剑桥大学出版社·Zbl 0608.62145号
[36] Juárez MA,Steel MFJ(2010),基于偏态t分布的非高斯面板数据的基于模型的聚类。J Bus Econ统计28:52–66·Zbl 1198.62097号 ·doi:10.1198/jbes.2009.07145
[37] Kass RE,Raftery AE(1995),贝叶斯因子。美国统计协会J Am Stat Assoc 90:773–795·Zbl 0846.62028号 ·doi:10.1080/01621459.1995.10476572
[38] Keribin C(2000)混合模型阶数的一致估计。桑基拉A62:49–66·Zbl 1081.62516号
[39] Kiefer NM,Wolfowitz J(1956)存在无穷多个附带参数时最大似然估计的一致性。Ann数学统计27:887–906·Zbl 0073.14701号 ·doi:10.1214/aoms/1177728066
[40] Lang JB、McDonald JW、Smith PWF(1999)《多元分类反应的关联边缘模型:最大似然法》。美国统计协会J Am Stat Assoc 94:1161–1171·Zbl 1072.62590号 ·doi:10.1080/01621459.1999.10473871
[41] Lenk PJ,DeSarbo WS(2000)具有随机效应的广义线性模型有限混合的贝叶斯推断。《心理测量学》65:93–119·Zbl 1291.62225号 ·doi:10.1007/BF02294188文件
[42] 廖太伟(2005)时间序列数据的聚类——一项调查。图案设计38:1857–1874·Zbl 1077.68803号 ·doi:10.1016/j.patcog.2005.01.025
[43] Luan Y,Li H(2003)使用带有B样条的混合效应模型对时间进程基因表达数据进行聚类。生物信息学19:474–482·doi:10.1093/bioinformatics/btg014
[44] McLachlan GJ,Peel D(2000)有限混合模型。概率统计中的威利级数。纽约威利
[45] McNicholas PD,Murphy TB(2010),基于模型的纵向数据聚类。加拿大J Stat 38:153–168·Zbl 1190.62120号
[46] Nobile A(2004)关于有限混合物中成分数量的后验分布。安统计32:2044–2073·兹比尔1056.62037 ·doi:10.1214/009053604000000788
[47] Owen AL、Videras J、Davis L(2009)所有国家都遵循相同的增长过程吗?。《经济增长杂志》14:265–286·数字对象标识代码:10.1007/s10887-009-9046-x
[48] Pamminger C,Frühwirth-Schnatter S(2010)分类时间序列的基于模型的聚类。贝叶斯分析5:345–368·Zbl 1330.62256号 ·doi:10.1214/10-BA606
[49] Peng F,Jacobs RA,Tanner MA(1996)专家混合模型和专家分层混合模型中的贝叶斯推理及其在语音识别中的应用。美国统计协会J Am Stat Assoc 91:953–960·Zbl 0882.62022号 ·doi:10.1080/01621459.1996.10476965
[50] Ramoni M,Sebastiani P,Cohen P(2002)《动态贝叶斯聚类》。马赫数学习47:91–121·兹比尔1012.68154 ·doi:10.1023/A:1013635829250
[51] Ramoni M,Sebastiani P,Kohane P(2002)基因表达动力学的聚类分析。国家科学院院刊99:9121–9126·Zbl 1023.62110号 ·doi:10.1073/pnas.132656399
[52] Rossi PE、Allenby GM、McCulloch R(2005)《贝叶斯统计与营销》。奇切斯特·威利·Zbl 1094.62037号
[53] Rousseau J,Mengersen K(2010)过量混合模型中后验分布的渐近行为。技术报告,ENSEA-CREST·Zbl 1228.62034号
[54] Saul LK,Jordan MI(1999)混合记忆马尔可夫模型:将复杂的随机过程分解为简单过程的混合物。马赫数学习37:75–87·Zbl 0948.68096号 ·doi:10.1023/A:1007649326333
[55] Schwarz G(1978)估算模型的维数。安统计6:461–464·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[56] Scott AJ,Symons M(1971)基于似然比标准的聚类方法。生物计量学27:387–397·doi:10.2307/2529003
[57] Sperrin M,Jaki T,Wit E(2010)贝叶斯混合模型中标签切换问题的概率重标策略。统计计算20:357–366·doi:10.1007/s11222-009-9129-8
[58] Spiegelhalter DJ、Best NG、Carlin BP、van der Linde A(2002)模型复杂性和拟合的贝叶斯度量。皇家统计学会期刊B辑64:583–639·Zbl 1067.62010年 ·数字对象标识代码:10.1111/1467-9868.00353
[59] van Vermunt JK(2010)使用混合模型的纵向研究。收录:Montfort K,Oud JHL,Satorra A(eds)《潜在变量的纵向研究》,第4章。海德堡施普林格,第119-152页
[60] Wooldridge JM(2005)动态非线性面板数据模型中初始条件问题的简单解决方案,具有未观察到的异质性。应用经济学杂志20:39–54·doi:10.1002/jae.770
[61] Zhu H-T,Zhang H(2004)混合回归模型中的假设检验。皇家统计学会期刊B 66:3–16·Zbl 1062.62033号 ·doi:10.1046/j.1369-7412.003.05379.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。