×

协变量非高斯函数数据回归的聚类分析。 (英语。法语摘要) Zbl 1492.62113号

总结:使用功能数据进行聚类分析通常会对结果进行正态性假设,并且通常在没有协变量或监督的情况下进行。然而,在实践中经常会遇到非正常的功能数据,并且无监督学习(没有将协变量直接与簇联系起来)通常会使生成的簇不太容易解释。为了解决这些问题,我们提出了一种新的半参数转换函数回归模型,它使我们能够在存在协变量的情况下对非正态函数数据进行聚类。我们的模型包含了几个独特的功能。首先,它省略了对功能响应的正态性假设,这为建模增加了更多的灵活性。其次,我们的模型允许集群在功能响应和协变量之间具有明显的关系,从而使形成的集群更容易解释。第三,与各种竞争方法不同,我们允许集群的数量是不确定的,并且是数据驱动的。我们提出了一种新的方法,将惩罚似然和估计方程结合起来,同时估计聚类数、回归参数和变换函数;我们还建立了大样本性质,如一致性和渐近正态性。仿真结果证实了我们提出的方法的实用性。我们使用我们提出的方法分析了中国住房市场数据,并获得了一些有趣的发现。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62兰特 功能数据分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abraham,C.,Cornillon,P.‐A。,Matzner‐Löber,E.和Molinari,N.(2003)。使用B样条的无监督曲线聚类。斯堪的纳维亚统计杂志,30581-595·Zbl 1039.91067号
[2] Andruff,H.、Carraro,N.、Thompson,A.、Gaudreau,P.和Louvet,B.(2009年)。潜在班级增长模型:教程。心理学定量方法教程,5,11-24。
[3] Bauer,D.J.和Curran,P.J.(2003)。增长混合模型的分布假设:潜在轨迹类过度提取的含义。心理学方法,8,338-363。
[4] Bouveyron,C.和Jacques,J.(2011年)。基于模型的群组特定功能子空间中时间序列聚类。数据分析和分类进展,5281-300·Zbl 1274.62416号
[5] Burdekin,R.C.和Tao,R.(2014)。中国房地产市场表现:股市联系、流动性压力和通货膨胀效应。中国经济,47,5-26。
[6] Chen,K.&Tong,X.(2010年)。具有删失数据的变系数变换模型。《生物特征》,97969-976·Zbl 1204.62128号
[7] Chiou,J.‐M.和李,P.‐L。(2007). 功能聚类和识别纵向数据的子结构。英国皇家统计学会杂志:B辑(统计方法),69,679-699·Zbl 07555371号
[8] Cuesta‐Albertos,J.A.&Fraiman,R.(2007)。功能数据的公正修正k均值。计算统计与数据分析,51,4864-4877·Zbl 1162.62377号
[9] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977年)。通过EM算法从不完整数据中获得最大似然。英国皇家统计学会期刊:B系列(统计方法论),39,1-22·Zbl 0364.62022号
[10] DiPasquale,D.&Wheaton,W.C.(1992年)。房地产资产和空间市场:概念框架。房地产经济学,20181-198。
[11] Fan,J.&Gijbels,I.局部多项式建模及其应用。《统计学和应用概率专著》,第66卷。CRC出版社:佛罗里达州博卡拉顿;1996. ·Zbl 0873.62037号
[12] Ferraty,F.&Vieu,P.(2006年)。非参数函数数据分析:理论与实践。柏林施普林格科技与商业媒体·兹比尔1119.62046
[13] Giacofci,M.、Lambert‐Lacroix,S.、Marot,G.和Picard,F.(2013)。基于小波的高维混合效应函数模型聚类。生物计量学,69,31-40·Zbl 1274.62774号
[14] Guo,S.&Li,C.(2011)。中国流动性过剩、房价飙升和政策挑战。《中国与世界经济》,第19期,第76-91页。
[15] Horowitz,J.L.(1996)。因变量变换未知的回归模型的半参数估计。《计量经济学》,64,103-137·Zbl 0861.62029号
[16] Horowitz,J.L.(2001)。具有未知链接函数的广义可加模型的非参数估计。《计量经济学》,69,499-513·Zbl 0999.62032号
[17] Horváth,L.&Kokoszka,P.(2012)。功能数据推断与应用,第200卷。柏林施普林格科技与商业媒体·兹比尔1279.62017
[18] Huang,T.、Peng,H.和Zhang,K.(2017)。高斯混合模型的模型选择。《中国统计》,第27期,第147-169页·Zbl 1468.62307号
[19] Ieva,F.、Paganoni,A.M.、Pigoli,D.和Vitelli,V.(2013)。心电图曲线形态分析的多元功能聚类。英国皇家统计学会杂志:C辑(应用统计学),62401-418。
[20] Jacques,J.和Preda,C.(2013)。Funclust:一种使用函数随机变量密度近似的曲线聚类方法。神经计算,112164-171。
[21] Jacques,J.和Preda,C.(2014a)。功能数据聚类:一项调查。数据分析和分类进展,8231-255·Zbl 1414.62018年
[22] Jacques,J.和Preda,C.(2014年b)。多元函数数据的基于模型的聚类。计算统计与数据分析,71,92-106·Zbl 1471.62096号
[23] James,G.M.和Sugar,C.A.(2003年)。稀疏采样功能数据的聚类。《美国统计协会杂志》,98,397-408·Zbl 1041.62052号
[24] Jia,S.、Wang,Y.和Fan,G.‐Z。(2018). 购房限额与房价:来自中国的证据。《房地产金融与经济杂志》,56386-409。
[25] Jones,B.L.、Nagin,D.S.和Roeder,K.(2001)。基于混合模型的SAS程序,用于估计发展轨迹。社会学方法与研究,29374-393。
[26] Leisch,F.(2004)。FlexMix:R.统计软件杂志,11,1-18,有限混合模型和潜在类回归的一般框架。
[27] Li,Y.&Hsing,T.(2010年a)。为功能数据和高维数据确定有效降维空间的维度。《统计年鉴》,38,3028-3062·Zbl 1200.62115号
[28] Li,Y.&Hsing,T.(2010年b)。函数/纵向数据中非参数回归和主成分分析的一致收敛速度。《统计年鉴》,38,3321-3351·兹比尔1204.62067
[29] Li,Y.,Wang,N.和Carroll,R.J.(2010)。具有半参数单指数相互作用的广义函数线性模型。美国统计协会杂志,105,621-633·Zbl 1392.62095号
[30] Lin,H.、Zhou,X.‐H.和Li,G.(2012)。具有未知链路和基线函数的直接半参数接收机工作特性曲线回归。《中国统计》,第22期,1427-1456页·Zbl 1253.62028号
[31] Lu,M.、Zhang,Y.和Huang,J.(2009年)。使用单调B‐样条的面板计数数据的半参数估计方法。美国统计协会杂志,1041060-1070·Zbl 1388.62084号
[32] McLachlan,G.和Peel,D.(2004)。有限混合模型。John Wiley&Sons,纽约。
[33] Muthén,B.O.潜在变量混合建模。结构方程建模的新发展和新技术。心理学出版社:纽约;2001
[34] Nagin,D.S.(1999)。分析发展轨迹:一种半参数、基于群体的方法。心理学方法,4139-157。
[35] 纳金博士(2005年)。基于集团的开发建模。哈佛大学出版社,马萨诸塞州剑桥。
[36] Olsen,M.K.和Schafer,J.L.(2001)。半连续纵向数据的两部分随机效应模型。美国统计协会杂志,96,730-745·Zbl 1017.62064号
[37] Peng,J.&Müller,H.‐G。(2008). 稀疏观测随机过程的基于距离的聚类,应用于在线拍卖。应用统计年鉴,21056-1077·Zbl 1149.62053号
[38] Ray,S.&Mallick,B.(2006年)。贝叶斯小波方法的函数聚类。英国皇家统计学会杂志:B辑(统计方法),68,305-332·Zbl 1100.62058号
[39] Ren,Y.,Xiong,C.和Yuan,Y.(2012)。中国的房价泡沫。《中国经济评论》,23786-800。
[40] Samé,A.、Chamroukhi,F.、Govaert,G.和Aknin,P.(2011年)。基于模型的时间序列聚类和分割,以及制度的变化。数据分析和分类进展,5301-321·Zbl 1274.62427号
[41] Schumaker,L.(2007)。样条函数:基本理论。剑桥大学出版社,剑桥·兹比尔1123.41008
[42] Schwarz,G.(1978年)。估算模型的维度。《统计年鉴》,第6461-464页·Zbl 0379.62005年
[43] Shi,J.和Wang,B.(2008)。使用混合高斯过程函数回归模型进行曲线预测和聚类。统计与计算,18,267-283。
[44] Stone,C.J.(1980)。非参数估计的最优收敛速度。统计年鉴,81348-1360·Zbl 0451.62033号
[45] Tarpey,T.&Kinateder,K.K.(2003)。聚类功能数据。分类杂志,2093-114·兹比尔1112.62327
[46] Titterington,D.M.、Smith,A.F.和Makov,U.E.(1985)。有限混合分布的统计分析。纽约威利·Zbl 0646.62013.中
[47] Tokushige,S.、Yadohisa,H.和Inada,K.(2007年)。多元函数数据的Crisp和fuzzy k‐means聚类算法。计算统计学,22,1-16·Zbl 1196.62089号
[48] Wang,H.,Li,R.和Tsai,C.-L。(2007). 调整平滑剪裁绝对偏差方法的参数选择器。《生物统计学》,94553-568·Zbl 1135.62058号
[49] Winsberg,S.&Ramsay,J.O.(1981年)。使用集成B样条分析成对偏好数据。《心理测量学》,46,171-186·Zbl 0478.62084号
[50] Wu,J.、Gyourko,J.和Deng,Y.(2012)。评估中国主要住房市场的状况。《区域科学与城市经济学》,42,531-543。
[51] Yao,F.(2007)。纵向和生存数据的功能主成分分析。中国统计局,17965-983·Zbl 1133.62042号
[52] Yao,F.、Fu,Y.和Lee,T.C.(2010)。函数混合回归。生物统计学,12341-353·兹比尔1437.62665
[53] Yao,F.&Müller,H.G.(2010年)。函数二次回归。生物特征,97,49-64·Zbl 1183.62113号
[54] Yao,F.、Müller,H.‐G.和王,J.‐L。(2005年a)。稀疏纵向数据的功能数据分析。美国统计协会杂志,100577-590·Zbl 1117.62451号
[55] Yao,F.、Müller,H.‐G.和王,J.‐L。(2005b)。纵向数据的函数线性回归分析。《统计年鉴》,33,2873-2903·Zbl 1084.62096号
[56] Zhang,D.,Liu,Z.,Fan,G.Z.,&Horsewood,N.(2017年)。中国住房市场的价格泡沫和政策干预。《住房与建筑环境杂志》,32,133-155。
[57] Zhang,W.,Li,D.,&Xia,Y.(2015)。具有未指定链接函数的广义变系数模型中的估计。《计量经济学杂志》,187,238-255·Zbl 1337.62086号
[58] Zhang,Y.、Li,R.和Tsai,C.-L。(2010). 基于广义信息准则的正则化参数选择。美国统计协会杂志,105,312-323·Zbl 1397.62262号
[59] Zhou,X.H.,Lin,H.和Johnson,E.(2008)。倾斜数据的非参数异方差转换回归模型及其在医疗保健成本中的应用。英国皇家统计学会杂志:B辑(统计方法),701029-1047·Zbl 1411.62334号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。