×

混合模型的Copula分析。 (英语) Zbl 1304.65087号

摘要:当代计算机收集的数据库可能太大,经典方法无法处理。本工作采用观测值为分布函数(而非经典数据的单一数值点值)的数据,并提出了一种新方法的计算统计方法,将分布分组。聚类方法通过分布函数和多维Copula的概念,将搜索到的分区与混合密度的分解联系起来。通过确定全球气候数据集的不同温度和湿度区域,说明了新的聚类技术,并与标准EM算法的结果进行了比较。

MSC公司:

62-08 统计学相关问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部 哈尔

参考文献:

[1] Achard V(1991)Trois Problemes deés de dés d’Analyse 3D de la Structure Thermoynamicy de l'Atmosphereére par Satellite:Mesure du Contenu en Ozone;空气质量分类;传输辐射的超宽带Modélisation。巴黎大学博士学位论文
[2] Ali MM,Mikhail NN,Haq MS(1978)一类包含二元逻辑的二元分布。多变量分析杂志8:405–412·Zbl 0387.62019号 ·doi:10.1016/0047-259X(78)90063-5
[3] Arabie P,Carroll JD(1980)MAPCLUS:拟合ADCLUS模型的数学规划方法。《心理测量学》45:211–235·Zbl 0437.62059号 ·doi:10.1007/BF02294077
[4] Banfield JD,Raftery AE(1993),基于模型的高斯和非高斯聚类。生物统计学49:803–821·Zbl 0794.62034号 ·doi:10.2307/2532201
[5] Bishop CM(1995)模式识别的神经网络。牛津克拉伦登出版社
[6] Bock HH(1998)聚类和神经网络。收录:Rizzi A、Vichi M、Bock HH(eds)《数据科学与分类进展》。柏林施普林格,第265-277页·兹比尔1051.91523
[7] Bock RD,Gibbons RD(1996)高维多元概率分析。生物统计学52:1183–1194·Zbl 0925.62193号 ·doi:10.2307/2532834
[8] Brossier G(1990)分段层次聚类。分类J 7:197–216·Zbl 0736.62052号 ·doi:10.1007/BF01908716
[9] Celeux G、Diday E、Govaert G、Lechevallier Y、Ralambondemain H(1989)《自动分类》。巴黎Dunod Informatique
[10] Celeux G,Diebolt J(1986)L’Algorithme SEM:密度分布侦察的概率评估算法。应用统计评论34:35-51·Zbl 0607.62037号
[11] Celeux G,Govaert G(1992)聚类的分类EM算法和两个随机版本。计算统计数据分析14:315–332·兹比尔0937.62605 ·doi:10.1016/0167-9473(92)90042-E
[12] Celeux G,Govaert G(1993)《聚类分析中混合物和分类最大似然的比较》。J统计计算模拟47:127–146·doi:10.1080/00949659308811525
[13] Chédin A,Scott N,Wahiche C,Moulinier P(1985)改进的初始化反演方法:从tiros-N系列卫星反演温度的高分辨率物理方法。应用气象杂志24:128–143·doi:10.1175/1520-0450(1985)024<0128:TIIIMA>2.0.CO;2
[14] Chan JSK,Kuk AYC(1997)具有相关随机效应的概率线性混合模型的最大似然估计。生物统计学53:86–97·Zbl 1065.62503号 ·doi:10.2307/2533099
[15] Clayton DG(1978)双变量生命表关联模型及其在慢性病发病率家族趋势流行病学研究中的应用。生物特征65:141–151·Zbl 0394.92021号 ·doi:10.1093/biomet/65.1.141
[16] Dempster AP,Laird NM,Rubin DB(1977)通过EM算法从不完整数据中获得最大似然。J R统计Soc B 39:1–38·Zbl 0364.62022号
[17] Diday E(1984)Une représentation visuelle des classes empietantes:les pyrames。Rapport de Recherche 291印度
[18] Diday E(2001)《符号数据分析框架中混合分解问题的推广》,Rapport de Recherche,CEREMADE 112:1–14
[19] Diday E,Schroeder A,Ok Y(1974)模式识别中的动态聚类方法。摘自:国际信息处理联合会会议记录。纽约爱思唯尔出版社,第691-697页
[20] Diday E,Vrac M(2005)符号数据分析框架中通过连接函数对分布进行混合分解。离散应用数学147:27–41·Zbl 1058.62004号 ·doi:10.1016/j.dam.2004.06.018
[21] Fraley C,Raftery AE(2002),基于模型的聚类、判别分析和密度估计。美国统计协会97:611–631·Zbl 1073.62545号 ·doi:10.1198/016214502760047131
[22] Frank MJ(1979)关于F(x,y)和x+y F(x、y)的同时结合性。《Aequationes Mathematicae》19:194-226·Zbl 0444.39003号 ·doi:10.1007/BF02189866
[23] Genest C,Ghoudi K(1994),《Une famille de lois bidimensionelles日射岩》。巴黎一期康普特·伦德斯科学院318:351–354·兹比尔0797.60017
[24] Genest C,MacKay J(1986)连接词的乐趣:具有统一边缘的二元分布。美国统计局40:280–283
[25] Genest C,Rivest LP(1993),二元阿基米德连接的统计推断程序。美国统计协会杂志88:1034–1043·Zbl 0785.62032号 ·doi:10.1080/016214519993.10476372
[26] Gordon A(1999)分类。第2版。博卡拉顿查普曼和霍尔·Zbl 0929.62068号
[27] Hartigan JA,Wong MA(1979)算法AS136。一种k-means聚类算法。应用统计28:100–108·兹比尔0447.62062 ·doi:10.2307/2346830
[28] Hillali Y(1998)《概率分析与模型:多维菌群的能力与能力》。巴黎大学博士学位论文
[29] Jain AK,Dubes RC(1988),聚类数据算法。新泽西州普伦蒂斯·霍尔·Zbl 0665.62061号
[30] James GM,Sugar CA(2003),稀疏采样功能数据的聚类。美国统计协会J Am Stat Assoc 98:397–408·Zbl 1041.62052号 ·doi:10.1198/016214503000189
[31] Kuk AYC,Chan JSK(2001)参数不可识别时EM算法的三种实现方法。生物识别J 43:207–218·Zbl 1152.62302号 ·doi:10.1002/1521-4036(200105)43:2<207::AID-BIMJ207>3.0.CO;2-H型
[32] Li LA,Sedransk N(1988)分布的混合:拓扑方法。Ann Stat 16:1623–1634年·Zbl 0663.62021号 ·doi:10.1214/aos/1176351057
[33] McLachlan G,Peel D(2000)有限混合模型。纽约威利·Zbl 0963.62061号
[34] Meng XL,Rubin DB(1991)使用EM获得渐近方差-协方差矩阵:SEM算法。美国统计协会J Am Stat Assoc 86:899–909·doi:10.1080/01621459.1991.10475130
[35] Nelsen RB(1999)《连接词导论》。纽约州施普林格·Zbl 0909.62052号
[36] Parzen E(1962)关于概率密度函数和模式的估计。数学年鉴33:1065–1076·Zbl 0116.11302号 ·doi:10.1214/aoms/1177704472
[37] Prakasa Rao BLS(1983)非参数函数估计。纽约学术出版社·Zbl 0542.62025号
[38] Redner RA,Walker H(1984)混合密度、最大似然和EM算法。SIAM第26版:195–239·Zbl 0536.62021号 ·数字对象标识代码:10.1137/1026034
[39] Richardson S,Green PJ(1997),关于成分数量未知的混合物的贝叶斯分析。J R Stat Soc系列B 59:731–792·Zbl 0891.62020号 ·数字标识代码:10.1111/1467-9868.00095
[40] Schroeder A(1976)分析měme型概率分布。应用统计评论24:39–62
[41] Schweizer B,Sklar A(1983)概率度量空间。纽约州霍兰德北部·Zbl 0546.60010号
[42] Schweizer B(1984)分布是未来的数字。In:diNola A,Ventre A(eds)《模糊系统数学会议论文集》,意大利那不勒斯。那不勒斯大学,那不勒斯,第137–149页
[43] Scott AJ,Symons MJ(1971)基于似然比标准的聚类方法。生物计量学27:387–397·doi:10.2307/2529003
[44] Silverman BW(1986)用于统计和数据分析的密度估计。查普曼和霍尔,伦敦·Zbl 0617.62042号
[45] Sklar A(1959)《划分维度和勒尔市场的功能》(Foction de répartition A n dimensions et leurs marges)。巴黎大学统计研究所8:229–231
[46] Symons MJ(1981)聚类标准和多元正态混合物。生物计量学37:35-43·Zbl 0473.62048号 ·doi:10.2307/2530520
[47] Tanner MA,Wong WH(1987)通过数据增强计算后验分布(含讨论)。美国统计协会J Am Stat Assoc 82:528–550·doi:10.1080/01621459.1987.10478458
[48] Titterington DM、Smith AFM、Makov UE(1985)有限混合分布的统计分析。纽约威利
[49] Vrac M(2002)《多恩概率分析与模型》(Analyse et modélisation de donnees probabilistes par decomposition de Mélange de copules et applicationáune base de donnes climatologies)。巴黎大学博士学位论文
[50] Vrac M,Chédin A,Diday E(2005)通过连接函数的混合分解对全球大气廓线场进行聚类。大气海洋技术杂志22:1445–1459·doi:10.1175/JTECH1795.1
[51] Wei GCG,Tanner MA(1990)EM算法和穷人数据增强算法的蒙特卡罗实现。J Am Stat Assoc美国统计协会85:699–704·网址:10.1080/01621459.1990.10474930
[52] Winsberg S,DeSoete G(1999)时间序列分析的潜在类模型。Appl Stoch车型Bus Ind 15:183–194·Zbl 0952.91072号 ·doi:10.1002/(SICI)1526-4025(199907/09)15:3<183::AID-ASMB373>3.0.CO;2-T型
[53] Yakowitz SJ,Spragins LD(1968)关于有限混合物的可识别性。数学年鉴39:209–214·Zbl 0155.25703号 ·doi:10.1214/aoms/1177698520
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。