×

生态学中基于模型的多元丰度数据的同时聚类和排序。 (英语) Zbl 1466.62106号

摘要:在研究多元丰度数据时,生态学家经常感兴趣的主要模式之一是,这些地点是否在代表物种组成的低维排序空间上表现出集群。为了解决这个问题,开发了一种新的基于模型的方法,称为CORAL(聚类和排序回归分析),该方法基于使用潜在变量回归进行同步聚类和排序。通过从有限的混合密度中提取潜在变量,CORAL根据站点在潜在信号空间中的位置对其进行概率分类。这类似于因子分析仪的混合物,除了CORAL是为非正常响应设计的,并且使用特定物种而非特定集群的因子载荷(回归系数)。通过贝叶斯MCMC抽样进行估计,补充材料中提供了代码。仿真表明,通过利用数据中可用的联合信息进行分类和降维,CORAL在生态学中的聚类和排序方面优于几种流行的基于算法的方法。CORAL应用于在法国-瑞士边界附近的Doubs河沿岸站点收集的存在-缺失记录数据集,结果显示两个集群或生态区域部分类似于上游和下游站点的空间分隔。

MSC公司:

62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 布雷,J.R。;Curtis,J.T.,威斯康星州南部山地森林群落排序,生态。专著,27325-349,(1957)
[2] Caliánski,T。;Harabasz,J.,《聚类分析的枝晶方法》,Comm.Statist。理论方法,3,1-27,(1974)·Zbl 0273.62010
[3] Celeux,G。;福布斯,F。;罗伯特·C·P。;Titterington,D.M.,缺失数据模型的偏差信息标准,贝叶斯分析。,1, 651-673, (2006) ·Zbl 1331.62329号
[4] Dolnicar,S。;Grabler,K。;马扎内克,J.A。;伍德赛德,A。;克劳奇,G。;Oppermann,M。;Sakai,M.,《三个城市的故事:分析目的地图像的感知制图》,(1999年),CABI出版社
[5] Dray,S。;杜福尔,A.-B.,《ade4包:为生态学家实现二元图》,J.Stat.Softw。,22, 1-20, (2007)
[6] 邓斯坦,P.K。;福斯特,S.D。;Hui,F.K.C。;Warton,D.I.,《生态学中高维计数和生物量数据回归建模的有限混合》,J.Agric。生物与环境。科学。,18, 357-375, (2013) ·Zbl 1303.62066号
[7] 弗雷利,C。;Raftery,A.E.,基于模型的聚类、判别分析和密度估计,J.Amer。统计师。协会,97,611-631,(2002)·Zbl 1073.62545号
[8] Frühwirth-Schnatter,S.,有限混合和马尔可夫切换模型:随机过程的建模和应用,(2006),Springer·Zbl 1108.6202号
[9] Gelman,A。;黄,J。;Vehtari,A.,理解贝叶斯模型的预测信息标准,统计计算。,24, 997-1016, (2014) ·Zbl 1332.62090号
[10] Gijbels,I。;Omelka,M.,《使用不同测量方法测试多元离散度的均匀性》,《生物计量学》,69,137-145,(2013)·Zbl 1270.62078号
[11] Hill,M.O.,对应分析:一种被忽视的多元方法,应用。Stat.,23,340-354,(1974)
[12] Huber,P。;Ronchetti,E。;Victoria-Feser,M.-P.,广义线性潜在变量模型的估计,J.R.Stat.Soc.Ser。B统计方法。,66, 893-908, (2004) ·Zbl 1060.62077号
[13] Hui,F.K.C.,Boral-R中多变量丰度数据的贝叶斯排序和回归分析,方法Ecol。演变。,7, 744-750, (2016)
[14] Hui,F.K.C。;Taskinen,S。;抵押人,S。;福斯特,S.D。;Warton,D.I.,基于模型的无约束排序方法,方法经济学。演变。,6, 399-411, (2015)
[15] Hui,F.K.C。;华盛顿州沃顿。;Foster,S.D.,使用惩罚回归混合的多物种分布建模,Ann.Appl。《法律总汇》第9卷,第866-882页,(2015年)·Zbl 1397.62263号
[16] Hui,F.K.C。;沃顿,D.I。;Foster,S.D.,有限混合模型中的顺序选择:完全或观测到的似然信息准则?,Biometrika,102,724-730,(2015)·Zbl 1452.62814号
[17] 考夫曼,L。;Rousseeuw,P.J.,《在数据中发现群体:聚类分析导论》(1990),威利·兹比尔1345.62009
[18] Kruskal,J.B。;Wish,M.,多维尺度,(1978),Sage Publications,Beverley Hills
[19] Legendre,P。;Legendre,L.,《数值生态学》,第3卷,(2012),爱思唯尔
[20] 麦克拉克伦,G。;Peel,D.,因子分析仪的混合物,(第七届机器学习国际会议论文集,(2000年),Morgan Kaufmann San Franciso),599-606
[21] McNicholas,P.D.,Elsherbiny,A.,McDaid,A.F.,Murphy,T.B.,2015年。pgmm:简约高斯混合模型。R软件包版本1、2。
[22] 医学博士麦克尼古拉斯。;Murphy,T.B.,简约高斯混合模型,统计计算。,18, 285-296, (2008)
[23] Melo,A.S.,2013年。社区生态:社区生态分析。R软件包版本1.5.9/r38。
[24] Millar,R.B.,《使用DIC和贝叶斯因子对过度分散计数数据的分层贝叶斯模型的比较》,《生物统计学》,65,962-969,(2009)·Zbl 1172.62054号
[25] Milligan,G.W。;Cooper,M.C.,《确定数据集中簇数的程序检查》,《心理测量学》,第50期,第159-179页,(1985年)
[26] Minchin,P.R.,《多维社区模式的模拟:走向综合模型》,Vegetatio,71,145-156,(1987)
[27] 莫里茨,C。;Lévesque,M。;砾石,D。;瓦兹,S。;Archambault,D。;Archambault,P.,《圣劳伦斯湾表层底栖生物群落的空间分布建模》(加拿大),《海洋研究杂志》,78,75-84,(2013)
[28] 莫里,P.M。;Browne,R.P。;McNicholas,P.D.,偏态因子分析仪的混合物,计算。统计师。数据分析。,77, 326-335, (2014) ·Zbl 1506.62132号
[29] 内科拉,J.C。;McGill,B.J.,距离衰减关系函数形式的尺度依赖性,生态学,37309-320,(2014)
[30] 帕帕斯塔穆利斯,P。;Iliopoulos,G.,分布混合贝叶斯分析中基于人工分配的标签切换问题解决方案,J.Comput。图表。统计人员。,19, 313-331, (2010)
[31] 抵押人,S。;Arnold,R.,《使用混合物的多元方法:对应分析、缩放和模式检测》,计算。统计师。数据分析。,71, 241-261, (2014) ·Zbl 1471.62162号
[32] 普卢默,M。;贝斯特,N。;Cowles,K。;Vines,K.,CODA:MCMC的收敛诊断和输出分析,R News,6,7-11,(2006)
[33] Plummer,M.等人,2003年。JAGS:使用吉布斯抽样分析贝叶斯图形模型的程序。摘自:《第三届分布式统计计算国际研讨会论文集》,DSC 2003年3月,第20-22页。
[34] 波拉克,M。;海瑟·W·J。;de Rooij,M.,《两类单峰数据:对应分析作为主成分分析的替代方法》,计算。统计师。数据分析。,53, 3117-3128, (2009) ·Zbl 1453.62179号
[35] Rousseeuw,P.J.,《Silhouettes:聚类分析的解释和验证的图形辅助》,J.Comput。申请。数学。,20, 53-65, (1987) ·Zbl 0636.62059号
[36] Skrondal,A。;Rabe-Hesketh,S.,《广义潜在变量建模:多级、纵向和结构方程模型》,(2004),Chapman和Hall Boca Raton·Zbl 1097.62001
[37] 施皮盖尔哈特,D.J。;贝斯特,N.G。;卡林,B.P。;Van Der Linde,A.,模型复杂性和拟合的贝叶斯度量,J.R.Stat.Soc.Ser。B统计方法。,第64,4583-639页,(2002年)·Zbl 1067.62010年
[38] Stephens,M.,《处理混合模型中的标签切换》,J.R.Stat.Soc.Ser。B统计方法。,62, 795-809, (2000) ·Zbl 0957.62020号
[39] ter Braak,C.J。;普伦蒂斯,I.C.,《梯度分析理论》,高等经济学出版社。决议,18,271-317,(1988)
[40] Verneaux,J.,法国海岸-侏罗纪地块。勒埃索河畔生态研究所(recherchesécoloniques sur le re seau hydrographique du doubs)-生物分类学论文,(1973年),贝桑松大学
[41] Ward,J.H.,优化目标函数的分层分组,J.Amer。统计师。协会,58236-2441963年
[42] 沃顿,D.I。;Blanchet,F.G。;奥哈拉,R。;,O。;,O。;Taskinen,S。;南卡罗来纳州沃克。;Hui,F.K.C.,《如此多的变量:社区生态学中的联合建模》,Trends Ecol。演变。,30, 766-779, (2015)
[43] 沃顿,D.I。;Wright,S.T。;Wang,Y.,基于距离的多元分析混淆了位置和分散效应,方法Ecol。演变。,3, 89-101, (2012)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。