×

ClustGeo:具有空间约束的层次聚类的R包。 (英语) Zbl 1417.62006年

摘要:在本文中,我们提出了一种包含空间/地理约束的Ward-like层次聚类算法。输入了两个不同矩阵(D_0)和(D_1),以及一个混合参数([0,1]\中的alpha)。差异可以是非欧几里德的,观测值的权重可以是非均匀的。第一个矩阵给出“特征空间”中的差异,第二个矩阵给出了“约束空间”中差异。每个阶段最小化的准则是用(D_0)计算的均匀准则和用(D_1)计算出的均匀准则的凸组合。其思想是根据感兴趣的变量(即特征空间的变量)确定一个值\(\alpha\),该值可以增加空间邻接度,而不会过度恶化解的质量。使用R包ClustGeo在实际数据集上演示了此过程。

MSC公司:

62-04 有关统计问题的软件、源代码等
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Ambroise C,Govaert G(1998)空间聚类EM型算法的收敛性。模式识别Lett 19(10):919-927·doi:10.1016/S0167-8655(98)00076-2
[2] 安布罗斯,C。;Dang,M。;戈沃特,G。;苏亚雷斯,A.(编辑);Gómez-Hernandez,J.(编辑);Froidevaux,R.(编辑),《利用EM算法对空间数据进行聚类》,493-504(1997),柏林·doi:10.1007/978-94-017-1675-8_40
[3] Bécue-Bertaut M,Kostov B,Morin A,Naro G(2014)《法庭演讲中的修辞策略:基于多维统计的方法论》。J类31(1):85-106·Zbl 1360.68863号 ·doi:10.1007/s00357-014-9148-9
[4] Bécue-Bertaut M,Alvarez-Esteban R,Sánchez-Espigares JA(2017)Xplortext:文本数据R包的统计分析。R软件包版本1.0。https://cran.r-project.org/package=Xplortext。2017年10月26日访问
[5] Bourgault G,Marcotte D,Legendre P(1992)多元(co)变异函数作为分类方法中的空间加权函数。数学地理24(5):463-478·doi:10.1007/BF00890530
[6] Chavent M、Kuentz-Simonet V、Labenne A、Saracco J(2017)《ClustGeo:具有空间约束的层次聚类》。R包版本2.0。https://cran.r-project.org/package=ClustGeo。2017年7月14日访问·Zbl 1417.62006年
[7] Dehman A,Ambroise C,Neuvial P(2015)利用连锁不平衡信息进行变量选择的分块方法表现。BMC生物信息16:148·doi:10.1186/s12859-015-0556-6
[8] Duque JC、Dev B、Betancourt A、Franco JL(2011)ClusterPy:空间约束聚类算法库,RiSE-group(空间经济学研究)。EAFIT大学。版本0.9.9。http://www.rise-group.org/risem/clusterpy/。2017年7月19日访问
[9] Ferligoj A,Batagelj V(1982)带关系约束的聚类。《心理测量学》47(4):413-426·兹伯利0568.62059 ·doi:10.1007/BF02293706
[10] Gordon AD(1996)约束分类调查。计算机统计数据分析21:17-29·Zbl 0900.62313号 ·doi:10.1016/0167-9473(95)00005-4
[11] Lance GN,Williams WT(1967)分类排序策略的一般理论。1.等级制度。计算J 9:373-380·doi:10.1093/comjnl/9.4.373
[12] Legendre P(2014)const.clust:空间和时间受限的聚类包。http://adn.biol.umontreal.ca/数字生物学/Rcode。2014年3月30日访问
[13] 勒让德P,勒让德L(2012)《数值生态学》,第24卷。纽约爱思唯尔·Zbl 1033.92036号
[14] Miele V,Picard F,Dray S(2014)生态网络的空间约束聚类。方法Ecol Evol5(8):771-779·doi:10.1111/2041-210X.12208
[15] Murtagh F(1985a)多维聚类算法。Compstat讲座。维也纳Physika·Zbl 0601.62085号
[16] Murtagh F(1985b)邻接约束聚类算法及相关问题综述。计算J 28:82-88·doi:10.1093/comjnl/28.182
[17] Oliver M,Webster R(1989)多元分类中空间权重的地质统计学基础。数学地理21(1):15-35·doi:10.1007/BF00897238
[18] Strauss T,von Maltitz MJ(2017)《曼哈顿距离的概括病房法》。公共服务一号。https://doi.org/10.1371/journal.pone.0168288 ·doi:10.1371/journal.pone.0168288
[19] Vignes M,Forbes F(2009),通过结合个体和成对特征的集成马尔可夫模型进行基因聚类。IEEE/ACM Trans-Comput Biol Bioninform(TCBB)6(2):260-270·doi:10.1109/TCBB.2007.70248
[20] Ward JH Jr(1963)优化目标函数的分层分组。美国统计协会杂志58(301):236-244·doi:10.1080/016214591963.10500845
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。