×

连续变量秩不变层次聚类的相似度函数。 (英语) Zbl 1510.62251号

摘要:提出了一个基于连接词的连续随机向量相异性概念的理论框架,并对其主要性质进行了研究。提出的相异性将最小值赋给一对共单调随机向量。研究了这种不同性的各种性质,特别注意那些容易采用层次凝聚方法的性质,如可还原性。对于在聚类算法中使用这种度量提供了一些见解,并进行了仿真研究。实际案例研究说明了整个方法的主要特征。

MSC公司:

62H20个 关联度量(相关性、典型相关性等)
62小时05 多元概率分布的表征与结构理论;连接线
62H30型 分类和区分;聚类分析(统计方面)
62P05号 统计学在精算科学和金融数学中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Acar,E.F。;Czado,C。;Lysy,M.,《多元时间序列数据的灵活动态藤系模型》,《计量经济学》。《统计》,第12卷,第181-197页(2019年)
[2] 安,J.Y。;Fuchs,S.,关于调和序下的最小连接词,J.Optim。理论应用。,184, 3, 762-780 (2020) ·Zbl 1433.49024号
[3] Bonanno,G。;卡尔达雷利,G。;Lillo,F。;Miccichè,S。;Vandewalle,N。;Mantegna,R.N.,《金融市场股票网络》,《欧洲物理》。J.B,38,2,363-371(2004)
[4] Bonanomi,A。;Nai Ruscone,M。;Osmetti,S.A.,《通过连接词混合物对排名数据进行差异性测量》,《统计分析》。数据最小值,12,5,412-425(2019)·Zbl 07260647号
[5] Bottegoni,G。;卡瓦利,A。;Recanatini,M.,《应用层次聚集聚类方法组织重复对接输出的比较研究》,J.Chem。信息模型。,46, 2, 852-862 (2006)
[6] Cifarelli,D.M。;Regazzini,E.,《基尼统计关系理论百周年纪念》,Metron,75,2,227-242(2017)·Zbl 1384.62166号
[7] 科特,M.-P。;Genest,C.,基于连接词的风险聚集模型,加拿大。《J.Stat.》,第43、1、60-81页(2015年)·Zbl 1310.62075号
[8] Culhane,A.C。;佩里埃,G。;Higgins,D.G.,使用共同惯性分析对基因表达数据进行跨平台比较和可视化,BMC生物信息学,21,4-59(2003)
[9] Culhane,A.C。;Thioulouse,J。;佩里雷,G。;Higgins,D.G.,MADE4:基因表达数据多元分析的R包,生物信息学,21,11,2789-2790(2005)
[10] Czado,C。;谢普斯迈尔,美国。;Min,A.,混合C-藤的最大似然估计及其在汇率中的应用,统计模型。,12, 3, 229-255 (2012) ·Zbl 07257878号
[11] 德卢卡,G。;Zuccolotto,P.,金融时间序列聚类的基于尾部依赖性的相异性测度,高级数据分析。分类。,5, 4, 323-340 (2011)
[12] 德卢卡,G。;Zuccolotto,P.,基于极端事件的金融时间序列双聚类算法,统计风险模型。,34, 1-2, 1-12 (2017) ·兹比尔1362.60051
[13] 德卢卡,G。;Zuccolotto,P.,金融时间序列的动态尾部依赖聚类,Stat.Pap。,58, 641-657 (2017) ·Zbl 1416.62581号
[14] 达恩,J。;Denuit,M。;Goovaerts,M.J。;Kaas,R。;Vyncke,D.,《精算科学和金融中的共单调性概念:理论》,《保险》。数学。经济。,31,1,3-33(2002),第五届IME会议(宾夕法尼亚州大学公园,2001)·Zbl 1051.62107号
[15] Di Lascio,F.M.L。;杜兰特,F。;Pappadá,R.,基于Copula的聚类方法,(ru beda Flores,M.;de Amo,E.;Durante,F.;Fernández Sánchez,J.,Copulas and Dependency Models with Applications(2017),Springer International Publishing),49-67
[16] Di Lascio,F.M.L。;Giannerini,S.,用copula函数聚类相关观测,Stat.Pap。,56, 3, 1-17 (2019) ·Zbl 1411.62165号
[17] Disegna,M。;D’Urso,P。;Durante,F.,基于Copula的空间时间序列模糊聚类,Spat。Stat.,21,part A,209-225(2017)
[18] 迪·曼,J。;Brechmann,E.C。;Czado,C。;Kurowicka,D.,《选择和估算规则藤蔓交配及其在财务回报中的应用》,计算。统计师。数据分析。,59, 52-69 (2013) ·Zbl 1400.62114号
[19] 杜兰特,F。;帕帕达,R。;Torelli,N.,《风险情景下金融时间序列的聚类》,《高级数据分析》。分类。,8, 359-376 (2014) ·Zbl 1414.62241号
[20] 杜兰特,F。;帕帕达,R。;Torelli,N.,通过非参数尾部相关性估计对时间序列进行聚类,Stat.Pap。,56, 3, 701-721 (2015) ·Zbl 1317.62053号
[21] 杜兰特,F。;Puccetti,G。;谢勒,M。;Vanduffel,S.,《给定边际的分布:开始》。对佐治奥·达利奥(Giorgio Dall’Aglio,Depend)的采访。型号。,4237-250年4月1日(2016年)·Zbl 1352.01036号
[22] 杜兰特,F。;Sempi,C.,《连接词理论原理》(2016),CRC出版社:CRC出版社,佛罗里达州博卡拉顿·Zbl 1380.62008年
[23] 艾森,M.B。;斯佩尔曼,P.T。;布朗,P.O。;Botstein,D.,全基因组表达模式的聚类分析和显示,Proc。国家。阿卡德。科学。美国,95,25,14863-14868(1998)
[24] Embrechts,P。;Hofert,M.,关于广义逆的注释,数学。方法操作。研究,77,3423-432(2013)·Zbl 1281.60014号
[25] Everitt,B.S。;兰道,S。;Leese,M。;Stahl,D.,《聚类分析》(2011),John Wiley&Sons,Ltd·Zbl 1274.62003年
[26] 费希尔,L。;Van Ness,J.W.,《允许的聚类程序》,《生物统计学》,58,91-104(1971)·Zbl 0224.62030号
[27] Fuchs,S.,《Copulas变换与一致性度量》(2015),德累斯顿理工大学(博士论文)
[28] Fuchs,S.,连接函数的一种双凸形式,Depend。型号。,4, 1, 63-75 (2016) ·Zbl 1349.62175号
[29] Fuchs,S.,Copula诱导的一致性度量,依赖。型号。,4, 1, 205-214 (2016) ·Zbl 1349.62237号
[30] 富克斯,S。;McCord,Y。;Schmidt,K.D.,达到多元Kendall’s tau边界的连接函数的特征,J.Optim。理论应用。,178, 2, 424-438 (2019) ·Zbl 1418.62222号
[31] Genest,C。;Carabarim-Aguirre,A。;Harvey,F.,使用blomqvist的beta估计Copula参数,J.SFdS,154,1,5-24(2013)·Zbl 1316.62069号
[32] Genest,C。;Nešlehová,J。;Ben Ghorbal,N.,《基于多元copula模型中Kendallτ的估计量》,澳大利亚。N.Z.J.Stat.,53157-177(2011年)·Zbl 1274.62367号
[33] Gijbels,I。;Kika,V。;Omelka,M.,《关于多维关联测度及其随维数增加的行为的规范》,《多元分析杂志》。,182,第104704条,第(2021)页·Zbl 1459.62091号
[34] Gordon,A.D.,《等级分类综述》,J.Roy。Stat.Soc.A,150,2,119-137(1987)·Zbl 0616.62086号
[35] 戈雷基,J。;霍弗特,M。;Holenǎ,M.,Kendall’s tau和凝聚聚类用于确定层次阿基米德连接函数的结构,Depend。型号。,5, 1, 75-87 (2017) ·Zbl 1404.62054号
[36] 格罗特,O。;施尼德斯,J。;Segers,J.,测量随机向量之间的关联和依赖性,J.多元分析。,123 (2014) ·Zbl 1278.62090号
[37] Hall,A.V.,《分类学和生态学中显示显著性和帮助识别关键类群的方法》,《自然》,218,5137,203-204(1968)
[38] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习的要素》。数据挖掘、推断和预测(2009),Springer:Springer New York,NY·Zbl 1273.62005年
[39] 《聚类分析手册》(2016),查普曼和霍尔/CRC:查普曼&霍尔/CRC博卡拉顿,佛罗里达州·Zbl 1331.68001号
[40] 霍弗特,M。;Hornik,K.,Qrmdata:定量风险管理实践数据集(2016),R包版本2016-01-03-1
[41] 霍弗特,M。;科贾迪诺维奇,I。;Maechler,M。;Yan,J.,与连接函数的多元相关性(2020),R包版本0.999-20
[42] 休伯特,L。;Arabie,P.,比较分区,J.分类,2193-218(1985)
[43] 纪浩。;Wang,H。;Liseo,B.,《通过尾部依赖聚类和ARMA-GARCH藤蔓连接法实现投资组合多元化战略》,奥斯汀。经济。帕普。,57, 3, 265-283 (2018)
[44] Joe,H.,多元一致性,J.多元分析。,35, 1, 12-30 (1990) ·兹比尔0741.62061
[45] Joe,H.,(用连词进行依赖建模。用连词建立依赖模型,统计学和应用概率专著,第134卷(2015年),CRC出版社:佛罗里达州博卡拉顿CRC出版社)·Zbl 1346.62001号
[46] 科赫,I。;De Schepper,A.,《测量(m)维向量的共单调性》,阿斯汀。公牛。,41, 191-213 (2011) ·Zbl 1214.62066号
[47] Kojadinovic,I.,基于互信息的连续变量聚集层次聚类,计算。统计师。数据分析。,46, 269-294 (2004) ·Zbl 1429.62251号
[48] Kojadinovic,I.,基于经验copula过程和排列链接的连续变量的层次聚类,计算。统计师。数据分析。,54, 1, 90-108 (2010) ·Zbl 1284.62380号
[49] Kosmidis,I。;Karlis,D.,《使用连接函数与应用程序的基于模型的聚类》,Stat.Compute。,1079-1099年5月26日(2016年)·Zbl 1505.62233号
[50] Krupskii,P。;Joe,H.,《动态相关性的灵活copula模型及其在金融数据中的应用》,《计量经济学》。《统计》,第16卷,第148-167页(2020年)
[51] 库马尔,S。;Deo,N.,全球金融指数的相关性和网络分析,Phys。版本E,86,2(2012)
[52] Mai,J.-F。;Scherer,M.,《模拟Copulas》(2012),帝国理工学院出版社:伦敦帝国理工大学出版社·Zbl 1301.65001号
[53] 马尔巴克,M。;比尔纳基,C。;Vandewalle,V.,混合数据高斯连接函数的基于模型的聚类,《通信统计理论方法》,46,23,11635-11656(2017)·Zbl 1384.62198号
[54] 米勒,A。;Scarsini,M.,关于超模序的一些评论,J.多元分析。,73, 1, 107-119 (2000) ·Zbl 0958.60009号
[55] 米勒,A。;Stoyan,D.,(随机模型和风险的比较方法。随机模型和危险的比较方法,概率统计中的Wiley级数(2002),John Wiley&Sons Ltd.:John Willey&Sons有限公司Chichester)·Zbl 0999.60002号
[56] Nelsen,R.B.,《一致性和连接函数:一项调查》(Cuadras,C.M.;Fortiana,J.;Rodríguez-Lallena,J.a.,《给定边际分布和统计建模》(2003),Kluwer:Kluwer-Dordrecht),169-178·Zbl 1135.62337号
[57] Nelsen,R.B.,(Copulas简介。Copula简介,Springer Series in Statistics(2006),Springer:Springer New York)·Zbl 1152.62030
[58] 诺特曼,D.A。;阿龙,美国。;Sierk,A.J。;Levine,A.J.,用寡核苷酸阵列检测大肠腺瘤、腺癌和正常组织的转录基因表达谱,《癌症研究》,61,7,3124-3130(2001)
[59] 巴顿,A.J.,《经济时间序列的copula模型综述》,J.多元分析。,110, 4-18 (2012) ·Zbl 1244.62085号
[60] Perreault,S。;T·公爵夫人。;Nešlehová,J.G.,《检测大规模相关矩阵中的块交换结构》,《多元分析杂志》。,169, 400-422 (2019) ·Zbl 1411.62038号
[61] Puccetti,G。;Scarsini,M.,《多元共单调性》,J.《多元分析》。,1011291-304(2010年)·Zbl 1184.62081号
[62] Puccetti,G。;Wang,R.,极端依赖概念,统计科学。,30, 4, 485-517 (2015) ·Zbl 1426.62156号
[63] R核心团队R.,《统计计算的语言和环境》(2020年),R统计计算基金会:R奥地利维也纳统计计算基金
[64] Rand,W.M.,聚类方法评价的客观标准,J.Amer。统计师。协会,66,336,846-850(1971)
[65] Ross,D.T。;谢尔夫,美国。;艾森,M.B。;佩罗,C.M。;Rees,C。;斯派曼,P。;艾耶,V。;杰弗里,S.S。;Van de Rijn,M。;Waltham,M。;Pergamenschikov,A。;Lee,J.C。;拉什卡里,D。;沙龙,D。;Myers,T.G。;韦恩斯坦,J.N。;Botstein博士。;Brown,P.O.,《人类癌症细胞系基因表达模式的系统变异》,《自然遗传学》。,24, 227-235 (2000)
[66] 萨尔瓦多,G。;De Michele,C。;新墨西哥州科特戈达。;Rosso,R.,(《自然中的极值:使用Copulas的方法》,《自然中极值:利用Copula的方法》),《水科学与技术图书馆》,第56卷(2007),施普林格:施普林格-多德雷赫特(NL))
[67] Scarsini,M.,《关于协调的度量》,《随机》,8,3,201-218(1984)·Zbl 0582.62047号
[68] 施密德,F。;Schmidt,R.,Sparman rho的多变量条件版本和尾部依赖性的相关测量,《多元分析杂志》。,98, 1123-1140 (2007) ·Zbl 1116.62061号
[69] 施密德,F。;施密特,R。;Blumentritt,T。;盖瑟,S。;Ruppert,M.,基于Copula的多元关联度量,(Jaworski,P.;Durante,F.;Härdle,W.K.;Rychlik,T.,Copula理论及其应用,《统计学讲义-论文集》(2010),施普林格:施普林格-柏林-海德堡),209-236
[70] Taylor,M.D.,连接函数及其边缘的多元一致性度量,Depend。型号。,4, 1, 224-236 (2016) ·兹比尔1349.62244
[71] ru beda-Flores,M.,《Blomqvist的beta和spearman的footrule的多元版本》,《Ann.Inst.Statist》。数学。,57, 4, 781-788 (2005) ·Zbl 1093.62060号
[72] 杨,C。;蒋伟(Jiang,W.)。;吴杰。;刘,X。;李振华,利用跳尾相关系数对金融工具进行聚类,统计方法应用。,27491-513(2018)·Zbl 1427.62124号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。