×

基于协方差的相异性度量应用于聚类广义平稳遍历过程。 (英语) Zbl 1446.62181号

摘要:我们引入了一个新的无监督学习问题:聚类广义平稳遍历随机过程。针对离线和在线数据集的聚类问题,分别设计了基于协方差的差异性度量和渐近一致性算法。我们还提出了一个关于差异性度量有效性的形式化标准,并讨论了一种提高聚类算法效率的方法,将其应用于特定类型的进程,例如具有广义平稳遍历增量的自相似进程。聚类合成数据和真实世界数据是作为应用程序的示例提供的。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
60克10 平稳随机过程
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 日本巴斯托斯;Caiado,J.,《利用方差比统计对金融时间序列进行聚类》,《定量金融》,第14、12、2121-2133页(2014年)·Zbl 1402.62246号 ·doi:10.1080/14697688.2012.726736
[2] Bianchi,S。;Pianese,A.,通过过滤逐点Hölder正则性分解的股票指数的多重分数性质,《国际理论与应用金融杂志》,11,6,567-595(2008)·Zbl 1210.91129号 ·doi:10.1142/S0219024908004932
[3] Boufoussi,B。;M.多兹。;Guerbaz,R.,一类局部渐近自相似过程的路径性质,《概率电子杂志》,13,29,898-921(2008)·Zbl 1191.60046号 ·doi:10.1214/EJP.v13-505
[4] 坎巴尼,S。;哈丁,CJ;Weron,A.,平稳稳定过程的遍历性,随机过程及其应用,24,1,1-18(1987)·兹比尔0612.60034 ·doi:10.1016/0304-4149(87)90024-X
[5] 塞萨·比安奇,N。;Lugosi,G.,《预测、学习和游戏》(2006),剑桥:剑桥大学出版社,剑桥·Zbl 1114.91001号
[6] F.孔德。;Renault,E.,连续时间随机波动模型中的长记忆,数学金融,8,4,291-323(1998)·兹比尔1020.91021 ·doi:10.1111/1467-9965.00057
[7] Damian,D。;奥尔西奇,M。;Verheij,E.,新型子空间聚类算法(COSA)在医学系统生物学中的应用,代谢组学,3,1,69-77(2007)·doi:10.1007/s11306-006-0045-z
[8] Embrechts,P。;Maejima,M.,《自相似随机过程理论导论》,国际现代物理杂志B,14,12,1399-1420(2000)·Zbl 1219.60040号
[9] 格雷,RM,概率,随机过程和遍历特性(1988),柏林:施普林格出版社,柏林·Zbl 0644.60001号
[10] Hartigan,JA,聚类算法(1975),纽约:威利,纽约·Zbl 0372.62040号
[11] Herdin,M.、Czink,N.、Ozcelik,H.和Bonek,E.(2005)。相关矩阵距离是评估非平稳MIMO信道的一个有意义的度量。2005年IEEE第61届车辆技术会议(第1卷,第136-140页)。
[12] Hirkhorshidi,AS;Aghabozorgi,S。;Wah,TY,聚类连续数据中相似性和差异性度量的比较研究,PLoS ONE,10,12,e0144059(2015)·doi:10.1371/journal.pone.0144059
[13] 伊娃·F。;帕加诺尼,AM;Tarabelloni,N.,多元和函数数据分析中基于协方差的聚类,机器学习研究杂志,17,1-21(2016)·兹比尔1392.62184
[14] Jääskinen,V。;帕基宁,V。;Cheng,L。;Corander,J.,使用马尔可夫链和随机分割模型对DNA序列进行贝叶斯聚类,《遗传学和分子生物学中的统计应用》,13,1,105-121(2014)·Zbl 1296.92157号 ·doi:10.1515/sagmb-2013-0031
[15] 阿拉斯加州贾恩;Mao,J.,超椭球聚类的自组织网络(HEC),IEEE神经网络汇刊,7,16-29(1996)·doi:10.1109/72.478389
[16] 阿拉斯加州贾恩;明尼苏达州默蒂;弗林,PJ,《数据聚类:综述》,ACM计算调查(CSUR),31,3,264-323(1999)·数字对象标识代码:10.1145/331499.331504
[17] Juozapavičius,A。;Rapsevicius,V.,通过地质中的决策树构造进行聚类,非线性分析:建模和控制,6,2,29-41(2001)·兹比尔1019.62063 ·doi:10.15388/NA.2001.6.1.15213
[18] Katsavounidis,I。;郭,CJ;Zhang,Z.,广义Lloyd迭代的新初始化技术,IEEE Signal Processing Letters,1,10,144-146(1994)·doi:10.1109/97.329844
[19] Khaleghi,A。;Ryabko,D。;Mari,J。;Preux,P.,《聚类时间序列的一致算法》,《机器学习研究杂志》,17,3,1-32(2016)·Zbl 1360.68683号
[20] Kleinberg,JM,《聚类的不可能性定理》,《神经信息处理系统(NIPS)进展》,第15期,第463-470页(2003年)
[21] Lamperti,JW,《半稳态随机过程》,美国数学学会学报,104,62-78(1962)·Zbl 0286.60017号 ·doi:10.1090/S0002-9947-1962-0138128-7
[22] Magdziarz,M。;Weron,A.,异常扩散过程的遍历特性,《物理学年鉴》,3262431-2443(2011)·Zbl 1227.82058号 ·doi:10.1016/j.aop.2011.04.015
[23] 曼德尔布罗特,B。;van Ness,JW,分数布朗运动,分数噪声和应用,SIAM评论,10,4,422-437(1968)·Zbl 0179.47801号 ·数字对象标识代码:10.1137/1010093
[24] Maruyama,G.,无限可分过程,概率论及其应用,15,1,1-22(1970)·Zbl 0268.60036号 ·doi:10.1137/1115001
[25] 帕夫利迪斯,NG;副总裁Plagianakos;丹麦Tasoulis;明尼苏达州Vrahatis,《通过无监督聚类和神经网络进行财务预测》,运筹学,6,2,103-127(2006)·doi:10.1007/BF02941227
[26] 彭杰。;Müller,HG,稀疏观测随机过程的基于距离的聚类,及其在在线拍卖中的应用,应用统计年鉴,2,3,1056-1077(2008)·Zbl 1149.62053号 ·doi:10.1214/08-AOAS172
[27] Peng,Q.,平稳增量高斯过程的均匀Hölder指数:从平均值开始的估计,《统计学与概率快报》,81,8,1326-1335(2012)·Zbl 1219.62130号 ·doi:10.1016/j.spl.2011.03.036
[28] Rubinstein,M.、Joulin,A.、Kopf,J.和Liu,C.(2013年)。互联网图像中的无监督关节对象发现和分割。IEEE计算机视觉和模式识别会议(CVPR)(第1939-1946页)。
[29] Samorodnitsky,G.,极值理论,遍历理论和平稳稳定过程的短记忆和长记忆之间的边界,《概率年鉴》,32,2,1438-1468(2004)·Zbl 1049.60027号 ·doi:10.1214/00911790400000261
[30] 萨莫罗德尼茨基,G。;Taqqu,MS,稳定非高斯随机过程:无限方差随机模型(1994),纽约:查普曼和霍尔出版社,纽约·Zbl 0925.60027号
[31] 森,PK;辛格,JM,《统计学中的大样本方法》(1993),纽约:查普曼和霍尔公司,纽约·Zbl 0867.62003号
[32] Shields,PC,离散样本路径遍历理论,数学研究生(1996),普罗维登斯:美国数学学会,普罗维登斯·Zbl 0879.28031号
[33] Ślzak,J.,非遍历高斯过程时间平均值的渐近行为,《物理学年鉴》,383285-311(2017)·Zbl 1373.60064号 ·doi:10.1016/j.aop.2017.05.015
[34] Slonim,N。;阿特瓦尔,GS;Tkavcik,G。;Bialek,W.,《基于信息的聚类》,PNAS,102,51,18297-18302(2005)·Zbl 1135.62054号 ·doi:10.1073/pnas.0507432102
[35] Wilson博士;Martinez,TR,改进的异质距离函数,JAIR,6,1-34(1997)·Zbl 0894.68118号 ·doi:10.1613/jair.346
[36] Xu,R。;Wunsch,D.,聚类算法综述,IEEE神经网络交易,16,3,645-678(2005)·doi:10.1109/TNN.2005.845141
[37] 赵伟。;邹伟(Zou,W.)。;Chen,JJ,大型生物和医学数据集聚类分析的主题建模,BMC生物信息学,15,S11(2014)·doi:10.1186/1471-2105-15-S11-S11
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。