×

用于聚类大数据时间序列的分段周期图方法。 (英语) Zbl 1474.62214号

摘要:我们提出并研究了一种新的频域方法,用于表征和比较大集合的长时间序列。我们没有使用从数据中获得的所有信息,而是提出一些正则化规则,以选择和总结最相关的信息以进行聚类,而这些信息在计算上非常昂贵。本质上,我们建议使用围绕利益驱动周期成分计算的零散周期图,并比较各种估计。该程序计算简单,但能够浓缩时间序列的相关信息。一个模拟练习表明,平滑的分段周期图通常比非平滑的周期图工作得更好,而对于中到大样本大小的样本,其工作效果并不比完整的周期图差。我们在对几个股票市场指数演变的研究中说明了这一过程。我们进一步显示了最近金融危机对这些指数行为的影响。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62米10 统计学中的时间序列、自相关、回归等(GARCH)
62M15型 随机过程和谱分析的推断
62兰特 大数据和数据科学的统计方面
62P05号 统计学在精算科学和金融数学中的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bai,J。;Ng,S.,单位根与协整的恐慌攻击,《计量经济学》,72,1127-1177(2004)·兹比尔1091.62068 ·doi:10.1111/j.1468-0262.2004.00528.x
[2] Bai,J。;Ng,S.,大维度因素分析,Found Trends Econom,3,89-163(2008)·doi:10.1561/0800000002
[3] Ja巴斯托斯;Caiado,J.,《利用方差比统计对金融时间序列进行聚类》,《Quant Financ》,第14期,第2121-2133页(2014年)·Zbl 1402.62246号 ·doi:10.1080/14697688.2012.726736
[4] Boivin,J。;Ng,S.,因子分析中数据越多越好吗?,《经济学杂志》,132169-194(2006)·Zbl 1337.62345号 ·doi:10.1016/j.jeconom.2005.01.027
[5] Bollerslev,T。;机罩,B。;Lasse,H。;Pedersen,Lh,《风险无处不在:建模和管理波动性》,Rev Financ Stud,312729-2773(2018)·doi:10.1093/rfs/hhy041
[6] Pj布罗克韦尔;Davis,Ra,《时间序列:理论和方法》(1991),纽约:Springer,纽约·Zbl 0709.62080号
[7] Caiado,J。;Crato,N.,《识别股票收益中的常见动态特征》,Quant Financ,10797-807(2010)·doi:10.1080/14697680903567152
[8] Caiado,J。;北卡罗来纳州克雷托。;Peña,D.,基于周期图的时间序列分类度量,《计算统计数据分析》,502668-2684(2006)·Zbl 1445.62222号 ·doi:10.1016/j.csda.2005.04.012
[9] Caiado,J。;北卡罗来纳州克雷托。;Peña,D.,《频域中长度不等的时间序列的比较》,《公共统计模拟计算》,38,527-540(2009)·Zbl 1161.37348号 ·网址:10.1080/03610910802562716
[10] Caiado,J。;Ea Maharaj;D’Urso,P。;亨宁,C。;梅拉,M。;Murtagh,F。;Rocci,R.,《时间序列聚类》,《聚类分析手册》,241-263(2015),博卡拉顿:CRC出版社,博卡拉顿·Zbl 1396.62196号
[11] 涂层,D;Diggle,Pj,《比较两种估计光谱密度的试验》,《时序分析杂志》,7,7-20(1986)·Zbl 0581.62076号 ·doi:10.1111/j.1467-9892.1986.tb00482.x
[12] Corsi,F.,已实现波动率的异质自回归模型(HAR-RV),《金融经济学杂志》,第7期,174-196页(2009年)·doi:10.1093/jjfinec/nbp001
[13] Diggle,Pj;Fisher,Ni,累积周期图的非参数比较,应用统计,40,423-434(1991)·Zbl 0825.62465号 ·doi:10.2307/2347522
[14] Doz,C。;Giannone,D。;Reichlin,L.,大型近似动态因子模型的两步估计,《经济杂志》,164,1188-205(2011)·Zbl 1441.62671号 ·doi:10.1016/j.jeconom.2011.02.012
[15] Doz,C。;Giannone,D。;Reichlin,L.,《大型近似动态因子模型的准最大似然法》,《Rev Econ Stat》,941014-1024(2012)·doi:10.1162/REST_a_00225
[16] 弗尼,M。;Hallin,M。;里皮,M。;Reichlin,L.,广义动态因素模型:识别和估计,Rev Econ Stat,82540-554(2000)·网址:10.1162/003465300559037
[17] 弗尼,M。;Hallin,M。;里皮,M。;Reichlin,L.,广义动态因素模型:片面估计和预测,美国国家统计协会,100,830-839(2005)·Zbl 1117.62334号 ·doi:10.1198/0162145000002050
[18] 加莱亚诺,P。;Peña,D.,向量时间序列的多元分析,Resenhas,4,383-404(2000)·Zbl 1098.62558号
[19] Lam,C。;姚,Q。;Bathia,N.,《使用高维时间序列估计潜在因素》,《生物统计学》,98,901-918(2011)·Zbl 1228.62110号 ·doi:10.1093/biomet/asr048
[20] Liao,Tw,时间序列数据的聚类:一项调查,模式识别,381857-1874(2005)·Zbl 1077.68803号 ·doi:10.1016/j.patcog.2005.01.025
[21] Maharaj,Ea,ARMA模型分类的显著性检验,J Stat Compute Simul,54,305-331(1996)·Zbl 0899.62116号 ·doi:10.1080/00949659608811737
[22] Otranto,E.,《识别具有类似动态条件相关性的金融时间序列》,《计算统计数据分析》,54,1,1-15(2010)·Zbl 1284.91593号 ·doi:10.1016/j.csda.2009.07.026
[23] 佩尼亚,D。;Box,Gep,《识别时间序列中的简化结构》,美国统计协会杂志,82836-843(1987)·Zbl 0623.62081号
[24] 佩尼亚,D。;Poncela,P.,非静态动态因素分析,J Stat Plan推断,136,237-257(2006)
[25] Piccolo,D.,ARIMA模型分类的距离度量,《时序分析杂志》,第11期,第152-164页(1990年)·Zbl 0691.62083号 ·doi:10.1111/j.1467-9892.1990.tb00048.x
[26] Poncela,P。;鲁伊斯,E。;北谢泼德。;Koopman,Sj,《More is not always better:back to the Kalman filter in dynamic factor models,Unobservative components and time series econometrics》(2015),牛津:牛津大学出版社,牛津·Zbl 1325.62004号
[27] 库存,Jh;Watson,Mw,《使用大量预测因子的主成分进行预测》,美国统计协会期刊,97,1169-1179(2002)·Zbl 1041.62081号 ·doi:10.1198/016214502388618960
[28] 库存,Jh;沃森,Mw;克莱门茨,Mp;Hendry,Df,动态因子模型,牛津经济预测手册(2011),牛津:牛津大学出版社,牛津
[29] 威廉·汤姆森(William Thomson),《验潮仪、潮汐谐波分析仪和潮汐预报器》,土木工程研究院学报,65,2-25(1881)
[30] Tong,H。;Dabas,P.,《时间序列模型集群:一个例子》,《应用统计杂志》,第17期,第187-198页(1990年)·doi:10.1080/757582830
[31] 杨,Ac;蔡,S-J;Hong,C-J;王,C。;陈,T-J;Liou,Y-J,聚类心率动力学与β肾上腺素能受体多态性相关:基于信息的相似性指数分析,PLoS ONE,6,5,e19232(2011)·doi:10.1371/journal.pone.0019232
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。