×

多元时间序列的贪婪高斯分割。 (英语) Zbl 1459.62170号

摘要:我们考虑将多变量(向量)时间序列分割成若干段的问题,在这些段上,数据可以作为高斯分布的独立样本进行很好的解释。我们将其表示为协方差调整的最大似然问题,该问题可以简化为在可能的断点或分段边界上搜索的组合优化问题。这个问题可以使用动态规划来解决,其复杂性随着时间序列长度的平方增长。我们提出了一种启发式方法,该方法在线性时间内近似地解决了关于该长度的问题,并且总是产生局部最优选择,即任何一个断点的改变都不会改善目标。我们的方法,我们称之为贪婪高斯分割(GGS),很容易扩展到维数大于1000的向量和任意长度的时间序列的问题。我们讨论了使用数据验证此类模型的方法,以及在该方法中自动选择两个超参数的适当值的方法。最后,我们说明了我们对金融时间序列和维基百科文本数据的GGS方法。

MSC公司:

62M10个 统计学中的时间序列、自相关、回归等(GARCH)
62H30型 分类和区分;聚类分析(统计方面)
62P05号 统计学在精算科学和金融数学中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abonyi J,Feil B,Nemeth S,Arva P(2005)多元时间序列模糊分割的改进Gath-Geva聚类。模糊集系统149(1):39-56·Zbl 1071.68543号
[2] Alexander C(2000)正交GARCH模型入门。英国雷丁大学ISMA中心未出版手稿
[3] Ang A,Timmermann A(2012)制度变化和金融市场。财政经济年度收益4(1):313-337
[4] Bakis R(1976)通过百分之一秒声学状态进行连续语音识别。Acoust Soc Am 59(S1)杂志:S97
[5] Bellman R(1961)关于使用动态规划通过线段逼近曲线。通信ACM 4(6):284·Zbl 0100.12901号
[6] Bickel PJ,Levina E(2008)大型协方差矩阵的正则化估计。Ann Stat 36(1):199-227·Zbl 1132.62040号
[7] Basseville M,Nikiforov IV(1993)《突变检测:理论与应用》,第104卷。英格伍德悬崖普伦蒂斯·霍尔·Zbl 1407.62012年
[8] Bauwens L,Rombouts J(2012),关于变点模型中的边际似然计算。计算统计数据分析56(11):3415-3429·Zbl 1255.62234号
[9] Booth NB,Smith AFM(1982)《追溯识别变化点的贝叶斯方法》。《经济学杂志》19(1):7-22·Zbl 0492.62077号
[10] Borenstein E,Ullman S(2008)自上而下/自下而上的组合分割。IEEE Trans-Pattern Ana Mach Intell 30(12):2109-2125
[11] Bulla J(2011)具有t分量的隐马尔可夫模型。增强持久性和其他方面。数量鳍片11(3):459-475
[12] Bleakley K,Vert J-P(2011)该团队融合套索用于多个变化点检测。arXiv预打印arXiv:1106.4199
[13] Chouakria-Douzal,A。;Berthold,MR(编辑);Lenz,H-J(编辑);Bradley,E.(编辑);Kruse,R.(编辑);Borgelt,C.(编辑),保存多元时间序列相关性的压缩技术,566-577(2003),柏林
[14] Cheon S,Kim J(2010)用贝叶斯方法对多变量均值向量进行多变化点检测。计算统计数据分析54(2):406-415·Zbl 1464.62046号
[15] CappéO,Moulines E,Rydén T(2005),隐马尔可夫模型中的推断。纽约州施普林格·Zbl 1080.62065号
[16] Crosier RB(1988)累积和质量控制方案的多元推广。技术计量学30(3):291-303·兹比尔0651.62095
[17] Candès EJ,Wakin MB,Boyd s(2008)通过重新加权增强稀疏性\[\ell_1\]1最小化。傅里叶分析应用杂志14(5-6):877-905·Zbl 1176.94014号
[18] De Gooijer J(2006)检测多维随机过程中的变化点。计算统计数据分析51(3):1892-1903·Zbl 1157.62481号
[19] Douglas DH,Peucker TK(1973)《减少表示数字化直线或其漫画所需点数的算法》。Cartogr Int J Geogr Inf Geovis 10(2):112-122
[20] Esling P,Agon C(2012),时间序列数据挖掘。ACM计算概况45(1):12·Zbl 1293.68104号
[21] Fiecas M,Franke J,von Sachs R,Kamgaing JT(2017)多元隐马尔可夫模型的收缩估计。美国统计协会杂志112(517):424-435
[22] Fraggou P,Petridis V,Kehagias A(2004)线性文本分割的动态规划算法。智能信息系统杂志23(2):179-197·Zbl 1088.68593号
[23] Fenn DJ、Porter MA、Williams S、McDonald M、Johnson NF、Jones NS(2011)金融市场相关性的时间演变。物理版E 84(2):026109
[24] Guralnik V,Srivastava J(1999),时间序列数据的事件检测。摘自:第五届ACM SIGKDD知识发现和数据挖掘国际会议记录,第33-42页
[25] Ge X,Smyth P(2001)等离子体蚀刻端点检测的分段半马尔可夫模型。IEEE Trans半秒工程259:1-209
[26] Gustafsson F(2000)自适应滤波和变化检测。威利,西苏塞克斯
[27] Galeano P,Wied D(2014)随机变量相关结构中的多重中断检测。计算机统计数据分析76:262-282·Zbl 1506.62065号
[28] Huang JZ,Liu N,Pourahmadi M,Liu L(2006)通过惩罚正态似然选择协方差矩阵和估计。生物医学93(1):85-98·Zbl 1152.62346号
[29] Hu B,Rakthanmanon T,Hao Y,Evans S,Lonardi S,Keogh E(2015)利用最小描述长度发现时间序列的内在基数和维数。数据最小知识发现29(2):358-399·Zbl 1403.68190号
[30] Hallac D、Sharang A、Stahmann R、Lamprecht A、Huber M、Roehder M、SosičR、Leskovec J(2016)使用单圈汽车传感器数据进行驾驶员识别。在IEEE第19届智能运输系统国际会议上,第953-958页
[31] Hastie T、Tibshirani R、Friedman J(2009)《统计学习的要素》,第2版。纽约州施普林格·Zbl 1273.62005年
[32] Katz I,Crammer K(2014)Outlier鲁棒凸分割。arXiv预打印arXiv:1411.4503
[33] 基奥,E。;楚,S。;哈特,D。;巴扎尼,M。;Last,M.(编辑);坎德尔,A.(编辑);Bunke,H.(编辑),《分割时间序列:调查和新方法》(2004年),新加坡
[34] Kim S-J、Koh K、Boyd S、Gorinevsky D\[(2009)\ell_1\]1趋势过滤。SIAM版本51(2):339-360·Zbl 1171.37033号
[35] Kehagias A、Nidelkou E、Petridis V(2006)水文和环境时间序列的动态规划分割程序。斯托克环境研究风险评估20(1):77-94·Zbl 1096.62084号
[36] Lee C-B(1998)指数族变点的贝叶斯分析及其应用。计算统计数据分析27(2):195-208·Zbl 1042.62526号
[37] Lee J,Hastie T(2015)学习混合图形模型的结构。J计算图统计24(1):230-253
[38] 李杰(2015)非参数多元统计过程控制图:基于假设检验的方法。非参数统计杂志27(3):383-400·Zbl 1330.62203号
[39] Ledoit O,Wolf M(2004)大维协方差矩阵的良好估计。多变量分析杂志88(2):365-411·Zbl 1032.62050
[40] Meucci A(2009)管理多元化。风险22(5):74-79
[41] Nystrup P、Hansen BW、Larsen HO、Madsen H、Lindström E(2017)《动态分配或多元化:基于区域的多重资产方法》。《港口管理杂志》44(2):62-73
[42] Nystrup P,Hansen BW,Madsen H,Lindström E(2015)基于制度与静态资产配置:让数据说话。《港口管理杂志》42(1):103-109
[43] Nystrup P、Hansen BW、Madsen H、Lindström E(2016)《VIX和标准普尔500中的变化点检测:动态资产配置的新方法》。J资产管理17(5):361-374
[44] Nystrup P,Madsen H,Lindström E(2017)金融时间序列和时变参数隐马尔可夫模型的长记忆性。J预测36(8):989-1002·Zbl 1397.60104号
[45] Partovi MH、Caputo M(2004)《主要投资组合:重塑有效前沿》。经济牛市7(3):1-10
[46] Picard F,Lebarbier Ed,BudinskáE,Robin S(2011),使用混合线性模型对多元高斯过程进行联合分割。计算统计数据分析55(2):1160-1170·兹比尔1284.62058
[47] Rajagopalan V,Ray A(2006)《基于小波划分的符号时间序列分析》。信号处理86(11):3309-3320·Zbl 1172.94532号
[48] Rydén T,Teräsvirta T,Au sbrink S(1998)《每日收益序列的风格化事实和隐马尔可夫模型》。应用计量经济学杂志13(3):217-244
[49] SaméA、Chamroukhi F、Govaert G、Aknin P(2011),基于模型的聚类和时间序列分割与政体变化。高级数据分析类5(4):301-321·Zbl 1274.62427号
[50] Son YS,Kim S(2005)多元正态观测序列中的贝叶斯单变点检测。统计39(5):373-387·Zbl 1089.62029号
[51] Sheikh A,Sun J(2012)《体制变化:宏观经济变化对资产类别和投资组合绩效的影响》。J投资21(3):36-54
[52] Tansey W、Padilla OHM、Suggala AS、Ravikumar P(2015)通过指数族的向量空间马尔可夫随机场。摘自:第32届机器学习国际会议论文集,第1卷,第684-692页
[53] Tibshirani R、Saunders M、Rosset S、Zhu J、Knight K(2005)《通过融合套索实现的简约与流畅》。J R Stat Soc Ser B Stat方法67(1):91-108·Zbl 1060.62049号
[54] Venter JH,Steel SJ(1996)发现多个突变点。计算统计数据分析22(5):481-504·Zbl 0900.62230号
[55] Verbeek J,Vlassis N,Kröse B(2003)高斯混合模型的有效贪婪学习。神经计算15(2):469-485·Zbl 1047.68114号
[56] Wahlberg B,Boyd S,Annergren M,Wang Y(2012)一类总变差正则化估计问题的ADMM算法。IFAC程序第45卷(16):83-88
[57] Welford BP(1962)关于计算校正平方和和乘积的方法的说明。技术计量学4(3):419-420
[58] Wahlberg B、Rojas C、Annergren M(2011)On\[\ell_1\]1均值和方差滤波。摘自:第四十五届阿西洛马信号、系统和计算机会议记录,第1913-1916页
[59] Witten D,Tibshirani R(2009)高维问题的协方差回归与分类。J R Stat Soc Ser B Stat方法71(3):615-636·Zbl 1250.62033号
[60] Xu Z,Liu Y(2017)正则化自回归隐半马尔可夫模型。https://github.com/cran/rarhsmm网址
[61] Xu N(2002)传感器网络应用调查。IEEE Commun Mag 40(8):102-114
[62] Zangwill WI,Garcia CB(1981)解决方案、不动点和平衡的途径。Prentice Hall,Englewood Cliffs·Zbl 0512.90070号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。