×

非平稳随机模型中的变点分析。 (英语) Zbl 1416.62018年

佛罗里达州博卡拉顿:CRC出版社(ISBN 978-1-4987-59596-2/hbk;978-1-032-40220-8/pbk;978-1-4987-597-9/ebook)。xix,第345页。(2017).
随机模型或过程在农业、天文学、动力学、经济、环境、岩土工程、水文学、力学、物理、化学、工程、材料科学、数据科学、社会科学、医学和运输等领域的应用非常广泛。最著名的是苏格兰植物学家罗伯特·布朗(Robert Brown)调查了克拉基亚·普切拉(Clarkia pulchella)为了发现开花植物的种类,他在显微镜下注意到悬浮在水中的花粉粒内的微小颗粒快速振荡运动。到了19世纪60年代,理论物理学家对利用布朗运动来一致地解释各种特性有着特殊的兴趣:给定的粒子似乎同样可能朝任何方向运动;进一步的动议似乎与过去的动议完全无关;运动从未停止过。
液体或气体分子运动永不停止、相互碰撞并来回反弹的观点,是19世纪第三季度物理学家詹姆斯·克拉克·麦克斯韦(James Clerk Maxwell)、路德维希·玻尔兹曼(Ludwig Boltzmann)和鲁道夫·克劳修斯(Rudolf Clausius)在解释热现象时发展起来的气体动力学理论的重要组成部分。
物质的温度与物质分子运动或振动的平均动能成正比。人们很自然地猜测,这种运动可能会被赋予在显微镜下可以观察到的较大粒子;如果是真的,这将是第一个可以直接观察到的效应,它将证实动力学理论。1905年,德国物理学家阿尔伯特·爱因斯坦(Albert Einstein)基于这种推理提出了布朗运动的定量理论。法国物理学家Jean-Baptiste Perrin成功验证了爱因斯坦的分析,并于1926年获得诺贝尔物理学奖。他的工作建立了布朗运动的物理理论,结束了对原子和分子作为实际物理实体存在的怀疑。
20世纪美国数学家诺伯特·维纳(Norbert Wiener)取得了一个显著的结果:在区间上的所有连续函数集合内,可微函数集合的测度为零。换句话说,随机选取一个函数是可微的几乎是不可能的。从物理意义上讲,在布朗运动下运动的粒子几乎肯定是在不可微的路径上运动的。这一发现澄清了阿尔伯特·爱因斯坦关于布朗运动的基本观点(表现为流体中尘埃颗粒在周围分子的持续轰击下的持续运动)。
布朗运动不是一个平稳过程,因为它的边缘分布随时间而变化。平稳随机过程、平移过程是时不变的。即使是平稳过程和振荡过程的变换也是非平稳的。变化点分析是一种功能强大的新分析方法,用于测试是否发生了变化,能够检测控制图遗漏的细微变化,并通过提供置信水平和置信区间更好地描述发现的变化。在处理大型历史数据集时,可以将变化点分析应用于数据分析,以提供更多信息,控制图表。变化点分析更强大、更灵活、更易于使用,能够更好地描述变化,控制总体错误率,并对异常值具有鲁棒性。
正在审查的这本书解决了过程存在的追溯问题和顺序问题,并提出了最佳检测追溯和顺序公式中变化的理论方法,以及理论和实验中方法的特征。随机模型的变化点(统计特征的突变)、趋势或单位根(统计特征的渐变)、异常值和系数的切换(统计特征的纯随机和消失变化)本书考虑了非平稳检测的回顾性和顺序性问题。本书的第一部分致力于具有特殊章节的回溯性变点问题,研究决策统计参数的渐近最优选择和不同变点问题性能效率的先验下限,本书的第二部分提供了变化点检测的顺序问题,以检验假设,并以顺序方式在数据收集的每个步骤中决定是否存在变化点。
E.S.页码[生物特征41、100–115(1954;Zbl 0056.38002号); 《生物特征》42,523–527(1955;Zbl 0067.11602号)]首先提出了回溯变点问题,并提出了与最大似然法密切相关的检测变点的CUSUM规则。在计量经济学、金融经济学、金融数学、生物医学和许多其他应用中,都存在检测随机过程特征变化的回顾性问题。一个具有\(X^N(N)=X^{(i)}(N)\)的族\(X=\{X^N\}_{N=N_0,N_0+1,\dots},X^N=\{X^N(N)\}_{N=1}^N\)如果\([\theta_{i-1}N](θ={theta_1,dots,theta_k})是集合(X)生成的粘合随机序列,集合(θ=θ_1,dots,theta _k}\)是粘合点或改变点。因此,随机序列的离线变点问题是通过给定的样本(X^N)找到所描述方案中未知参数(θ)的估计。Brodsky和Darkhovsky(1990-2008)表明,检测任意d.f.中的变化可以简化为检测从初始序列构造的一些新序列的平均值的变化,并提出了一个三步变化点估计程序,即首先获得一个初步的变化点列表,第二次拒绝初步列表中的点,并细化更改点和计算置信区间。下限决定了定理2.6.1中的单变点问题和定理2.6.2中的多变点问题的渐近极小极大估计的阶数。
D.A.迪克W.A.Fuller先生【《美国统计学会期刊》第74卷,第427–431页(1979年;Zbl 0413.62075号); 《计量经济学》49,1057–1072(1981;Zbl 0471.62090号)]通过使用简单的AR(1)模型提出了最著名的单位根测试,S.E.赛义德D.A.迪克[生物特征71,599–607(1984;Zbl 0564.62075号)]证明了ADF(增广Dickey-Fuller)检验可以用于MA(q)项时间序列模型的规范,S.Ng公司P.佩伦[《计量经济学》69,第6期,1519–1554(2001年;Zbl 1056.62529号)]基于ERS构建的GLS去趋势数据构建的测试统计数据。这些测试是P.C.B.菲利普斯P.佩伦[生物特征75,第2期,335-346(1988;兹比尔0644.62094)]统计和ERS点最优统计。单位根假设和结构变化假设是密切相关的,它们之间的区别问题是实际存在的。第3章研究了一种新的随机趋势回顾性检测方法,以及随机趋势和结构变化假设的识别问题。
第四章提出了检测和估计可能开关的渐近最优方法。S.M.戈德菲尔德R.E.Quandt先生【《经济学杂志》第1期、第3期至第16期(1973年;Zbl 0294.62087号)]首次提出了带有马尔可夫开关的回归模型。这本书的作者提出了一种非参数方法来回顾性检测d.f's的数量,并对不同d.f的观测值进行分类。对于二元混合物的类型1(定理4.3.1)和类型2(定理4.3.2),随着样本量增加到无穷大,所提出方法的误差概率指数收敛到零。分类方法性能效率的信息下界和所提出方法的渐近最优性都来自定理4.6.1。
多元线性系统的一般变点问题,包括AR(自回归模型)、ARMA(自回归移动平均)、SES(联立方程组)和约化形式,在5.2小节中进行了阐述,定理5.3.1证明了多元模型中变点估计误差概率的先验理论下限是根据唯一变点的特殊函数给出的,定理5.3.2是针对多个变点的。对于唯一的变化点,定理5.4.1(对于确定性预测)和定理5.4.2(对于随机预测)证明了在多元线性模型中有一种新的回溯变点检测和估计方法,并且随着样本量的增大,该方法以变点估计值收敛到其真值的阶数渐近最优。多个转换点的新方法涉及到对一个转换点情况的递归还原。作者开发了一种新的渐近最优方法,该方法可以对未知数量的变化点及其坐标进行一致估计。通过与其他方法(Chow检验、CUSUM、OLS CUSUM检验、波动检验、Wald检验、LM检验)的比较,对所提方法在有限样本量下的特性进行了仿真研究。给出了确定性、随机性和多重结构回归,并将所提出的方法应用于追溯检测1995年1月至2015年9月俄罗斯CPI通胀月度模型中的结构变化。
第6章介绍了一种新的状态空间模型中变化点回溯检测的非参数方法,定理6.3.1和定理6.3.2在一些一般假设下给出了1型和2型错误概率的指数收敛速度。
第7章致力于采用回顾性方法揭示不同金融时间序列模型中的结构变化。金融经济学中的模型是随机模型在实际应用中最困难的应用。将先前的结果应用于GARCH模型的结构变化检测,作者能够正确估计GARCH(1,1)模型的变化点数量和这些变化点的坐标。对于纳斯达克和纽约证券交易所的实际数据,该方法揭示了几个暂时的变化点。还可以检测SV模型和copula模型的变化,以正确识别结构偏移并估计参数。定理7.5.1和定理7.5.2显示了所提方法的统计特性,该方法与Hurst的R/s方法和Kolmogorov的统计方法非常相似,用于检测两个d.f.之间的差异。
第二部分,变点检测的序贯问题,从第8章的序贯假设检验开始。A.沃尔德《序列分析》,纽约:Wiley&Sons(1947;Zbl 0029.15805号)]扩展了SPRT(序贯概率比检验),将其推广到不同的复合假设检验案例中。J.基弗L.维斯【Ann.Math.Stat.28,57-74(1957年;Zbl 0079.35406号)]制定了一个序贯假设检验问题,无差异区的平均样本量远大于相应的样本量,以及T.L.赖【Ann.Probab.1,825–837(1973年;Zbl 0294.60028号); Ann.Stat.16,第2号,856–886(1988年;Zbl 0657.62088号)]和V.P.德拉加林A.A.诺维科夫【理论概率应用32,第4期,617–627(1987;Zbl 0716.62076号); 来自Teor的翻译。维罗亚特。Primen公司。32,No.4,679–690(1987)]提出了渐近解。V.P.德拉加林A.A.诺维科夫【Obozr.Prikl.Prom.Mat.6,No.2,387-399(1999;Zbl 1007.62065号)]研究了在存在未知参数的无差异区的情况下对多个复合假设的顺序测试,赖天乐[J.R.Stat.Soc.,Ser.B 57,No.4,613–658(1995;Zbl 0832.62072号); IEEE传输。Inf.Theory 46,No.2,595-608(2000;Zbl 0994.62078号)]序列多假设检验问题中的平均样本量的渐近下界G.西蒙斯【《数学年鉴》第38卷,1343–1364页(1967年;Zbl 0178.22103号)]. 第8章提出了一种新的复合假设序贯检验(单侧和多边序贯检验)的性能度量方法,以及这些度量的非症状先验下限,并且在没有观测值分布函数的指数族假设的情况下,结果仍然成立。定理8.3.1和定理8.3.2给出了单侧测试性能度量的估计和渐近最优,定理8.4.1和定理8.4.2给出了多边测试的结果。
任何顺序检测方法都是关于存在非均匀性的决策过程,因此很自然地通过第一类错误(假警报)的概率、第二类错误的概率(假平静)来表征顺序检测方法的质量以及变化点估计误差的概率。序贯观测值的序贯诊断包括观测值分布规律变化的时刻和在误报时尽快检测变化点。Page[loc.cit.(1954);loc.ci.t.(1955)]提出了一种带有报警阈值的停车规则,以及A.N.Shiryaev先生[苏联数学,Dokl.2,740-743(1961;Zbl 0109.12802号); Dokl翻译。阿卡德。Nauk SSSR 138、799–801(1961年);理论问题。申请。8, 22–46 (1963;Zbl 0213.43804号); 来自Teor的翻译。维罗亚特。Primen公司。8, 26–51 (1963); 理论问题。申请。8, 247–265 (1963;Zbl 0279.90011号); 来自Teor的翻译。维罗亚特。Primen公司。8, 264–281 (1963); 特奥。维罗亚特。Primen公司。10, 380–385 (1965;兹伯利0139.36003); 统计序列分析。最佳停止规则。第二版,修订版(俄语)。莫斯科:瑙卡(1976年;Zbl 0463.62068号)]研究了具有离散和连续时间的随机过程的序列变点检测问题。第9章简要介绍了顺序变化点检测的历史,并提供了定理9.2.1和9.2.2中非参数版本的CUSUM,定理9.2.3和9.2.4中非参数版的Girshick-Rubin-Shyriv(GRSh)方法的顺序测试的性能特征,对于定理9.2.5和9.2.6中的指数平滑方法,对于定理9.2.7和9.2.8中的移动样本方法。定理9.3.1用Kullback-Leibler信息测度给出了变化点检测中延迟时间的先验信息估计,随着样本大小的增加,变化点检测的归一化延迟时间几乎肯定会收敛到某个常数。序列方法的比较分析不同于基于非线性更新理论和Wald序列方法的经典方法。定理9.4.1和定理9.4.2给出了CUSUM和GRSh方法的虚警概率分析。渐近最优性的分析依赖于检测中归一化延迟时间的极限特性和具有先验信息边界的归一化延迟时间的收敛速度的比较,这两种方法的模拟在第9.5小节中给出。
Kolmogorov和Shiryaev(1959年)提出了最快检测自发效应问题(后来称为无序问题)的正式声明,Shiryaev[loc.cit.(1963年)]根据观测值分布函数和变化点的全部先验信息,找到了该问题的最佳解。Lai[loc.cit.(1995);loc.ci.t.(1988)]将动态系统中的顺序变化点检测问题推广到非i.i.d.情况,并研究了窗限制广义似然比(GLR),以证明动态系统中不同顺序变化点检测问题的渐近最优性。C.-S.J.Chu等【经济计量学64,第5期,1045–1065(1996;Zbl 0856.90027号)]分析了线性回归系数结构变化的监测问题,并利用波动检验对系数突变进行序贯检测和诊断。目前对这些方法的最优性和渐近最优性缺乏研究。第10章致力于对线性模型中变化点的序列检测新方法进行有限样本体积的理论研究。基于移动窗口统计,构造了观测值数学期望中未知变化点的检测方法和检测方法。定理10.4.1中具有较高估计值的1类错误(错误决策)概率和定理10.4.2中具有较高估算值的2类错误(错过目标)概率均指数收敛到零。作者和B.S.达尔霍夫斯基[非参数统计诊断.问题与方法.多德雷赫特:Kluwer学术出版社(2000;Zbl 0995.62031号)]证明了这些特性通常表征了一种渐近最优的检测方法。通过蒙特卡罗试验,将线性模型结构变化的顺序检测方法与其他著名方法进行了比较,并对德国货币需求季度模型(1961-1995年)和俄罗斯通货膨胀月度模型(1994-2005年)的稳定性进行了实际应用分析将在本章后面的章节中讨论。
第11章对早期变点检测问题进行了理论分析,即尽快检测出一个变点,并理解小误报率(FAR)。对于具有独立观测值的单变量模型和具有相关观测值的多元模型,变点检测方法的性能特征具有定理11.2.1和定理11.2.2中的下限。CUSUM和GRSh方法对于任何变化模型都不是渐近最优的,除了突变模型(经典的变化点模型)。对所提出的单变量和多变量模型中的早期变化点检测方法进行了蒙特卡罗测试。
第12章旨在对结构变化模型中的开关进行顺序检测。首先对问题进行了公式化,定理12.3.1给出了所提出方法的错误决策的上确概率。错误概率的指数收敛率为零的假设相当温和,需要正确选择大参数,任何合理的变点检测方法都必须具有如此大的参数,定理12.4.1证明了序列变点检测问题的先验信息不等式,这些不等式可用于该方法的渐近最优性。
最后一章讨论了序列变化点检测和估计的非参数方法,序列变化点检测中错误决策的上确界概率由大参数指数率控制。第13.4节模拟中介绍了变化路径和变化距离。与经典的一阶最优性相比,在定理13.5.1和定理13.5.2中获得了变化点顺序检测的CUSUM方法的渐近最优性。
对于那些希望学习非平稳随机过程的检测和估计的回顾性和顺序变化点问题的人来说,这是一本可读性很强、很有吸引力的书,其中包含了历史信息和思想发展,以及数值、刺激性和实证分析,它的写作当然是权威的。参考文献对有关变化点检测和估计及其在金融经济学中的应用的相关文献进行了充分的抽样。但是,读者对本书中研究的这些问题的统计方法和模型特别感兴趣,他们也会很好地研究渐近理论的丰富文献,即数据科学最近发展中与顺序数据收集相关的顺序变化点检测的最佳测试。

MSC公司:

62-02 与统计有关的研究展览(专著、调查文章)
62G10型 非参数假设检验
62升10 顺序统计分析
2007年6月26日 非马尔科夫过程:假设检验
62P05号 统计学在精算科学和金融数学中的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部