后续系列文章的议程是介绍自相关、自相关函数(ACF)和偏自相关函数的概念,并在系统识别中使用ACF和PACF。
介绍
给定时间序列数据(股票市场数据、一段时间内的太阳黑子数、通过通信信道接收的信号样本等),时间序列中的连续值通常相互关联。这个系列相关性被称为坚持不懈或惯性它会导致频谱较低频率的功率增加。持久性可以显著降低时间序列建模(AR、MA、ARMA模型)的自由度。在统计显著性测试中,持久性的存在使测试复杂化,因为它减少了独立观察的数量。
自相关函数
时间序列与其自身过去和未来值的相关性称为自相关。它也被称为“滞后或序列相关性”。正自相关是特定形式的坚持不懈系统从一次观察到下一次观察保持相同状态的趋势(例如:0或1的连续运行)。如果时间序列表现出相关性,则样本概率的未来值完全取决于当前和过去的样本。因此,可以在预测和建模时间序列时利用自相关的存在。可以使用以下工具访问自相关
● 时间序列图
● 滞后散点图
● 自相关函数(ACF)
生成样本时间序列
为了进行说明,我们首先使用自动返回AR(1)过程.AR(1)过程与当前样本相关x(n)LTI系统输出的直接过去样本x[n-1]和白噪声项w[n].
通用AR(1)系统如下所示
在这里和是我们将调整以生成不同时间序列数据集的模型参数,以及是将设置为零的常数因此,该模型可以等效为
让我们从上述模型生成两个时间序列数据。
模型1:a0=0,a1=1
Matlab中的“Filter”功能将用于生成输出过程x(n)过滤器功能,以其基本形式——X=过滤器(B、A、W),接受三个输入。向量B类和A类以标准差分方程形式表示LTI系统传递函数的分子和分母系数(此处为模型参数),W公司是LTI滤波器的白噪声矢量,滤波器的输出为X(X).
因此,模型1的传递函数为,
在哪里?B=1和A=[1-1]输入W是白噪声,可以使用随机数功能。因此,可以使用命令实现上述模型x=过滤器(1,[1-1,randn(1000,1))生成1000个样本x(n)
A=[1-1];%模型系数%带噪声的分子/分母形式生成x1=过滤器(1,A,randn(1000,1));图(x1,‘b’);
模型2:a0=1,a1=0.5
该模型的传递函数为
在哪里?B=1和A=[1-0.5]输入W是白噪声,可以使用随机数功能。因此,可以使用命令实现上述模型x=过滤器(1,[1-0.5],randn(1000,1))生成1000个样本x(n)
A=[1-0.5];%模型系数%带噪声的分子/分母形式生成x2=过滤器(1,A,randn(1000,1));图(x2,‘r’);
在上面的图中,模型1的输出表现出持续性或正相关性——与平均值的正偏差往往会在一定时间内出现正偏差,而与平均值负偏差往往会出现负偏差。当正偏差后面跟着负偏差或副偏差时,这是一个负相关的特征。正相关是多次连续观测高于或低于平均值的长期运行的有力迹象。负相关性表明此类跑步的发生率较低。模型2的输出总是围绕平均值跳跃,并且与平均值没有一致的偏离——没有持久性(没有正相关)。对时间序列图的解释是一个主观问题,需要经过训练的眼睛才能看到。然而,可以将其视为初步分析。
持久性——非国家性的表现:
对于时间序列分析,必须使用平稳过程。统计信号处理中的许多公式化定理都假设一个序列是平稳的(至少在弱意义上)。概率密度函数不随时间变化的过程称为平稳过程(子分类包括严格意义平稳(SSS)、弱意义平稳(WSS)等)。为了进行分析,如果时间序列发生任何变化,联合概率分布必须保持不变。具有持久性(均值随时间变化)的时间序列是非平稳的,因此信号处理中的许多定理都不适用。
绘制两个序列的直方图(参见下图),我们可以立即确定模型1生成的数据是非平稳的-直方图在信号的选定部分之间有所不同。然而,模型2的输出直方图几乎相同,因此,这是一个平稳信号,适合进一步分析。
滞后散点图
自相关趋势也可以通过滞后散点图确定。在滞后散点图中,时间序列的样本以每次一个滞后的方式相互绘制。对于特定滞后值,强正自相关将显示为线性正斜率。如果散点图是随机的,则表示特定滞后不相关。
图形;x12=x1(1:端1);x12=x1(1:端1);x21=x1(2:结束);x13=x1(1:末端2);x31=x1(3:末端);x14=x1(1:末端3);x41=x1(4:末端);x15=x1(1:末端4);x51=x1(5:结束);子区(2,2,1)绘图(x12,x21,'b*');xlabel(“X_1”);伊拉贝尔('X_2');子区(2,2,2)图(x13,x31,'b*');xlabel(“X_1”);ylabel('X_3');子区(2,2,3)图(x14,x41,'b*');xlabel(“X_1”);伊拉贝尔('X_4');子区(2,2,4)图(x15,x51,'b*');xlabel('X_1');伊拉贝尔('X_5');图形;x12=x2(1:端1);x12=x2(1:端1);x21=x2(2:结束);x13=x2(1:末端2);x31=x2(3:末端);x14=x2(1:末端3);x41=x2(4:末端);x15=x2(1:末端4);x51=x2(5:结束);子区(2,2,1)绘图(x12,x21,'b*');xlabel(“X_1”);伊拉贝尔('X_2');子区(2,2,2)图(x13,x31,'b*');xlabel(“X_1”);伊拉贝尔('X_3');子区(2,2,3)图(x14,x41,'b*');xlabel(“X_1”);伊拉贝尔('X_4');子区(2,2,4)图(x15,x51,'b*');xlabel(“X_1”);ylabel('X_5');
模型1的前四个滞后的散点图表明,所有四个滞后值都具有很强的正相关性。模型2的散点图表明,滞后=1的相关性略为正,其余滞后无相关性。如果我们绘制自相关函数(ACF),可以清楚地看到这种趋势。
自相关函数(ACF)或相关图
ACF图总结了不同滞后时间下时间序列的相关性。它绘制了样本图中每次滞后1个延迟的序列的相关系数。用下面的代码为两个模型的输出绘制ACF。
[x1c,滞后]=xcorr(x1100,‘coeff’);%仅绘制正滞后值-自相关是对称的阀杆(滞后(101:末端),x1c(101:端));[x2c,滞后]=xcorr(x2100,‘coeff’);阀杆(滞后(101:末端),x2c(101:端))
模型1的ACF图显示了所有滞后的强持续性。模型2的ACF图仅在滞后1处显示显著相关性(并且滞后0将明显完全相关),这与滞后散点图一致。
相关图在很小的滞后时间内几乎没有显著的峰值,对于平稳序列,会急剧中断/迅速消亡。因此,模型2产生平稳序列,而模型1不产生平稳序列。此外,模型2适用于进一步的时间序列分析。
继续阅读构造自相关矩阵…
评价此文章: (8平均票数:4.50(共5个)
本系列文章
作者的书籍