1.简介
在地球科学中,许多被研究的现象都与特定的复杂系统有关,这些系统由错综复杂的相互作用的子系统组成。这些可以适当地表示为网络,这是一种在复杂系统社区中越来越受到关注的方法[1,2]. 网络节点之间存在链路的意义取决于应用领域,但在许多情况下,它与节点之间的某种形式的信息交换有关。 这种方法已经被用于分析全球气候系统中的各种现象[三,4,5,6,7]. 有关讨论进展、机遇和挑战的最新回顾,请参阅[8]. 通常,如果感兴趣变量的局部值之间存在瞬时相关性,则通过考虑由连接连接的两个位置来构造图。 这种依赖性可以通过互信息方便地量化,互信息是一种基于熵的统计依赖性的一般度量,它考虑了耦合的非线性贡献。实际上,由于理论和数值的简单性,线性皮尔逊相关系数可能就足够了,尽管可能忽略了相互作用的非线性贡献。尤其是Donges的初期工作等强调了相互信息在探测全球气候网络重要特征方面的作用[9,10]最近更详细的工作表明,相关性图和互信息图之间的差异大多(但不一定完全)是虚假的,例如由于数据的自然和工具(与数据收集有关)非平稳性[11]. 然而,这些方法不允许评估链接和底层信息流的方向性。这促使人们使用更复杂的测量方法,也称为因果分析方法。事实上,最近有人提出,气候因果关系网络的数据驱动检测可用于推导关于大气变异性显著模式之间因果关系的假设[12,13]. 因果关系方法家族包括线性方法,如格兰杰因果关系分析[14]以及更通用的非线性方法。非线性因果关系评估的一个突出代表是条件互信息[15]尤其是以传递熵的形式[16]. 可以说,非线性方法由于其无模型性质,在理论上具有对线性方法可能只检测到部分或根本检测不到的交互形式敏感的优势。另一方面,这种优势可能会被潜在的较低精度所抵消。根据具体情况,这可能会对网络模式检测的可靠性产生不利影响。
除了一般网络模式的不确定性外,当重点在于检测时间变化时,可靠性也很重要,需要将其与研究中时间序列不同部分之间估计值的随机可变性区分开来,这是一项与包括气候研究在内的许多地球科学领域相关的任务。换句话说,在使用网络理论分析复杂动力系统之前,一个关键的初始问题是网络结构的可靠性,以及它如何取决于因果关系方法及其参数的选择。
我们研究这个问题是为了选择标准的因果关系方法,及时应用于气候网络及其变异性的研究。特别是来自NCEP/NCAR再分析数据集的地表气温数据[17,18]使用。原始数据包含10000多个时间序列,这是一个覆盖全球的相对密集的网格。为了有效地计算和可视化结果,可以方便地降低数据的维数。我们使用主成分分析,只选择与相应的空间独立但时间相关的成分相比具有显著高解释方差的成分(即.,“有色”)随机噪声。 由于因果关系网络构建的可靠性可能在很大程度上取决于因果关系估计器的具体选择,我们通过量化由平稳数据模型的独立实现重建的因果关系矩阵的相似性来测试不同的因果关系度量及其参数化。这些实现要么独立生成,要么表示单个静态实现的单个非重叠时间窗口。检测应用非线性方法的最佳参数选择,并比较线性和非线性方法构建的网络的可靠性。后一种方法,即通过比较从时间窗口重建的网络,还可以评估实际数据的网络可变性,并将其与平稳模型时间序列分析中观察到的可变性进行比较。
2.数据和方法
2.1. 因果关系评估方法
2.1.1. 格兰杰因果关系分析
评估因果关系的一种重要方法是格兰杰因果关系分析,以克莱夫·格兰杰爵士命名,他在一篇经典论文中提出了这种时间序列分析方法[14]. 然而,基本思想可以追溯到维纳[19]他提出,如果可以通过结合第二个时间序列的知识来改进对一个时间序列进行的预测,那么可以说后者对前者有因果影响。这个想法是由格兰杰在线性回归模型的背景下形式化的。在下文中,我们概述了格兰杰因果关系的评估方法,如下所示[20,21,22]. 考虑两个随机过程和假设它们是联合静止的。进一步让每个过程的自回归表示为:和联合自回归表示其中噪声项的协方差矩阵为:来自以下方面的因果影响Y(Y)到X(X)然后,当我们包括过去的Y(Y)在模型中X(X),即.,当我们从方程给出的独立模型开始时(1)公式给出的接头模型(三):同样X(X)到Y(Y)定义为:显然,以这种方式定义的因果影响总是非负面的。 因果关系统计推断概念的最初介绍[14]包括第三个(可能高度多元)过程Z轴,表示在评估两者之间的因果关系时应控制的所有其他干预过程X(X)和Y(Y)因此,为了数值稳定性以及与后面介绍的双变量传递熵(条件互信息)方法的可比性,估计器的双变量(或“两两”)实现构成了原始过程的计算简化。请参见第4节以进一步讨论相关问题。 2.2. GC估算
格兰杰因果关系的实际估计涉及将上述联合模型和单变量模型拟合到实验数据。虽然理论框架是用无穷和表示的,但拟合过程需要选择模型阶数第页用于模型。对于我们的报告,我们选择了对应于滞后1的环节,因为该滞后也是在后面考虑的非线性方法中选择的。这是文献中格兰杰因果关系的常见选择,相当于寻找滞后1时间单位的联系。
2.3. 传递熵
格兰杰因果关系的信息理论类比是传递熵(特[16]). TE可以定义为条件互信息如下所示,紧跟其后[15]. 特别是,我们可以定义X(X)原因Y(Y)如果过去的知识X(X)减少以下方面的不确定性Y(Y)(在过去的知识之上Y(Y)以及可能所有其他相关的混杂变量)。 对于两个离散随机变量使用一组值Ξ和Υ和概率分布函数和联合PDF,香农熵定义为和联合熵属于X(X)和Y(Y)作为条件熵属于X(X)鉴于Y(Y)是变量中包含的共享信息量X(X)和Y(Y)由相互信息量化定义为条件互信息变量的给定变量Z轴表示为 如果定义中的对数的基数为2,则熵和互信息以位为单位进行测量。将这些定义扩展到更多的变量,以及扩展到连续变量而不是离散变量是很简单的。
传递熵来自X(X)到Y(Y)然后对应于和有条件的:虽然这些信息理论泛函的定义非常一般和优雅,但实际估计面临着从有限大小样本中有效估计PDF的问题。重要的是要记住潜在随机过程的数量与其有限样本估计量之间的区别。 2.4. 观察到差异的潜在原因
有趣的是,可以证明,对于线性高斯过程,传输熵等价于线性Granger因果关系,直至乘法因子[23]:然而,在实践中,转移熵和线性格兰杰因果关系的估计可能有所不同。主要有两个主要原因导致了结果之间的差异。首先,当潜在过程不是线性高斯时,真实传递熵可能不同于过程的线性近似对应的真实线性Granger因果关系。传递熵和线性Granger因果关系的样本估计值之间存在差异的第二个原因是,这两个量的估计值的性质不同,特别是估计值的偏差和方差,即使对于线性高斯过程也是有效的。 2.5. TE估算
有许多用于估计信息理论泛函的算法,可以用于计算传递熵估计。估计条件互信息的两类基本非参数方法是装箱方法和公制方法前者将空间离散化为通常称为箱或盒的区域,一个稳健的例子是基于将研究变量离散化为问等量箱(EQQ[24]). 在后一种方法中,概率分布函数估计取决于使用某种度量计算的样本之间的距离。度量方法的一个示例是k个-最近邻(kNN[15,25])算法。有关条件互信息估计方法及其比较的更多详细信息,请参阅[15]. 请注意,这两种算法都需要设置一个附加参数。虽然文献中已经发表了一些启发式建议,但这些参数的合适值可能取决于应用的特定方面,包括时间序列的特征。在本研究中,我们使用了一系列参数值,随后选择了提供最稳定结果的参数值,以便与线性方法进行进一步比较,见下文。
2.6. 数据
2.6.1. 数据集
NCEP/NCAR再分析数据集的数据[17]已使用。特别是,我们利用了时间序列1948年1月至2007年12月的日平均和月平均地面气温(和时间点),在纬度采样和经度形成规则网格,步长为。位于电杆上的点已被移除,总计空间采样点。 2.6.2. 预处理
为了最大限度地减少太阳辐射引起的周期性变化所带来的偏差,去除了平均年周期以生成异常时间序列。数据进一步标准化,使得每个网格点的时间序列具有单位方差。然后,通过纬度的余弦对时间序列进行缩放,以考虑到更靠近极点的网格点,这些网格点代表较小的区域,并且更靠近一起(从而相对于相距更远的网格点偏移相关性)。因此,通过有效地删除纬度数据,可以完全忽略极点.
2.6.3. 计算组件
首先,计算预处理得到的标度时间序列的协方差矩阵。请注意,该协方差矩阵等于相关矩阵,其中每个相关性都通过进入相关性的时间序列纬度余弦乘积的倒数进行缩放。
接下来,计算协方差矩阵的特征分解。提取与真实成分相对应的特征向量(成分数量的估计将在下一段中解释)。然后使用VARIMAX方法旋转特征向量[26]. 旋转的特征向量是结果分量。每个分量都由全球范围内的强度标量场和相应的时间序列表示。请参见图1通过组件将地球分割开来。对于每个位置,使用与具有最大强度的组件对应的颜色——由于组件具有良好的空间定位和平滑度,这导致将地球分割为通常相邻的区域。
图1。使用VARIMAX旋转PCA分解确定由地表气温数据的特定成分主导的区域。对于每个位置,使用与具有最大强度的组件对应的颜色。白点表示组件的近似质量中心,在随后的图形中用于网络节点的可视化。
图1。使用VARIMAX旋转PCA分解确定由地表气温数据的特定成分主导的区域。对于每个位置,使用与具有最大强度的组件对应的颜色。白点表示组件的近似质量中心,在随后的图形中用于网络节点的可视化。
2.6.4. 估计数据的维数
为了降低维数,只选择了组件的一个子集进行进一步分析。主要思想在于通过比较从原始数据计算的特征值与从控制数据集计算的特征值来确定重要成分,控制数据集对应于与原始数据具有相同时间结构的非耦合时间序列的零假设。为了实现这一点,控制数据集中的时间序列被生成为独立拟合到每个时间序列的自回归(AR)模型的实现。使用贝叶斯信息准则分别估计每个时间序列的AR过程维数[27]. 该模型用于在控制数据集中生成10000个实现。计算并聚合每个实现的特征分解,在上述零假设下为每个特征值(第一、第二……)提供分布。然后,找到显著特征值就变成了一个多重比较问题,我们使用错误发现率(FDR)技术解决了这个问题[28]从而识别出67个组件。 出于计算原因,对月度数据进行分解,并使用生成的分量权重从相应的预处理每日数据中提取每日时间序列(异常化、标准化、余弦变换)。因此,该方法在10224点网格上提供了全分辨率组件定位,同时还生成了与每个组件相关的高分辨率时间序列。实际上,直接对每日数据进行分解可能会提供一组略有不同的成分,因为分解还将考虑到高频变化。目前的分解既有概念上的动机,也有实践上的动机。从概念上讲,它提供了有关月度数据中检测到的变异模式的高频行为的信息(气候群落中更常用的分解时间尺度)。实际原因是日常数据的矩阵需要计算,特别是与上述引导测试程序结合使用时。
2.7. 网络建设
形式上,在图形理论方法中,网络由图形表示,其中V(V)是的节点集克,是节点数是的边(或链接)集克在加权图中,连接节点的每条边我和j个可以指定权重表示链接的强度。因此,成对因果关系矩阵包含个条目可以理解为加权图。通常,通过适当的阈值将图转换为未加权矩阵,只保留权重高于某个阈值的链接(并将其权重设置为1),同时删除较弱的链接(将其权重设为零)。
选择阈值有三种主要策略。人们可以根据专家对构成强链接的因素的判断来选择一个固定值,或者自适应地强制执行所需的图形密度(相对于最大可能数量的链接相对数量,即.,在给定大小的完整图形中)。第三种选择是使用统计测试来检测具有统计意义的链接。在本文中,我们从原始的无阈值图开始,但也提供了使用上述方法的阈值图的示例结果。
2.8. 可靠性评估
根据心理测量学或经典测试理论的术语,可靠性是指测量的总体一致性(这里的一致性并不意味着渐近行为的统计意义)。在网络构建的背景下,我们认为如果由相同动态过程的不同样本构建的网络彼此相似,则方法是可靠的。请注意,这并不一定意味着方法的有效性或准确性——在某些情况下,方法可能总是会得到错误的结果。在某种程度上,可靠性/一致性可以被视为有效性的第一步。实际上,即使有效性是毋庸置疑的,可靠性也可以给研究者一个关于他/她对结果再现性的信心的估计。
为了评估两个矩阵的相似性,有许多方法可用,包括(入门级)皮尔逊线性相关系数。因果关系矩阵的检查表明,这些值具有严重的非正态分布,且有许多异常值。因此,使用斯皮尔曼相关系数进行等级相关性可能更合适。
除了全加权因果图的可靠性外,我们还研究了由阈值法导出的未加权图。根据因果关系矩阵的检查,选择0.01的密度(保持1%的最强链接)进行分析。为了评估两个二元矩阵的相似性,我们使用了Jaccard相似系数。这是矩阵共享的链接相对于至少出现在其中一个矩阵中的链接总数的相对数量。这样的比率是矩阵重叠的自然度量,范围从没有公共链接的矩阵的0到相同矩阵的1。
2.8.1. 模型
评估时间序列方法可靠性的一种方便方法是比较从不同时间窗口获得的结果。然而,从理论上讲,结果之间的差异可归因于该方法缺乏可靠性以及基础系统随时间的假设真实变化(非平稳性)。
因此,为了隔离方法属性的影响,我们在真实但平稳的数据模型上测试这些方法。为了提供这种潜在非平稳数据的平稳模型,构造了替代时间序列。
从技术上讲,替代时间序列可以方便地构造为多元傅里叶变换(FT)替代[29,30]. 它们是通过首先对级数进行傅立叶变换并保持傅立叶系数(振幅谱)的幅度不变来计算的。然后将相同的随机数加到同一频率段的系数相位上,替代项是时域的逆傅里叶变换。 替代数据表示线性平稳过程的实现,该过程保留了原始数据的线性结构(协方差和自方差),因此也保留了因果关系的线性成分。请注意,因果关系的任何非线性成分都应删除,因此非线性方法应收敛到线性方法(如第2.1节). 在对平稳线性模型进行可靠性测试后,我们还对实际数据评估了这些方法的稳定性。这里的变异性应反映出方法的非可靠性和真实气候变化的混合。注意,由于数据中的非线性因果关系,非线性方法可能与线性方法不同。
2.8.2. 实施详细信息
为了进行估计,平稳模型和实际数据时间序列被分成6个窗口(每十年一个,即.,约3650个时间点)。对于每个窗口,因果关系矩阵已经用几种因果关系方法进行了估计。
特别是,我们使用成对格兰杰因果关系作为代表性的线性方法,并使用一系列关键参数值通过两种标准算法计算传递熵。第一种是基于将研究变量离散化为问等量箱(EQQ[24],)第二个是k个-最近邻算法(kNN[15,25],). 每种算法都提供了各自十年内67个气候成分之间的因果关系估计矩阵。我们进一步评估了这些矩阵在时间和方法上的相似性,首先是在平稳数据中(时间变化仅归因于方法不稳定性),然后是在实际数据中。除了直接可视化外,构建的因果关系矩阵的相似性还通过非对角项的Spearman秩相关系数进行量化。然后将可靠性估计为所有数据的平均Spearman秩相关系数时间窗口对。
为了检查结果的稳健性,重复分析,并对方法进行了一些可能的修改。首先,用Jaccard相似系数代替Spearman秩相关系数来评估阈值图而不是未加权图之间的相似性。其次,我们使用线性多元AR(1)过程重复了分析,以生成平稳模型,而不是傅里叶替代。第三,对亚抽样数据重复分析(每6天平均一次,得出一个数据点)。这样,同样的方法应该在更长的时间尺度上提供因果关系。为了保持相同(且足够高)的时间点数量,未将子采样数据划分为窗口,但通过拟合的多元AR(1)过程生成了6个实现。
最后,为了评估不同方法的可靠性对统计推断的作用,我们测试了该方法与对应于独立线性过程的经验分布相比能够在统计上区分的链接数。通过计算一组单变量傅里叶替代。在过程之间无依赖性的假设下,给定变量对的数据因果关系值在20个可用值中的概率最高,为,提供了一种方便的因果关系非参数检验。
3.结果
3.1. 加权因果网络
根据十年的平稳模型数据计算的加权因果网络的可靠性如所示图2(对于所有方法和参数值),以及每种方法的非线性网络估计值与线性Granger因果关系方法获得的估计值的平均相似性。线性格兰杰因果关系的可靠性最高,平均斯皮尔曼秩系数为等量化装仓方法为(),可靠性通常会因较大而降低问。k-最近邻算法提供了更不可靠的网络估计,仅对k个和最佳可靠性对于.
图2。使用不同因果估计的因果网络检测的可靠性,以及使用傅里叶替代模型的线性因果网络估计的相似性。对于每个估计器,估计六个因果关系网络,每十年一段模型平稳数据(原始数据的傅里叶替代实现)。黑色:横条的高度对应于所有15对十年中斯皮尔曼的平均相关性。怀特:条形图的高度对应于60年来非线性因果网络和线性因果网络的平均斯皮尔曼相关性。
图2。使用不同因果关系估计器的因果关系网络检测的可靠性,以及使用傅立叶代理模型的线性因果关系网络估计的相似性。对于每个估计器,估计六个因果关系网络,每十年一段模型平稳数据(原始数据的傅里叶替代实现)。黑色:横条的高度对应于所有15对十年中斯皮尔曼的平均相关性。怀特:条形图的高度对应于60年来非线性因果网络和线性因果网络的平均斯皮尔曼相关性。
将每种非线性方法构建的因果网络与使用线性Granger因果分析获得的因果网络进行了比较,参见图2一般来说,对于平稳模型时间序列的不同部分,非线性因果网络与线性估计相比,具有更高的相似性。有趣的是,优化可靠性的参数设置也提供了(几乎)与线性方法最接近的结果。我们还观察到,对于奇数,EQQ方法的可靠性普遍较低问-值,这一影响将在其他地方进行详细调查。 图3显示了对原始数据而非平稳模型进行的类似分析的结果。注意,这里计算出的因果网络相似性反映了方法的(缺乏)可靠性和时间序列动态特性的实际可变性的结合(即因果关系模式的真正变化)。结果在定性和定量上与图2这表明,与因果关系评估方法的粗糙度相比,该时间尺度上因果关系网络的真实可变性可能很小。 其他设置的结果如所示图4(使用多元AR(1)作为平稳模型)和图5(6天平均值),通常证实了主要观察结果。然而,可以观察到一些差异。例如,在6天平均数据中,kNN方法的可靠性依赖于k个-参数更明显,峰值更高.提高了EQQ方法的可靠性问被发现是虚假的,并在中进行了讨论第4节.
图3。使用不同因果关系估计器的因果关系网络检测的可变性以及原始数据与线性因果关系网络估计的相似性。对于每个估计器,估计六个因果关系网络,每十年一个数据。黑色:横条的高度对应于所有15对十年中斯皮尔曼的平均相关性。怀特:条形图的高度对应于60年来非线性因果网络和线性因果网络的平均斯皮尔曼相关性。
图3。使用不同因果关系估计量的因果关系网络检测的可变性以及原始数据与线性因果关系网络估计的相似性。对于每个估计器,估计六个因果关系网络,每十年的数据估计一个因果关系网络。黑色:横条的高度对应于所有15对十年中斯皮尔曼的平均相关性。怀特:条形图的高度对应于60年来非线性因果网络和线性因果网络的平均斯皮尔曼相关性。
图4。使用不同因果估计量的因果关系网络检测的可靠性以及作为原始数据的多元AR(1)替代物构建的平稳模型与线性因果关系网络估计的相似性。对于每个估计器,估计了六个因果网络,每十年一个对应于建模的平稳数据。黑色:横条的高度对应于所有15对十年中斯皮尔曼的平均相关性。怀特:条形图的高度对应于60年来非线性因果网络和线性因果网络的平均斯皮尔曼相关性。
图4。使用不同因果关系估计器进行因果关系网络检测的可靠性,以及作为原始数据的多元AR(1)代理构建的平稳模型与线性因果关系网络估计的相似性。对于每个估计器,估计了六个因果网络,每十年一个对应于建模的平稳数据。黑色:横条的高度对应于所有15对十年中斯皮尔曼的平均相关性。怀特:条形图的高度对应于60年来非线性因果网络和线性因果网络的平均斯皮尔曼相关性。
图5。使用不同因果估计量的因果关系网络检测的可靠性以及作为原始数据的多元AR(1)替代物构建的平稳模型与线性因果关系网络估计的相似性。对于每个估计器,估计了六个因果网络,每个因果网络用于拟合原始数据的多元AR(1)过程的单独实现。黑色:横条的高度对应于所有15对十年中斯皮尔曼的平均相关性。怀特:条形图的高度对应于60年来非线性因果网络和线性因果网络的平均斯皮尔曼相关性。
图5。使用不同因果估计量的因果关系网络检测的可靠性以及作为原始数据的多元AR(1)替代物构建的平稳模型与线性因果关系网络估计的相似性。对于每个估计器,估计了六个因果网络,每个因果网络用于拟合原始数据的多元AR(1)过程的单独实现。黑色:横条的高度对应于所有15对十年中斯皮尔曼的平均相关性。怀特:条形图的高度对应于60年来非线性因果网络和线性因果网络的平均斯皮尔曼相关性。
3.2. 未加权因果网络
对于未加权的因果网络,在阈值化以保持1%的最强链接后,通过Jaccard相关系数评估网络相似性。结果如上图所示绘制,请参见图6.
图6。使用不同因果估计的因果网络检测的可靠性以及与线性因果网络估计的相似性。对于每个估计器,估计了六个因果网络,每十年一个对应于建模的平稳数据。黑色:横条的高度对应于所有15对几十年来雅卡的平均相似系数。白色:条形的高度对应于60年来非线性因果网络和线性因果网络的平均Jaccard相似系数。
图6。使用不同因果估计的因果网络检测的可靠性以及与线性因果网络估计的相似性。对于每个估计器,估计六个因果关系网络,每十年的建模平稳数据估计一个因果关系网络。黑色:横条的高度对应于所有15对几十年来雅卡的平均相似系数。白色:条形的高度对应于60年来非线性因果网络和线性因果网络的平均Jaccard相似系数。
3.3. 组件和结果网络
为了使气候网络可视化,我们首先概述了中的网络定位图1显示了地球与组件的划分。由于数据中几十年的可变性未被证明显著高于平稳线性替代模型(比较图2和图3)并且似乎主要对应于随机波动,因果矩阵很好地由其平均值表示,如下所示。有关每个时间窗口的详细结果,请参阅补充资料。在图7,给出了因果关系网络中100个最强链接的图,该图使用线性格兰杰因果关系计算,并在60年内进行了平均。为了进行比较,使用EQQ获得的因果关系网络如所示图8。平均线性和非线性因果图中100个最强链接之间的重叠相对较高,图中的100个链接中有91个是相同的。在这两张图中,检测到的链接主要位于热带以外地区。在这些纬度的海洋区域,主要的向东方向与预期的环流方向一致;这主要表现在北太平洋和南大西洋。然而,许多检测到的交互是双向的。穿越赤道的长连接可能是假的。
图7。通过对分解数据(67个成分以质心表示)六十年(总时间跨度1948-2007年)的结果进行平均而获得的因果关系网络。只显示了100个最强的链接。每十年,网络都是通过线性格兰杰因果关系进行估计的。
图7。通过对分解数据(67个成分以质心表示)六十年(总时间跨度1948-2007年)的结果进行平均而获得的因果关系网络。只显示了100个最强的链接。每十年,网络都是通过线性格兰杰因果关系进行估计的。
图8。通过对分解数据(67个成分以质心表示)六十年(总时间跨度1948-2007年)的结果进行平均而获得的因果关系网络。只显示了100个最强的链接。每十年,使用等分法通过(非线性)传递熵估计网络.
图8。通过对分解数据(67个成分以质心表示)六十年(总时间跨度1948-2007年)的结果进行平均而获得的因果关系网络。只显示了100个最强的链接。每十年,使用等分法通过(非线性)传递熵估计网络.
4.讨论
一系列检验证明,非线性和线性方法均可用于在一系列设置下可靠地构建定向气候网络,基本的线性格兰杰因果关系优于所研究的非线性方法。在非线性因果关系方法方面,我们重点讨论了基于传递熵形式的条件互信息估计的突出方法家族。使用了两种算法,这两种算法代表了估计条件互信息的关键方法,并在实际数据中得到了广泛应用和证明。也存在替代方法,包括使用重现图[31]. 事实上,为了便于处理,我们在几个方面限制了调查。由于本研究的动机是探索在因果气候网络构建中使用线性/非线性方法的基本原理,并为更详细的气候网络分析提供基础,因此主要为了测试方法的差异,做出了一些简单实用的方法选择,而不是研究特定的现象。
最突出的是,选择线性格兰杰因果关系是因为其理论等价于传递熵(在线性假设下),因为这提供了一个公平的比较。然而,严格两两因果关系估计的使用受到了严重的固有限制。举个例子,一个由三个过程组成的系统,其中Z轴驱动两者X(X)和Y(Y),但具有不同的时间滞后,可能会错误地显示X(X)和Y(Y)即使这些不是直接耦合的。为了处理这种情况,这些概念可以推广到多元情况[32]. 在线性格兰杰因果关系的情况下,这导致拟合多元线性过程,包括X(X)和Y(Y),也是一个(可能是多变量)Z轴. 另一方面,在模型中包含太多变量是有代价的,因为对于短时间序列,包含可能的共同原因的理论优势可能会被拟合高阶模型的数值不稳定性所抵消。在图9我们包括一个应用全多元线性Granger因果关系的示例结果,其中每对的成对因果关系考虑了所有其他65分量时间序列解释的可变性。请注意,通过简化的二变量线性Granger因果关系恢复的许多联系都得到了恢复(见图7)然而,多元模型导致检测到许多跨越赤道的长距离链路,这些链路可能是虚假的,这是算法可靠性较低的结果。定量地说,从60年的线性替代数据中获得的多元线性格兰杰因果矩阵之间的平均相似性(斯皮尔曼秩相关系数)为,与相比得到了简化的二元线性格兰杰因果关系。我们没有为非线性方法提供类似的结果,因为在全多元环境中估计信息理论泛函在计算上非常困难。
图9。通过对分解数据(67个成分以质心表示)六十年(总时间跨度1948-2007年)的结果进行平均而获得的因果关系网络。只显示了100个最强的链接。每十年,该网络都通过完全多元线性格兰杰因果关系进行检测。
图9。通过对分解数据(67个成分以质心表示)六十年(总时间跨度1948-2007年)的结果进行平均而获得的因果关系网络。只显示了100个最强的链接。每十年,该网络都通过完全多元线性格兰杰因果关系进行检测。
同样,单一可能滞后的假设(在我们的调查中,1个时间步长分别为1天或6天)可能不适用于实际情况,尽管在合理的参数范围内,不同方法的相对可靠性可能不会受到这一假设的强烈影响。为了进行精确的地球物理解释,需要拟合适当的模型顺序并允许多重滞后。
通常,从相对较短的时间序列中估计这些广义因果关系模式在技术上具有挑战性,特别是在基于信息理论的非线性因果关系测量的背景下,因为要估计的概率分布的维数呈指数级增加。然而,最近的工作通过将TE分解为低维贡献,为解决这种维数灾难提供了有希望的方法[32]. 有关如何在多元环境中定义因果耦合强度的理论和数值考虑,请参见[33]. 评估这些新方法在因果气候网络检测中的性能是未来工作的主题。为了完整起见,我们提到,除了因果关系的时域处理外,整个问题也可以在谱域中重新表述,导致频率重解因果关系指数,如部分定向相干(PDC[34])或定向传递函数(DTC[35]). 我们的研究还显示了条件互信息估计的一些关键性质。请注意,例如,对于6天网络(图5),EQQ方法的可靠性再次提高然而,与线性估计的相似性进一步降低。对因果关系网络的直接检查表明,它们趋向于一个简单的列式结构,每列的强度与给定时间序列的自回归系数高度相关。这对应于EQQ估计器中占主导地位的自相关相关偏差过高的表现问值(注意对应于4D仓中每个平均值少于一个时间点、用于有效概率分布函数近似的空间的不合适采样)。 直接从网格化气候场数据重建网络具有挑战性,可能并不总是最佳方法,原因包括高效计算和结果可视化。相反,我们在这里对数据进行分解,以获得最重要的组件,即通过使用方差最大主成分分析。这为所研究的问题提供了有用的降维方法。特别是,网格化数据并不能反映真实的气候子系统,而分解模式可以更好地近似真实气候子系统。然而,由于分解是隐式(加权)粗粒度,线性和非线性方法之间检测到的差异可能与原始时间序列数据中的差异不同。特别是,空间平均可以通过抑制噪声来提高这两种方法的可靠性,但也可以抑制任何高度空间局部化的非线性和线性异质模式。这可能反映在论文的具体结果中,尤其是获得的定量可靠性估计。
为了评估结果如何推广到网格数据,我们使用由162个空间位置组成的近似等距网格进行了部分分析。通过去除均值和方差中的异常对时间序列进行预处理。网格化数据的可靠性评估显示了定性相似的结果,参见图10对于成分数据,线性Granger因果关系被证明是最可靠的,并且对于具有少量箱的非线性条件互信息也获得了相对可靠的结果(). 可靠性的总体下降可能是由于组合或更大的矩阵尺寸和不太复杂的降维策略。kNN算法没有在此数据上进行评估,以限制额外的计算时间需求。线性和非线性因果关系的平均图如所示图11和图12分别是。有趣的是,空间稀疏性可能更适合于1天滞后因果关系估计,因为检测到的平均因果关系图具有更容易解释的结构。特别是,在热带以外地区检测到的信息流的方向大约介于和在两个半球,几乎毫无例外地类似于费雷尔环流圈(中纬度西风带)中盛行的东向空气环流。另一方面,特别是图11对于更稳健的线性格兰杰因果关系方法,对应于最强200个链接的检测到的信息流方向还包括热带地区(例如太平洋地区)向西的许多箭头,这些箭头可能对应于哈德利信元对应地区的东风信风。
图10。使用不同因果估计量的因果网络检测的可靠性以及傅里叶代理模型与线性因果网络估计的相似性。对于每个估计器,估计了六个因果网络,其中一个网络用于模型平稳数据的每十年部分(原始数据的傅里叶替代实现)。黑色:横条的高度对应于所有15对十年中斯皮尔曼的平均相关性。怀特:条形图的高度对应于60年来非线性因果网络和线性因果网络的平均斯皮尔曼相关性。
图10。使用不同因果估计量的因果网络检测的可靠性以及傅里叶代理模型与线性因果网络估计的相似性。对于每个估计器,估计了六个因果网络,其中一个网络用于模型平稳数据的每十年部分(原始数据的傅里叶替代实现)。黑色:横条的高度对应于所有15对十年中斯皮尔曼的平均相关性。怀特:条形图的高度对应于60年来非线性因果网络和线性因果网络的平均斯皮尔曼相关性。
图11。通过对网格化数据(162个空间位置)六十年(总时间跨度1948年至2007年)的结果进行平均,获得因果关系网络。只显示了200个最强的链接。每十年,网络都是通过线性格兰杰因果关系进行估计的。
图11。通过对网格化数据(162个空间位置)六十年(总时间跨度1948年至2007年)的结果进行平均,获得因果关系网络。只显示了200个最强的链接。每十年,网络都是通过线性格兰杰因果关系进行估计的。
图12。通过对网格化数据(162个空间位置)六十年(总时间跨度1948年至2007年)的结果进行平均,获得因果关系网络。只显示了200个最强的链接。对于每十年,网络都是通过(非线性)条件互信息来估计的,使用等分法.
图12。通过对网格化数据(162个空间位置)六十年(总时间跨度1948年至2007年)的结果进行平均,获得因果关系网络。只显示了200个最强的链接。对于每十年,网络都是通过(非线性)条件互信息来估计的,使用等分法.
一般来说,可靠性的差异可能对因果关系的可检测性及其变化产生重要影响。当然,理论上这是不必要的,因为非线性系统可能具有线性因果关系可以忽略但足够强的非线性因果关系指纹的链接。最近的工作已经提出了显式量化等时间相关性的非线性贡献的方法[36],应用于神经科学[36]以及气候数据[11]. 然而,对更高维信息理论泛函的推广并不简单,这是正在进行的工作的主题,我们在这里给出了传递熵的普遍性和线性格兰杰因果关系的更高可靠性之间权衡的至少一个示例:使用原始的67个成分数据(分为6个十年期部分,参见第2节)5%显著水平的基本统计检验(如第2节)平均有1592个链接被标记为具有统计显著性(可能有4422个链接),而EQQ方法通常显示出较低的显著链接数,这取决于参数值,其方式类似于可靠性估计值,最多有983个显著链接以及至少287个重要链接注意,考虑到测试的平均显著性水平在完全无关的过程集合中,可能会偶然出现重要的链接。 5.结论
对气候网络及其观测到的时间变异性进行有意义的解释需要了解并尽量减少方法的局限性。在本工作中,我们从有限长的时间序列讨论了网络构建的可靠性问题,定量评估了一系列标准的二元因果关系方法的可靠性。其中包括两种主要算法,用于估计具有广泛参数选择的传递熵,以及线性Granger因果分析,可以理解为传递熵的线性近似。总的来说,因果关系方法提供了气候因果关系网络的可重复估计,线性近似的可靠性优于所研究的非线性方法。有趣的是,根据所调查的气候再分析数据的近线性假设,特别是地表气温时间序列,在可靠性方面优化非线性方法,使得检测网络与线性方法发现的网络的相似性提高。
关于地表气温的后一种假设得到了年研究的支持[11]它扩展了以前的结果[37]他测试了空间站(布拉格-克莱门提姆)SAT时间序列的动力学中可能存在的非线性,发现SAT时间系列之间的相关性和它滞后的双胞胎被线性随机过程很好地解释了。关于SAT时间序列时间演变的线性特征的这一结果,以及本研究的结果,不能理解为大气动力学线性特征的论据就其本身而言相反,这些结果以特别粗略的分辨率水平表征测量或再分析数据的特性。因此,这些数据反映了动态过程在空间和时间上的平均混合。例如,通过对温度和其他气象数据中特定时间尺度的动力学进行更深入的研究,发现了具有非线性行为的振荡现象,表现出相位同步[38,39,40,41,42]. 大气变率的主要模式也表现出非线性行为[43,44]并且可以利用条件互信息推断耦合的方向性。以非线性的方式[45]. 需要进一步的工作来评估更复杂的、最近提出的因果关系估计方法的可用性和优势。目前的工作还为可靠描述气候网络和检测随时间变化的潜在变化迈出了重要一步。