总结

我们考虑稀疏空间混合线性模型,特别是Besag和Higdon描述的模型,并开发了一个小时-统计推断的似然法。所提出的方法允许使用奇异精度矩阵,因为它根据数据的适当差分产生与剩余最大似然估计值一致的估计值,并且具有通过伽马线性模型估计精度参数的新方法。此外,我们推广了小时-通过显式使用规则阵列上高斯内禀马尔可夫随机场和德维伊斯过程之间的标度极限连接,包含连续空间变化的似然方法。考虑到空间混合线性模型的各种应用,我们设计了一种新的稀疏共轭梯度算法,使我们能够实现快速的无矩阵统计计算。我们提供两种应用程序。第一个是对农业品种试验的广泛分析,该试验提出了最近邻调整的各种新方面,例如对规模变化的统计分析的影响和隐式连续体空间公式的使用。第二个应用程序涉及对大型棉田的分析,重点是无矩阵计算。本文以一些进一步的考虑作为结束,例如对不规则间隔数据的应用、参数引导的使用以及对高斯-马特恩混合效应模型的一些推广。

1.简介

贝萨格和希格顿的基础工作(1999)农业田间试验的空间分析一直令人鼓舞,尤其是因为它认识到了通过连续随机场进行推断和建模的剩余最大似然(REML)方法的重要性,但未能充分研究该方法,由于当时缺乏某些方法学发展和理论框架,他们受到了阻碍。鉴于McCullagh的后续作品(2002)、贝萨格(2002)、贝萨格和蒙达尔(2005)还有McCullagh和Clifford(2006)Lee和Nelder通过连续随机场为空间建模提供了新的视角(1996,2001)和Lee. (2006)恢复了亨德森的(1950,1975)小时-具有相关随机效应的线性模型推断的似然方法。我们将看到,这些工作共同为我们自己的探索铺平了道路,为空间混合线性模型开发了一种新颖的REML推理程序,该程序不仅可以涵盖Besag和Higdon中讨论的线性模型(1999)除某些其他模型外,还包括相应的连续体随机场模型。

因此,本文主要关注的是农业品种试验的空间分析。通常,在品种试验中,一种作物的品种数量不同n个不同的情节。除非另有说明,我们假设n个图的形状为矩形,大小相等,并嵌入第页 1×第页 2矩形图阵列D类1.作为试验结果,我们观察到作物产量矢量从单独收获这些n个不同的情节。虽然主要目标是在适当调整土壤肥力的局部变化后,准确估计品种效应及其标准误差,但次要目标是对潜在的土壤肥力变化有一些了解。在这里,我们旨在提供新的视角(理论和计算)来实现这些目标。为此,我们将重点放在贝萨格和希格顿提出的相同的混合线性模型上(1999),但稍作修改以控制土壤肥力的局部变化:不仅在实际地块规模上,而且在不同的子地块规模上。具体来说,我们将每个情节划分为×子地块和考虑混合线性模型
=T型τ+F类ψ+ε,
(1)
哪里τ是固定或随机变量或治疗效果的向量,T型是已知的吗n个×确定在哪个地块上种植哪个品种的设计矩阵,ψ是平均肥力的矢量第页×c(c)(其中第页=第页 1 c(c)=第页 2 )子批次数组D类,F类是由实际物理布局或子批次位置确定的已知平均矩阵,以便F类ψ返回平均肥力向量n个现场试验中使用的地块和ɛ表示地块产量的剩余波动向量,不能仅用定期变化的土壤肥力来解释。根据它们的结构T型F类是这样的T1类=一层楼=1此外,我们假设这些剩余波动是高斯的,即。
εN个(0,λ负极1n个)
(2)
带精度参数λ空间生育率效应遵循一阶高斯内禀自回归,其(不适当的)分布形式为
|W公司|+1/2经验(负极12ψT型W公司ψ)
具有
ψT型W公司ψ=λ10(ψ, j个负极ψ负极1, j个)2+λ01(ψ, j个负极ψ, j个负极1)2.
(3)
在这里W公司是一个奇异精度矩阵|W公司|+表示的非零特征值的乘积W公司、和λ10和λ01是两个固定但未知的正精度参数。
必须强调的是,上述空间生育率模型的有效性来源于以下事实:ψ, j个-值,
E类(ψ, j个|)=(12负极αψ)(ψ, j个负极1+ψ, j个+1)+αψ(ψ负极1, j个+ψ+1, j个),无功功率,无功功率(ψ, j个|)=1/(2λψ)
其中,对于内部子地块,2α ψ= λ10/(λ1001)和λψ= λ1001(类似的表达式适用于边界子地块)。换句话说,有条件地影响所有其他子情节效果,ψ ,j个代表子地块的平均生育率(,j个),围绕其相邻子地块平均生育率值的加权平均值波动。因此,混合线性模型(1)和(3)可以直接解释子地块尺度上的最近邻生育率调整。我们指的是巴特利特(1978)肯普顿和豪斯(1981)威尔金森. (1983)贝萨格和肯普顿(1986)Stroup和Mulitze(1991)、Stroup. (1994)、贝萨格和格林(1993)以及Besag和Higdon(1999)获取农业田间试验中最近邻生育率调整方法的历史和方法学发展的迷人细节。我们考虑子地块比例而非实际地块比例的原因是→ ∞, 每个子情节的规模都在缩小,贝萨格和蒙达尔的作品也在缩小(2005)表明,在通过极限时,模型(1)模拟了基于各向异性de Wijs过程和白噪声的连续随机场模型。因此,作为缩放极限出现的连续体模型包括McCullagh和Clifford的共形模型(2006)作为一个特例,对实践有着特殊的兴趣。的确,麦库拉和克利福德(2006)通过实证研究发现了大量证据,证明他们的保形模型充分描述了广泛一致性试验中的生育率变化,因此,如果采用Zimmerman和Harville提出的替代随机场分析,则几乎没有优势(1991). 通过在子地块尺度上引入最近邻生育率调整,我们旨在探索统计推断对尺度变化的稳健性,并促进对相应连续体随机场模型的有用近似。显然,这连接了两种对比鲜明的空间统计方法,即马尔可夫随机场和地质统计学。

在节中2,我们简要讨论了如何利用数据差分的思想,对混合模型(1)-(3)改进传统的频域推理方法。此方法是Besag和Kempton工作的基本扩展(1986)一维最近邻生育率调整。然而,正如我们将要看到的,contra Besag和Kempton(1986)模型(1)-(3)中最近邻空间生育率调整的统计推断可能会带来巨大的计算挑战,除非谨慎行事。

因此,在章节中4,我们采用稍微修改的方法,提出了一种新的小时-采用谱表示的似然法W公司以及Lee和Nelder的开创性作品(1996,2001)和Lee. (2006)它使用两个广义线性模型(GLM)将REML估计与最佳线性无偏预测器(BLUP)计算相结合。通常,似然被定义为一组参数值的函数,由给定参数值的观测数据的条件概率分布产生,并产生所谓的似然原理。小时-然而,似然是一组参数值和随机效应值的函数,它是由观测数据和在对参数值集进行条件处理后的随机效应值联合概率分布产生的。与似然函数不同小时-似然不会导致任何推理原则,但对于高斯混合线性模型,最大化小时-似然函数导致统计计算的简化。因此,使用小时-本文中的似然方法不应被视为一种形式化的推理原则;相反,我们使用这种方法是为了方便有效的计算,并从新的角度研究空间混合模型的统计推断。特别是,我们提出的方法允许奇异精度矩阵,并产生易于计算的估计,这些估计与从第2此外,调整后的轮廓小时-Lee和Nelder推荐的可能性(1996,2001)和Lee. (2006)允许我们通过一个新的伽马线性模型导出精确参数的REML估计。此外,通过采用佩奇和桑德斯的作品(1975,1982)和Borici(2000)关于Lanczos算法,以及Hutchinson的工作(1989)在随机迹近似的基础上,我们推导了一些算法,这些算法允许我们实现快速的无矩阵统计计算。这些计算取代了Rue和Held提出的当前最先进的Cholesky分解方法(2005)用于各种大型空间应用。

我们致力于部门5为研究推理对尺度变化的稳健性提供一些理论视角。根据Besag和Mondal中给出的渐近展开式进行近似变异函数计算(2005),我们推导了一些理论上的理由,解释为什么治疗对比度的估计值应该保持不变,以适应规模的变化。这些计算为最初在贝萨格和希格顿提出的主张提供了一些支持(1999)只有实际的地块规模才是重要的,并进一步揭示了四分之一地块规模的分析可以提供的结果往往与基于连续随机场模型的结果非常一致。

在节中6,我们提供了两个应用程序。首先是对农业品种试验的广泛分析。在这里,我们使用原始、半个、四分之一和八个地块尺度的生育率模型来分析数据,并使用第节中开发的无矩阵计算来获得REML估计值4我们发现,治疗效果对比度的估计值确实与尺度的变化保持不变,并且当我们在四分之一或八分之一地块尺度上应用最近邻调整时,在预测空间生育率和剩余效应方面有明显的定性改进。对精度参数的估计表明,空间分析在这方面的作用非常关键,因为该领域存在显著的当地肥力变化。第二个应用涉及对一个大棉田的分析,重点是我们的无矩阵计算。

我们在第节中进一步讨论了排序和选择、bootstrap方法的适应和随机治疗效应模型7最后,我们讨论了无矩阵计算在各种其他空间应用中的潜在用途和扩展。最后,可以从中获得数据和一些初步的MATLAB代码

http://wileyonlinelibrary.com/journal/rss-datasets

2.品种试验中混合模型的推断

混合模型(1)-(3)的基本笨拙来自以下事实ψ没有适当的分布,如精度矩阵W公司有一个等级缺陷。然而,所有的对比ψ具有适当的分布,因此,为了对混合模型(1)-(3)提供任何有意义的解释,我们必须考虑数据的(一阶)差异。因此,我们让C 0表示(n个− 1) ×n个等级对比矩阵(C 0) =n个−1和C 0 1=0那么混合模型(1)更好地表示为
C0=C0T型τ+C0F类ψ+C0ϵ,
(4)
其中两者都是C 0 T型C 0 F类是对比矩阵。这意味着C 0 F类ψ有适当的分配
C0F类ψN个(0,C0转发负极F类T型C0T型),
其中色散矩阵C0转发负极F类T型C0T型在的选择下是不变的-反向W公司 负极属于W公司。通常,从C 0 因此,这样的减少只会从模型中移除整体效果。换句话说,在不造成任何损失的情况下,我们可以估计品种和生育效应的对比,并从模型(4)中获得有意义的推断。原则上,估计问题的频率法可以分为三个部分。首先,对于固定精度参数,我们估计固定效果的对比度τ通过的边际分布C 0 第二,对于固定τ,我们估计了空间生育效应的对比度ψ通过其BLUP;参见Robinson示例(1991). 第三,通过最大化REML估计精度参数;参见Patterson和Thompson的例子(1971),哈维尔(1977),挖掘(1988)和McCullagh(2006). 此外,根据亨德森的建议(1950,1975)我们可以通过最大化联合分布将前两部分结合起来C 0 C 0 F类ψ。无论遵循什么程序,基本上都是最佳线性无偏估计量(BLUE)τ和BLUP对比ψ通过求解广义最小二乘估计方程得到
T型T型D类0T型T型T型D类0F类F类T型D类0T型F类T型(D类0+λ负极1C0T型G公司0负极1C0)F类τ^ψ^=T型T型D类0F类T型D类0,
哪里D类0=C0T型(C0C0T型)负极1C0G公司0=C0转发负极F类T型C0T型是的协方差矩阵C 0 F类ψ此外,REML函数的两倍形式为
2(λ)=负极日志{det(探测)(H(H)0)}负极日志{det(探测)(T型T型C0T型H(H)0负极1C0T型)}负极T型C0T型P(P)0C0,
哪里H(H)0=λ负极1C0C0T型+G公司0P(P)0=H(H)0负极1负极H(H)0负极1C0T型(T型T型C0T型H(H)0负极1C0T型)负极1T型T型C0T型H(H)0负极1最后,通过评分方程最大化上述REML对数似然,提供了精度参数的估计值。

然而,必须强调的是,除非以谨慎的方式进行,否则上述统计计算可能会因ψ生长。关键是,即使是较小的值,实际上不可能计算或存储任何矩阵G公司 0,H(H) 0P(P) 0直接。这对如何求解上述广义最小二乘估计方程或REML评分方程提出了巨大挑战。因此,在下文中,我们考虑通过采用W公司以及Lee和Nelder的作品(1996,2001)和Lee. (2001). 我们将看到,提出的方法有效地利用了精度矩阵中的稀疏结构W公司并产生与从模型(4)中获得的估计一致的易于计算的估计。

我们以农业田间试验REML计算的一些一般性评论结束本节。这并不是说REML或连续随机田间方法从未应用于农业田间试验。事实上,继Gleeson和Cullis之后(1987)、卡利斯和格里森(1991)、吉尔穆尔. (1995,1997)和库利斯. (1998)目前,已有大量且不断增长的统计文献,通过采用一类基于各种一维自回归综合移动平均和其他模型的可分离随机场,在众多农艺田间试验数据中常规实施REML。如果不提及吉尔穆尔的作品,对这一文学体系的调查将是不完整的. (1995)他提供了一种新的方法来近似REML信息矩阵,值得更多的关注。然而,必须指出的是,在几个方面,可分离的随机域是相当不现实的,它们在现场试验分析中的使用受到了一些批评。首先,可分离随机田地最独特的特征是,它们在规则数组上的实现模拟了棋盘格模式,原则上,在标准农艺实践中很难解释这种模式,除非主要决定肥力的是沿着田地的行和列耕种。第二,正如Stein所指出的那样(1999)还有McCullagh和Clifford(2006)对于任何可分离的随机场,过度依赖于轴的选择都可能导致奇异的预测特性。第三,人们普遍担心,由于文献中提出的某些精细的可分离模型过拟合,显著的治疗效果可能被抵消;比如看贝萨格和希格顿的反驳(1999).

3.通过估算小时-可能性

我们把任务分成四部分。首先,我们计算出W公司深入了解空间生育率组成部分的所有对比的表示。其次,通过采用W公司扩大Lee和Nelder的途径(1996,2001),我们导出了治疗效果对比的BLUE和生育效果对比的BUUP。第三,我们讨论了精度参数λ的REML计算, λ01和λ10通过伽马GLM。第四,我们推导了我们估计的标准误差公式,并讨论了通过伽马GLM计算REML相对于传统Fisher评分方法的优点(和缺点)。

3.1. 光谱分解W公司

如前所述,考虑W公司是获得方程式中给出的空间生育率模型的简化形式(1)(3)它很容易进行统计估计和计算。关键的观察结果是W公司对应于零特征值的是1s的向量,因此可以使用其他特征向量来描述所有可能的对比度ψ具体来说,让L(左) k个= ( ,j个)成为(k个− 1) ×k个具有结构的一阶差分矩阵
, =1,, +1=负极1,=1,,k个负极1, j个=0
对于所有其他j个。我们定义
W公司k个=L(左)k个T型L(左)k个.
接下来是这样的W公司在方程式中(3)可以写成两个克罗内克乘积的和
W公司=λ01c(c)W公司第页+λ10W公司c(c)第页.
此外,继昆施之后(1987)出租M(M) k个= ( ,j个)是顺序矩阵k个哪里
1, j个=k个负极1/2, j个=(2/k个)1/2余弦{π(负极1)(j个负极12)/k个}=2,,k个
j个= 1, …,k个然后是矩阵M(M) k个对角线化W公司 k个特别是,
M(M)k个W公司k个M(M)k个T型=D类k个
其中第个对角线入口D类 k个由提供
d日k个=2[1负极余弦{π(负极1)/k个}].
现在让我们M(M)=M(M) c(c)M(M) 第页。接下来是
M(M)W公司M(M)T型=λ01c(c)D类第页+λ10D类c(c)第页=λ01D类01+λ10D类10,
其中两者都是D类 01= c(c)D类 第页D类 10=D类 c(c) 第页是对角矩阵。

d日 k个1=0,的第一个特征向量W公司与1s的矢量成正比。因此,这是最后一次钢筋混凝土−1行M(M)我们现在将用它来描述ψ在谱表示的公式中,还出现了另外两个重要事实。首先W公司实际上是两个精度参数λ的线性组合01和λ10,我们将在第节中使用3.3用于REML计算。第二,矩阵M(M)对应于二维离散余弦变换。离散余弦变换与快速傅里叶变换一样快,在提供新的解释和推导一些快速有效的统计计算方面将发挥核心作用。

3.2、。通过计算最佳线性无偏预测器小时-可能性

B是最后形成的对比矩阵钢筋混凝土−1个特征向量W公司(即最后一个钢筋混凝土−1行M(M))和G公司是由相应的特征值构成的对角矩阵,即。
G公司=诊断(λ01d日01+λ10d日10),=2,,第页c(c),
哪里d日 01d日 10各矩阵的第个对角线项D类 01D类 10.光谱表示的直接结果W公司是那个吗
BψN个第页c(c)负极1(0,G公司负极1).
因此,我们可以将混合模型(1)–(3)重写为
(0)=(T型F类0B)(τψ)+(ϵζ),
(5)
哪里εζ是独立的随机误差向量ϵN个(0,λ负极1n个)ζN个第页c(c)负极1(0,G公司负极1)为了简单起见,我们定义
u个=(0),X(X)=(T型F类0B),β=(τψ),η=(ϵζ),=(λn个00G公司).
然后将混合模型(1)–(3)简化为传统线性回归模型的形式
u个=X(X)β+η
(6)
哪里ηN个n个+第页c(c)负极1(0,负极1)此外,X(X)是这样的X升=0哪里 T型= (1 T型,−1 T型). 的列秩不足X(X)保持整个矢量β从上述回归模型中是无法估计的,这只是另一种断言统计推断只能根据品种和生育率效应的对比进行的方式。对于固定精度参数,我们现在遵循Lee和Nelder(1996,2001)并获得τψ根据方程式(6)通过求解广义最小二乘估计方程
(λT型T型T型λT型T型F类λF类T型T型λF类T型F类+W公司)(τψ)=(λT型T型λF类T型)
(7)
或者,用更简洁的数学符号,通过求解
X(X)T型X(X)β=X(X)T型u个,A类β=b条,
(8)
受以下限制:=0,其中A类=X(X) T型 QX公司b条=X(X) T型 从上述正规方程中可以明显看出,系数矩阵X(X) T型 QX公司是稀疏的,通过稀疏共轭梯度线性方程解算器有助于快速统计计算。即使上述线性方程组的维数很大(约一百万),典型的计算只需要矢量运算和最小的存储空间,详细信息将在第节中给出4。此外在线补遗本文表明τ由方程式得出(8)与从C 0 在方程式中(4),用于任何对比度矩阵选择C 0.

3.3. 通过调整计算剩余最大似然小时-可能性

在混合线性模型(6)的简化形式中,回归参数β和精度参数λ功能无关且变量无关,因此传统的REML方法提供了一种分离估计λ从的β基本思想是消除未知后形成残差β通过适当的线性变换u个因此,基于这些残差的最大边际似然直接产生精度参数的估计。当这个想法应用于我们的回归模型时,产生了REML函数
(λ)=12日志||负极12日志|X(X)T型X(X)|+负极12(u个负极X(X)β^)T型(u个负极X(X)β^)
(9)
哪里β^是法方程的解A类β=b条功能取决于λ.

因此它是方程的最大化(9)传统上,REML函数的最大化是通过Fisher评分或平均信息REML算法实现的,或者通过一个修改的程序实现的,该程序涉及最大化被称为REML剖面的可能性,从而简化了方程(9)进一步通过考虑残差缩放版本的边际似然。相反,我们在这里追求李和内尔德的工作(1996,2001)其建议通过迭代过程间接地使REML函数最大化。与传统的REML方法不同,Lee和Nelder的这种迭代过程不会分离λ从的β。相反,从首字母开始β^(例如,从普通最小二乘法中获得),它计算回归残差,然后在方程式中使用这些残差(9)估计λ换句话说,它治疗β^已知且无λ然后将方程最大化(9)我们将看到,这种最大化可以通过相互关联的伽马GLM实现。一次估算λ^已获取,然后更新β^通过治疗λ已知然后求解法方程(8)。迭代将持续到的值β^λ^在数值上收敛。最终估算λ^Lee和Nelder提供的信息如下(1996,2001),实际上产生了传统的REML估计。

一次β^数值可用,现在让我们看看如何通过最大化方程来更新精度参数(9)伽马GLM。为此,我们用以下公式表示回归的残差向量
e(电子)=u个负极X(X)β^
并定义映射向量的hat矩阵u个-拟合值向量的值
H(H)=X(X)(X(X)T型X(X))负极X(X)T型.
因此H(H),即小时 ii(ii),是描述每个u个-值在相应的拟合值上。接下来,我们重点观察了W公司因此,实际上是三个精度参数λ的线性组合, λ01和λ10具体来说,我们可以写
q个=λv(v),+λ01v(v)01, +λ10v(v)10, ,
哪里
v(v),=1如果1n个,0如果n个+1n个+第页c(c)负极1,
 
v(v)01,=0如果1n个,d日01,负极n个+1如果n个+1n个+第页c(c)负极1,
 
v(v)10,=0如果1n个,d日10,负极n个+1如果n个+1n个+第页c(c)负极1.
现在,使用上面的q个 ii(ii)和治疗β^已知且免费λ,我们对方程求导(9)在几行代数之后,我们得到了分数方程
(1负极小时){e(电子)2/(1负极小时)负极1/q个}v(v), =0,(1负极小时){e(电子)2/(1负极小时)负极1/q个}v(v)01,=0,
 
(1负极小时){e(电子)2/(1负极小时)负极1/q个}v(v)10, =0.
这些得分方程与伽马GLM的估计方程一致,其中我们假设调整后的平方残差e(电子)2/(1负极小时)是作为伽马随机变量独立分布的响应变量,我们有一个反向链接的线性预测器q个 ii(ii)= λ v(v) ,01 v(v) 01,10 v(v) 10,和之前的重量1−小时 ii(ii).

REML方法和伽马GLM之间的上述联系为如何推进统计计算提供了新的视角。它要求我们计算帽子矩阵的残差和对角线项来估计精度参数。通常,这些量是作为任何广义最小二乘计算或任何线性回归分析的一部分进行常规计算的。在我们有限的经验中,我们进一步观察到gamma-GLM估计在数值上比通过Newton–Raphson程序的传统REML估计更稳定。然而,计算帽子矩阵的所有对角线对于巨大的数据集来说可能会变得很有挑战性,因此,在第节中4,我们将进一步提供有助于快速无矩阵REML估计的随机近似。

3.4. 标准误差计算

对比度蓝色的标准误差τ可以从奇异精度矩阵计算τ^可以通过以下方式给出
λ{T型T型T型负极T型T型F类(F类T型F类+λ负极1W公司)负极1F类T型T型}.
不难看出,这个精度矩阵有一个秩缺陷。特别是,对应于零特征值的特征向量与1s的向量成正比。通常情况下变量的数量很小,任何处理对比度的标准误差计算都可以通过获得上述精度矩阵的Moore–Penrose逆来进行。
所有对比的预测误差ψ很难计算。对于任何生育率对比c(c) T型 ψ具有c(c) T型 1=0,BLUP的方差由
无功功率,无功功率(c(c)T型ψ^)=c(c)0T型(X(X)T型QX公司)负极c(c)0+c(c)T型W公司负极c(c)
哪里c(c) 0= (0 T型,c(c) T型)T型为了计算标准误差,我们在插入精度参数估计值,然后应用稀疏矩阵解算器后,计算该方程右侧的平方根。当然,计算生育率效应对比度的所有可能估计值的标准误差可能会耗费大量的计算成本,因为这种计算本质上需要反转一个大型稀疏矩阵。然而,我们可以借助条件模拟来确定生育率对比度BLUP中的不确定性ψ.在第节中4,我们将指出,这种条件模拟可以以无矩阵的方式获得。
精度参数估计的标准误差可以通过两种方式获得,因为从伽马GLM计算的标准误差与从REML函数的Fisher信息矩阵求逆得到的标准误差不同。需要注意的是,伽玛GLM忽略了残差对精度参数的依赖性,因此,从伽玛GLM获得的精度参数的信息总是小于REML函数的信息。常规计算表明,来自REML函数(9)的信息矩阵有条目
2(λ,λ)=v(v)T型负极2v(v)负极信托收据{(2负极H(H))负极1总部负极1},2(λ01,λ01)=v(v)01T型负极2v(v)01负极信托收据{(2负极H(H))负极101总部负极101},2(λ10,λ10)=v(v)10T型负极2v(v)10负极信托收据{(2负极H(H))负极110总部负极110},2(λ01,λ10)=v(v)01T型负极2v(v)10负极信托收据{(2负极H(H))负极101总部负极110},2(λ01,λ)=信托收据(总部负极1总部负极101),2(λ10,λ)=信托收据(总部负极1总部负极110),
(10)
哪里 , 01 10是对角线矩阵,对角线项由各个向量的值给出v(v) ,v(v) 01v(v) 10相反,我们从gamma-GLM中获得的信息矩阵的条目是
(λ,λ)=v(v)T型负极2v(v)负极信托收据(负极1总部负极1),(λ01,λ01)=v(v)01T型负极2v(v)01负极信托收据(负极101总部负极101),(λ10,λ10)=v(v)10T型负极2v(v)10负极信托收据(负极110总部负极110),(λ01,λ10)=v(v)01T型负极2v(v)10负极信托收据(负极101总部负极110),(λ,λ01)=(λ,λ10)=0.
(11)
虽然伽马GLM的标准误差通常可作为统计计算的一部分,但计算密集的是REML信息矩阵的评估。尤其是方程中轨迹的评估(10)需要计算hat矩阵的所有条目H(H),这可能是一项繁重的任务。幸运的是,我们只需要在获得精度参数的REML估计值后执行一次这个庞大的计算。或者,我们可以效仿吉尔摩的做法. (1995)并很容易地计算出平均REML信息,获得精度参数的近似REML标准误差。此外,在第节中4,我们将介绍另一种通过随机近似对REML信息矩阵进行无矩阵计算的方法。我们的精确数值计算表明λ^从伽马GLM计算的结果总是低于我们从REML信息中获得的结果。然而,对于另外两个精度参数,情况并非如此。此外,根据这两个程序计算的标准误差可能并不总是存在显著差异。当然,我们认识到,只要可能,我们都应该准确计算REML标准误差。但这里值得注意的一点是,精确参数估计中的一点误差通常对治疗BLUE和生育对比BLUP及其标准误差的影响不大,因此,不值得详细讨论这个话题。

4.快速无矩阵计算

我们把任务分为三部分。首先,我们使用Lanczos算法讨论了BLUE和BLUP的无矩阵计算。此外,作为这些计算的副产品,我们还获得了一些雄心勃勃但基本的REML估算计算。其次,我们开发了快速无矩阵方法,通过使用随机近似获得REML估计。在这里,我们遵循哈钦森的作品(1989)和Anitescu. (2012). 第三,我们简要介绍了无矩阵条件模拟程序,第四,我们讨论了预处理和计算顺序。

4.1. 通过Lanczos算法进行计算

追随佩奇和桑德斯的有影响力的作品(1975,1982),我们现在寻求一种求解稀疏线性方程的无矩阵共轭梯度法A类β=b条这出现在我们的空间混合线性模型的估计中。在数值分析文献中,这种无矩阵共轭梯度方法被认为在数值上相当稳定,并且比稀疏的Cholesky分解方法更有效。有趣的是,后者在最近的空间统计文献中被广泛使用(参见Rue和Held(2005))。因此,我们利用了一种被认为优于现有空间统计方法的方法。该方法的核心是Lanczos算法,它顺序计算正交向量z(z) 1,z(z) 2,z(z) ,…从跨度b条,抗体,A类 2 b条,…并导出标量κ 1,κ 2,…和θ 1,θ 2,…以减少A类到它的三对角形式。随着Lanczos算法的进展β通过使用部分导出的三对角形式的Cholesky因式分解依次计算A类并依次求解两个稀疏线性方程组,其中涉及该Cholesky分解的下二对角三角形。具体来说,让θ 1= (b条 T型 b条)1/2,z(z) 0=0z(z) 1=b条/θ 1。对于=1,2,…,Lanczos算法顺序计算向量
w个=A类z(z)负极θz(z)负极1
(12)
与前一个正交z(z) 1,…,z(z) − 1然后获得z(z) + 1,κ θ + 1从回归后的残差w个 z(z) ,即通过计算
κ=z(z)T型w个,θ+1={(w个负极κz(z))T型(w个负极κz(z))}1/2,z(z)+1=(w个负极κz(z))/θ+1.
(13)
作为κ ,θ z(z) 由该算法得到,我们依次将解近似如下。我们接受γ1=κ11/2,ϕ 1=θ 1/γ 1(f) 1=z(z) 1/γ 1并将初始解设置为β 1=ϕ 1 (f) 1。对于=2,3,…,我们计算
δ=θ/γ负极1,γ=(κ负极δ2)1/2,
(14)
我们从中相继推导出
ϕ=负极δϕ负极1/γ,(f)=(z(z)负极δ(f)负极1)/γ
(15)
并通过增量添加向量来更新解决方案ϕ  (f) ,即通过迭代计算
β=β负极1+ϕ(f).
为了更好地理解上述近似解的性质并知道何时停止该过程,请注意
A类Z轴k个=Z轴k个Δk个+θk个+1z(z)k个+1e(电子)k个T型
之后k个方程序列计算的步骤(14)(15),其中Z轴 k个是一个q个×k个矩阵(z(z) 1,z(z) 2,…,z(z) k个),e(电子) k个k个×1向量,其k个第个条目为1,所有其他条目为0,并且Δ k个k个×k个三对角矩阵,其第个对角线入口是κ 和(+ 1,)th和(,+1)非对角线条目为θ + 1.让Δk个=R(右)k个R(右)k个T型表示的Cholesky分解Δ k个。在这里R(右) k个是较低的双对角,其第个对角线入口γ 和(+ 1,)第个非对角入口δ + 1从方程式中产生(14)。现在定义F类 k个成为q个×k个矩阵((f) 1,(f) 2,…,(f) k个)和ak个×1矢量ρ k个谁的th元素只是ϕ 。那么F类 k个ρ k个满足
R(右)k个F类k个T型=Z轴k个T型,R(右)k个ρk个=θ1e(电子)1,e(电子)1T型=(1,0,,0).
和解决方案β k个在表达式(15)中获得的仅仅是F类 k个 ρ k个.因此
A类βk个=A类F类k个ρk个=A类Z轴k个R(右)k个负极T型R(右)k个负极1θ1e(电子)1=Z轴k个Δk个Δk个负极1θ1e(电子)1+θk个+1(f)k个+1e(电子)k个T型Δk个负极1θ1e(电子)1=b条+ηk个+1(f)k个+1,
哪里ηk个+1=θk个+1e(电子)k个T型Δk个负极1θ1e(电子)1=θ1θk个+1(Δ负极1)k个, 1,可以迭代计算,无需额外的计算成本。因此,当η k个+ 1小到可以忽略不计β k个然后提供所需精度的解决方案。显然,该算法需要的存储空间非常小,并且在实践中通常只需适度的迭代次数即可收敛。
此外,上述算法允许我们计算A类 负极在没有额外计算成本和最小额外计算成本的情况下,我们可以获得H(H)。假设A类 −1存在,我们让计算运行到q个=+钢筋混凝土步骤。那么,我们有了精确的公式
A类负极1=Z轴q个R(右)q个负极T型R(右)q个负极1Z轴q个T型=F类q个F类q个T型==1q个(f)(f)T型.
现在定义, k个(负极1)成为第个对角线入口F类k个F类k个T型.设置, 0(负极1)=0。然后我们可以近似地第个对角线入口A类 −1通过积累
, k个(负极1)=, k个负极1(负极1)+(f), k个2.
以类似的方式,我们还可以导出某些非对角线条目。在我们的案例中,A类有一个等级缺陷=0.自 T型 b条=0,我们的向量z(z) 1,z(z) 2,…,z(z) n个− 1与…正交,z(z) n个与…成比例θ n个= 0. 因此,我们可以写
A类负极==1q个负极1(f)(f)T型
我们可以累加A类 负极以与非奇异情况相同的方式。现在假设我们想计算H(H),可以写为
H(H)=X(X)(f)(f)T型X(X)T型.
在这里是对角的,因此我们可以累加H(H)如果我们计算向量Xf公司 。可以通过将离散余弦变换用作X(X)包括子矩阵B这些计算的好处是巨大的。它不仅可以根据估计处理对比度方差的边际计算进行推断,还允许我们对预测和残差进行边际回归推断。更重要的是,它允许我们使用伽马GLM计算精度参数的REML。

在我们对大型稀疏矩阵的有限实验中,我们发现Lanczos算法收敛速度很快,并提供了准确的解决方案,但通常会留下低估值小时 ii(ii)对此的一种补救方法是采用方和桑德斯建议的重新正交化程序(2011). 另一个解决方法是,即使我们看到数值收敛到传统的公差水平,也要长时间运行该算法。然而,如果ψ非常大,计算所有小时 ii(ii)准确地说,可能会变得尴尬和有问题。在这种情况下,我们可以采用随机二次采样,直接计算小时 ii(ii)执行伽马GLM程序。通常,此类子采样程序将提供近似REML计算,并在估计中牺牲一点精度。

4.2. 残差最大似然评分方程的随机逼近

而不是二次采样小时 ii(ii)s、 更好的方法是利用所有小时 ii(ii)s,并随机近似第节中导出的伽玛GLM评分方程3.3我们通过实施Hutchinson的工作提供了此类近似值(1989)和Anitescu. (2012). 基本思想如下。计算大矩阵的轨迹S公司,我们可以随机生成K(K)高斯(或Rademacher)矢量ξ 1,ξ 2,…,ξ K(K),每个都有平均值0和分散和近似tr(S公司)由K(K)负极1Σ=1K(K)ξT型S公司ξ因此,以这种方式进行,我们推导出伽马GLM评分方程的随机近似值为
K(K)负极1=1K(K)ξT型(负极H(H))负极1ξ负极e(电子)T型e(电子)=0,K(K)负极1=1K(K)ξT型(负极H(H))负极101ξ负极e(电子)T型01e(电子)=0
K(K)负极1=1K(K)ξT型(负极H(H))负极110ξ负极e(电子)T型10e(电子)=0.
以类似的方式,对应的Hessian矩阵条目的随机近似值如下,这使得我们可以采用牛顿-拉夫森方法来估计精度参数及其标准误差。这里我们强调,离散余弦变换和Lanczos算法有助于我们以无矩阵的方式计算二次型。此外,可以提供理论观点和实践指南来选择K(K)决定停止标准,理解和确定由于随机近似而导致的参数估计中的额外不确定性,以及设计更复杂的近似方案,但我们在此不讨论这些问题。

4.3. 条件模拟ψ

确定ψ,给定数据,是一项具有挑战性的任务,因为此类不确定性计算需要反转ψ鉴于,实际上是λ F类 T型 F类+W公司即使这个精度矩阵是稀疏的,也没有已知的无矩阵方法来计算其逆矩阵。因此,更好的方法是获得条件模拟。为此,我们可以运用鲍里奇的工作(2000)这使得我们可以使用Lanczos算法来解决阿兹=b条而且A类 1/2 z(z)=b条,其中A类是一些稀疏精度矩阵。作为此方法的替代方法,我们也可以继续进行Dietrich和Newsam的工作(1995)函数√的切比雪夫多项式逼近x个与Lanczos解决方案或Parker和Fox的抽样策略一起(2012). 为了简洁起见,我们省略了这些过程的细节。

4.4. 预处理和计算顺序

在解决中Ax=b,其中A类是稀疏的N个×N个正定矩阵O(运行)(N个)非零条目,Lanczos算法需要O(运行)(NK公司)操作,其中K(K)是收敛所需的迭代次数(即三对角约简矩阵的维数)。在数值分析文献中,有充分的证据表明K(K)对应于以下特征值簇的数量A类特别是,K(K)当这些特征值簇很少且相隔很远时,该值很小。格林鲍姆和斯特拉科斯(1992)进一步指出,对于条件良好的矩阵A类(即具有有界条件数的矩阵),Lanczos算法几何收敛。在这种情况下,典型的情况是K(K)最多只能O(运行){日志(N个)}. 请注意,如果我们考虑了精度矩阵,情况就会如此W公司这是由平稳的自回归或具有有限范围参数的条件自回归引起的。然而,矩阵A类方程式中出现的(6)(8)从一个固有的自回归是奇异的和病态的,这可以大大增加计算成本。因此,不是解决轴=b直接地,我们专注于寻找稀疏预处理矩阵C并求解方程(8)分两步进行,即
CA类CT型x个=Cb条,CT型x个=x个,
服从给定的线性约束。为此,我们可以采取不同的方法来构建一个好的预处理矩阵,现在关于这个主题的文献越来越多;例如参见Saad(2003)、本兹(2002)、Choi. (2011),贝拉维亚. (2013)以及其中的参考文献。在本文中,我们特别关注科尔肖的作品(1978)曼特乌费尔(1980)、琼斯和普拉斯曼(1995)还有林和莫雷(1999)关于构造基本预处理矩阵的不完全Cholesky因子分解C首先,观察C作为块对角矩阵diag{λ(T型 T型 T型)−1/2,(λ F类 T型 F类+W公司)−1/2}确保生成矩阵的最大特征值CAC公司 T型仍然有界,且第二个最小特征值为CAC公司 T型变得离零有界。在农业品种试验中,T型T型 T型是对角的,因此很容易计算λ (TT型 T型) −1/2其次,我们实际上没有计算(λ F类T型 F类+W公司) −1/2,但在它的位置上我们使用L(左) −1哪里陆上通信线 T型是λ的不完全Cholesky因式分解 F类 T型 F类+W公司。与实际的稀疏Cholesky因式分解不同,这里的不完全Cholesky因式分解需要O(运行)(N个)计算和存储,尽管如此,L(左) T型 F类 T型 F类+W公司)−1 L(左)仍然提供了一个很好的单位矩阵的初步近似。这极大地促进了Lanczos算法的快速收敛。特别是,使用不完全Cholesky因式分解有效地将问题转化为条件良好的线性系统和求解的有效计算顺序阿克斯=b条成为O(运行){N个日志(N个)}. 我们指的是Benzi(2002)他就趋同速度进行了进一步讨论,贝拉维亚. (2013),他根据部分不完整的Cholesky因子分解提出了进一步的改进建议。总的来说,对于大型数组,这些计算比基于标准稀疏Cholesky计算的计算要好。事实上值得一提的是,稀疏的Cholesky因式分解不能直接处理奇异矩阵,在这种情况下,其计算成本可能远远超过O(运行)(N个 第3页,共2页).

5.连续体模型的扩展

本节的目的是从理论上理解当我们考虑减小子区大小时,基于最近邻调整的统计推断可能会如何变化。通常,生育率不仅因地块而异,也因每个地块而异。通过在地块尺度上使用内在自回归模型,将整个地块的肥力表示为单个值,相当于仅计算该地块的平均肥力,因为这样的表示完全忽略了地块之间的肥力变化。更好的方法是考虑在连续尺度上对生育率进行随机建模,以便根据需要将其整合到不同形状和大小的地块中。在我们的模型中,我们可以通过采取→ ∞, 然后对数据进行分析。因此,问题是,如果使用这种连续体公式进行分析,是否会得出不同的结论。为了更详细和全面地理解这一点,让我们P(P)k个P(P)k个,用于k个= (,j个)和k个=(,j个),表示通过考虑无限方格产生的两个单位大小的平方图Z轴2在二维欧几里德平面上。(即使为此目的考虑了任意尺寸的矩形晶格,也会得出类似的结论。)此外ν在子区尺度上表示一阶内在自回归(即生育率模型)的变异函数。然后,混合线性模型(1)-(3)实际上可以根据子晶格上的内在自回归的变差函数写成
E类(Y(Y)k个负极Y(Y)k个)=(t吨k个负极t吨k个)T型τ(),无功功率,无功功率(Y(Y)k个负极Y(Y)k个)=σψ, 2ν(k个,k个)+2σ, 2,
哪里
ν(,j个)=14P(P)k个P(P)k个ν(,)负极124P(P)k个P(P)k个ν(,)负极124P(P)k个P(P)k个ν(,),
σψ, 2=λψ, 负极1σ, 2=λ, 负极1就是相应的色散参数。因此,应注意,在上述方程式中,τ,σψ2σ2显式依赖于.跟随贝萨格和蒙达尔(2005),的渐近展开式ν 1选择ν采取形式
ν(,)(4π)负极1{αψ(2负极1负极αψ)}负极1/22日志负极+日志(2)+2e(电子)c(c),
哪里e(电子) c(c)是欧拉常数,‖·‖是椭球范数
负极2=4(12负极αψ)(0负极0)2+4αψ(j个0负极j个0)2
具有= ( 0,j个 0)和=(0,j个0)此外,(2π){α ψ(2−1负极α ψ)}1/2 ν (,j个)收敛到
(2π){αψ(2负极1负极αψ)}1/2ν(,j个)=z(z)P(P)k个z(z)P(P)k个日志z(z)负极z(z)d日z(z)d日z(z)负极 z(z)P(P)k个z(z)P(P)k个日志z(z)负极z(z)d日z(z)d日z(z).
(16)
在这个方程式中,ν 仅仅是单位尺寸平方图上积分各向异性de Wijs过程的变异函数。因此,在极限情况下,混合线性模型的推断模拟了基于二维平面上的集成德维斯过程和白噪声的连续体公式。因此,对于大型,基于子区尺度内禀自回归的统计分析基本上等同于连续体de Wijs模型加上白噪声。了解…的价值这在近似的连续统公式中就足够了,我们计算ν 使用Mondal中给出的公式(2005)、和ν 使用Besag和Mondal中给出的公式(2005). 1使用α ψ=0.25,并提供变异函数的最大和最小比率ν ν 各种值的非零滞后(和类似值α ψ在0.05–0.45范围内)。即使对于小到4,并迅速收敛到1。还请注意,当= 2. 因此,我们得出结论,在实践中=4给出了与连续de-Wijs过程和白噪声模型非常接近的结果,并且在原始地块尺度和半地块尺度上考虑内在自回归模型之间存在定性差异。
表1。

变异函数最大与最小比值表ν ν 对于各种值

最小值最大值
比率比率
11.1521.935
21.0411.260
41.0101.069
81.0031.018
161.0011.004
3211.001
最小值最大值
比率比率
11.1521.935
21.0411.260
41.0101.069
81.0031.018
161.0011.004
3211.001
表1。

变异函数最大与最小比值表ν ν 对于各种值

最小值最大值
比率比率
11.1521.935
21.0411.260
41.0101.069
81.0031.018
161.0011.004
3211.001
最小值最大值
比率比率
11.1521.935
21.0411.260
41.0101.069
81.0031.018
161.0011.004
3211.001
此外,对于以下所有值,ν 具有渐近展开
ν(k个,k个)2(4π)负极1{αψ(2负极1负极αψ)}负极1/2日志k个负极k个+c(c),
哪里c(c) 只是一个取决于α ψ通常,c(c) 1>c(c) 例如,如果α ψ= 0.25,c(c) = 25/(12π)−对数(2)/(3π)−1/3(蒙达尔,2005),这意味着c(c) 1>c(c) 因此,
E类(Y(Y)k个负极Y(Y)k个)=(t吨k个负极t吨k个)T型τ(),无功功率,无功功率(Y(Y)k个负极Y(Y)k个)=2σψ, 2(4π)负极1{αψ(2负极1负极αψ)}负极1/2日志k个负极k个+C,
哪里C=2σ, 2+c(c)。主要是由于上述渐近展开,我们现在可以得出以下结论:τ (),σψ, 2C (甚至是α ψ)如果我们在子区尺度上拟合内在自回归,则不应如此改变。因此,如果渐近展开提供了对所有小滞后的变异函数的准确估计,那么处理对比度的BLUE应该对尺度的任何变化都是稳健的。这同样适用于REML对生育率精度参数的估计。然而,剩余地块效应的精度参数应该改变,因为在子地块尺度上应用空间肥力效应可以为地块尺度上的肥力变化带来更平滑的效果。换句话说,σ, 12将接近σ, 2+(c(c)负极c(c)1)/2,它不同于(大于)σ, 2.

最后,值得注意的是,通过在子图级别使用固有的自回归,通过常规使用随机误差项和空间分量来增强de Wijs模型近似。事实上,de Wijs加白噪声模型是固有自回归加白噪声的更好近似。2给出了变异函数之间的差值ν 4ν 用于小滞后。我们看到,差异很小,在非零滞后方面都非常接近,因此本质上可以通过向de Wijs过程中添加白噪声来吸收这些差异。

表2。

变异函数之间的差异ν 4ν 对于,j个=0,1,…,9时α ψ= 0.25

以下j值的差异:
012456789
000.07100.07130.07190.07220.07240.07240.07250.07250.0725
10.07100.07470.07290.07240.07240.07240.07250.07250.07250.0725
20.07130.07290.07340.07290.07270.07260.07260.07260.07260.0726
0.07190.07240.07290.07300.07280.07270.07270.07260.07260.0726
40.07220.07240.07270.07280.07280.07280.07270.07270.07260.0726
50.07240.07240.07260.07270.07280.07270.07270.07270.07270.0726
60.07240.07250.07260.07270.07270.07270.07270.07270.07270.0727
70.07250.07250.07260.07260.07270.07270.07270.07270.07270.0727
80.07250.07250.07260.07260.07260.07270.07270.07270.07270.0727
90.07250.07250.07260.07260.07260.07260.07270.07270.07270.0727
以下j值的差异:
012456789
000.07100.07130.07190.07220.07240.07240.07250.07250.0725
10.07100.07470.07290.07240.07240.07240.07250.07250.07250.0725
20.07130.07290.07340.07290.07270.07260.07260.07260.07260.0726
0.07190.07240.07290.07300.07280.07270.07270.07260.07260.0726
40.07220.07240.07270.07280.07280.07280.07270.07270.07260.0726
50.07240.07240.07260.07270.07280.07270.07270.07270.07270.0726
60.07240.07250.07260.07270.07270.07270.07270.07270.07270.0727
70.07250.07250.07260.07260.07270.07270.07270.07270.07270.0727
80.07250.07250.07260.07260.07260.07270.07270.07270.07270.0727
90.07250.07250.07260.07260.07260.07260.07270.07270.07270.0727
表2。

变异函数之间的差异ν 4ν 对于,j个=0,1,…,9,当α ψ= 0.25

以下j值的差异:
012456789
000.07100.07130.07190.07220.07240.07240.07250.07250.0725
10.07100.07470.07290.07240.07240.07240.07250.07250.07250.0725
20.07130.07290.07340.07290.07270.07260.07260.07260.07260.0726
0.07190.07240.07290.07300.07280.07270.07270.07260.07260.0726
40.07220.07240.07270.07280.07280.07280.07270.07270.07260.0726
50.07240.07240.07260.07270.07280.07270.07270.07270.07270.0726
60.07240.07250.07260.07270.07270.07270.07270.07270.07270.0727
70.07250.07250.07260.07260.07270.07270.07270.07270.07270.0727
80.07250.07250.07260.07260.07260.07270.07270.07270.07270.0727
90.07250.07250.07260.07260.07260.07260.07270.07270.07270.0727
以下j值的差异:
012456789
000.07100.07130.07190.07220.07240.07240.07250.07250.0725
10.07100.07470.07290.07240.07240.07240.07250.07250.07250.0725
20.07130.07290.07340.07290.07270.07260.07260.07260.07260.0726
0.07190.07240.07290.07300.07280.07270.07270.07260.07260.0726
40.07220.07240.07270.07280.07280.07280.07270.07270.07260.0726
50.07240.07240.07260.07270.07280.07270.07270.07270.07270.0726
60.07240.07250.07260.07270.07270.07270.07270.07270.07270.0727
70.07250.07250.07260.07260.07270.07270.07270.07270.07270.0727
80.07250.07250.07260.07260.07260.07270.07270.07270.07270.0727
90.07250.07250.07260.07260.07260.07260.07270.07270.07270.0727

6.应用

我们提供两种应用程序。第一次重新分析了Stroup中报告的一组冬小麦数据. (1994). 这里的目的是推断不同品种效应的对比,同时校正空间变化随机生育率分量的影响。第二个应用涉及对澳大利亚精准农业收集的大型棉田数据集进行统计分析,该数据集需要快速无矩阵统计计算。

6.1. 冬小麦数据的应用

Stroup中报告的冬小麦数据. (1994)可以通过R统计软件中的nlme包(Pinheiro.,2007)和SAS手册(Littell.,1996)混合效应模型和空间变异性。根据Stroup. (1994)数据由内布拉斯加州州内苗圃收集,作为高级农业田间试验的一部分,该试验包括19个已释放或适应的品种(包括历史和现代品种)和37个未适应的品种。其中两个未适应的品种实际上是小黑麦。采用随机完全区组(RCB)设计,共种植了56个小麦品种,共4个重复。图。1和图。2(a) 分别以灰色显示地块的实际物理布局和原粮产量。物理布局是这样的:n个=224个地块在地理上嵌入了一个11×22的矩形地块阵列中,每个地块长4.3米,宽1.2米。有些地块根本没有播种作为分块器的标记。这些与图中的“×”相符。2。从1到56的品种只是实际品种名称的代码。例如,品种30为“BUCKSKIN”,品种3为“REDLAND”等。这些代码是通过随机排列试验中使用的品种列表获得的。此外,从图中可以明显看出。2从左下角到右上角,生育率存在明显的空间梯度。特别是,图中原始谷物产量图左下角的黑色斑块。2表明该地区的原始产量出奇地低。这与右上角的原始产量相对较高形成对比。生育率的空间梯度在数据中引入了巨大的块内变化。因此,基于RCB分析的品种排序和选择的经典程序在此无法产生有意义的结果。事实上,RCB分析的徒劳性显而易见,因为人们发现,尽管牛皮被称为优质品种,但其主要种植在肥沃程度较低的地区,在最高的平均块调整原产量中排名第28位。(有关RCB分析不足的进一步讨论,请参阅Stroup. (1994)和SAS手册。)

冬小麦数据中品种的布局:共有224个地块嵌入11×22矩形阵列中
图1。

冬小麦数据中的品种布局:总共224个地块嵌入一个11×22的矩形地块阵列中

四个图像图显示(a)原始产量(居中和按比例),(b)处理对比度τi-τ⁄^的蓝色,(c)育性对比度ψi-ψм^和(d)残差的BLUP:在原始数组D1上进行分析
图2。

四个图像图显示(a)原始产量(居中和缩放),(b)处理对比度的蓝色τ负极τ¯^,(c)生育率对比的BLUPψ负极ψ¯^(d)残差:对原始数组进行分析D类1

因此,为了纠正原始产量的异质性并揭示更有意义的结论,我们只关注空间分析。使用第节中制定的方法2,我们首先在方程中拟合混合模型(1)根据贝萨格和希格顿的建议,根据原始的地块阵列(1999). 这里,每个,空间组件ψ 代表地块的平均生育率混合模型的有效性来源于以下事实:ψ 围绕相邻地块的平均肥力值变化。因此,我们在这里估计的治疗效果对比可以解释为最近邻生育率调整治疗效果对比的估计。由于名义上的计算成本,我们应用了直接矩阵计算和共轭梯度算法,从而产生了相同的治疗对比BLUE、相同的生育对比BLUP和相同的REML精度参数估计值。这些结果总结在图2和表的前两列特别是图。2(b) 显示治疗对比度蓝色的图像图τ负极τ¯图中显示了以灰度为单位的前10个集中的变化效应及其95%的置信区间。如我们所见,BUCKSKIN现在具有最高的最近邻施肥调整处理效果,这是预期的,因为其已知的优势,以及尽管播种在低肥力地块上,但其作物产量比最近邻地块大得多的事实。与RCB相比,空间分析在恢复生育调整治疗效果方面的改进确实非常显著。它证明了Stroup的结论是正确的. (1994)基于一些基本的最近邻调整。在我们的分析中,还有两个突出的特点。第一个是图。2(d) ,这表明没有模式,模型与数据吻合良好。二是生育效应的BLUPs(ψ负极ψ¯)如图所示。2(c) 它相当充分地捕捉到了巨大的生育梯度。

具有集中处理效果的前10个品种:从左到右,具有不同色调的单个条对应于使用子阵列D1、D2、D4和D8的育性调整进行的集中品种估计;每个棒的中心给出τi-τ³的蓝色,每个棒的高度表示大约95%的置信区间
图3。

具有集中处理效果的前10个品种:从左到右,具有不同阴影的单个条对应于使用子阵列生育率调整的集中品种估计D类1,D类2,D类4D类8; 每个条的中心表示τ负极τ¯每根杆的高度表明大约95%的置信区间

表3。

对数精度参数的估计值及其标准误差(括号内),这些参数是根据各种图分割的平均REML信息计算的

估计以下拆分方案的结果:
无拆分2×24×48×8
对数(λ)2.11 (0.44)1.80 (0.26)1.71 (0.22)1.67 (0.21)
对数(λ01)−0.28 (0.34)−0.50 (0.38)−0.58 (0.41)−0.60 (0.42)
对数(λ10)0.96 (0.41)0.99 (0.41)1.03 (0.41)1.05 (0.41)
2α ψ0.780.810.840.84
估计以下拆分方案的结果:
无拆分2×24×48×8
对数(λ)2.11 (0.44)1.80 (0.26)1.71 (0.22)1.67 (0.21)
对数(λ01)−0.28 (0.34)−0.50 (0.38)−0.58 (0.41)−0.60 (0.42)
对数(λ10)0.96(0.41)0.99 (0.41)1.03 (0.41)1.05 (0.41)
2α ψ0.780.810.840.84

我们还表示估计为2α ψ= λ10/(λ0110).

表3。

根据不同地块分割的平均REML信息计算的对数精度参数估计值及其标准误差(括号内)

估计以下拆分方案的结果:
无拆分2×24×48×8
对数(λ)2.11 (0.44)1.80 (0.26)1.71 (0.22)1.67 (0.21)
对数(λ01)−0.28 (0.34)−0.50 (0.38)−0.58(0.41)−0.60 (0.42)
对数(λ10)0.96 (0.41)0.99 (0.41)1.03 (0.41)1.05 (0.41)
2α ψ0.780.810.840.84
估计以下拆分方案的结果:
无拆分2×24×48×8
对数(λ)2.11 (0.44)1.80(0.26)1.71 (0.22)1.67 (0.21)
对数(λ01)−0.28 (0.34)−0.50 (0.38)−0.58 (0.41)−0.60 (0.42)
对数(λ10)0.96 (0.41)0.99 (0.41)1.03 (0.41)1.05 (0.41)
2α ψ0.780.810.840.84

我们还表示估计为2α ψ= λ10/(λ0110).

事实上,上述混合线性模型与数据吻合得如此之好,再次证明了Besag和Higdon提出的最近邻调整(1999)对于农业品种试验,尤其是在肥力没有跳跃或异常值的情况下。然而,关于此类分析对尺度变化的稳健性,以及此类分析与其他许多人提倡的随机场方法相比如何,仍然存在问题。因此,我们将每个图划分为×子图并考虑一个仍保持方程形式的混合线性模型(1)描述不变T型,τɛ,但生育能力的规范ψ完全改变。现在,对于每个子情节,ψ 代表其平均生育率,以及F类以这样的方式平均子地块的生育率F类ψ生成原始地块阵列中的平均生育率矢量。然后,我们通过假设生育率的内在自回归模型对数据进行重新分析服务提供商 1×服务提供商 2子地块数组。作为增加,变差函数的渐近展开5断言来自混合线性模型的推断必须开始模拟基于二维平面上的积分de Wijs过程和白噪声的连续体公式。因此,在特定值,我们期望数值收敛于连续统公式。下面我们总结了以下四个不同值的结果,即= 1, 2, 4, 8. 超出的价值=8,我们发现估计中的数值差异非常小(如果有的话),因此有效地获得了连续体模型的结果。还要注意,即使对于小到8,向量的大小ψ是15488,相应的统计计算并不是简单的练习。在这里,稀疏共轭梯度算法变得非常有用,可以克服计算中出现的任何明显挑战。

图。4显示了四个生育率调整后治疗对比度蓝色图像图τ负极τ¯基于子区阵列的个体分析D类1,D类2,D类4D类8令人惊讶的是,在这四个图像图中几乎看不到任何差异,并且治疗对比度的蓝色看起来对任何尺度的变化都非常稳健。这证明了这样一个事实,即渐近展开法即使对于较小的值支持一阶固有自回归是积分德维斯过程加上少量白噪声的很好近似。为了充分理解这些分析,图。显示前10个品种并提供中央治疗对比的估计值τ负极τ¯以及它们的置信区间。仔细观察这些值可以发现,基于原始图阵列和基于子图阵列的品种对比度估计值存在一些显著差异。然而,无论我们分析子批次阵列上的数据,它们的标准误差几乎没有差异D类2,D类4D类8在所有这些分析中,品种30现在以很大的优势脱颖而出。令人惊讶的是,有一些品种对生粮产量的影响非常相似。其中两组品种分别为12、15和55,以及25、26和53。这些分析的另一个重要结果是,估算的所有标准误差τ负极τ¯结果约为0.3,这表明治疗的高斯随机效应模型有能力进一步改进分析。总的来说,就治疗效果而言,我们可以得出这样的结论:基于将一个图拆分为2×2或4×4子图的分析所产生的推论与连续体模型的推论一样好。

处理BLUE的图像图对比τi-τ³,用于图的各种分割方案(×,未播种的图):(a)原始数组D1;(b) 半标度图D2;(c) 四分之一地块比例D4;(d) 八区比例尺D8
图4。

治疗对比度蓝色图像图τ负极τ¯对于地块(×,未播种地块)的各种分割方案:(a)原始数组D类1; (b) 半比例图D类2; (c) 四分位刻度D类4; (d) 八区比例尺D类8

接下来我们关注图。5绘制了四幅BLUP生育率对比图ψ负极ψ¯,同样基于对子地块阵列的单独分析D类1,D类2,D类4D类8这里我们看到了生育率图之间非常明显的差异。首先,原始地块阵列上预测的生育率图似乎与原始产量非常相似。这就提出了一个问题,即数据是否存在明显的过拟合。但是,当我们考虑越来越小的子地块时,生育率图变得越来越平滑,这在概念上非常令人满意,并且很明显,过拟合不是问题所在。在这里,空间模型正在做它应该做的事情,即从原始产量中消除平稳变化的肥力效应。此外,不仅仅是显示在D类1,D类2D类4,也包括F类ψ负极ψ¯1不同的子区大小有显著差异。然而,当我们选择8×8分裂图而不是4×4分裂图时,BLUP中的这种变化是非常正常的。这表明基于子阵列上一阶固有自回归的分析D类4不仅提供了最近邻调整,而且模拟了连续随机场模型。

图4所示的各种图分裂方案的子图肥力ψi−ψ⁄的BLUP图像图
图5。

子区生育力BLUPs的图像图ψ负极ψ¯对于图。4

与预测的生育率图不同,随着子地块尺寸的减小,在地块尺度上变得更平滑,而残差地块正好相反。图。6绘制了四种不同分裂方案的残差,并很好地强调了这种模式。特别是,图的8×8分裂的残差波动大于图的不分裂残差的波动,这与我们在第节中讨论的渐近变异函数结果非常一致5.

如图4所示的各种样地分割方案的残差图像图:×,未播种的样地
图6。

图中各种分割方案的残差图像图。4:×,未播种的地块

最后,我们在表中提供了对数决策参数的估计值这里的对数变换类似于方差稳定变换。如第节中变异函数的渐近展开所示5残差(即λ)的精度参数估计)随着子区尺寸的减小,减少并接近连续模型的相应估计值。相比之下,生育率精度参数和2α ψ= λ10/(λ0110)受标度变化的影响最小,即在半标度、四分之一标度或八分之一标度下几乎保持不变。这些值再次证实,四分位尺度的分析相当准确地模拟了相应连续体模型的分析。

6.2. 在大型棉田数据集中的应用

图。7(a) 提供了澳大利亚一大片棉田的部分原棉产量图。该数据集(由悉尼大学的A.McBratney教授提供)提供了一个来自精确农业的大型现代实验的示例。该地区统一种植单一作物(此处为棉花),全球定位系统设备用于绘制每个收获地块的地理坐标(即北向和东向)。该区域的这一部分包含约50000块地块,在各地区分布不规则。我们指的是克利福德(2005),他在粗略网格上聚合产量后,对类似数据进行了分析。然而,人们对了解非常大区域的当地肥力变化非常感兴趣。在这里,我们将该区域嵌入到480×1075的规则阵列上,这样棉田的每个地块都落在其中一个网格单元上。然后采用无任何处理效果的混合线性模型(1),拟合一个固有的自回归加白噪声来恢复棉田的空间肥力。图。7(b) 提供了BLUP对肥力影响的估计,并揭示了肥力图中存在相当大的各向异性。总的来说,我们发现REML计算对于典型的笔记本电脑或台式电脑来说是快速且可管理的。在求解BLUP方程时,我们将公差水平设置为等于10−10并发现Lanczos算法需要15到100次迭代。我们仅使用50个随机高斯向量随机逼近REML评分方程中的轨迹。我们还发现了精度参数的合理初始值的数值收敛性。总的来说,如果不使用第节中开发的无矩阵算法,这样的计算将很困难4.

(a) 棉花产量数据和(b)肥力图
图7。

(a) 棉花产量数据和(b)肥力图

7.讨论

我们首先指出小时-似然方法可以推广到随机变量效应模型。为了详细说明这一点,假设除模型(1)-(3)外,治疗效果τ跟随N个(0,λτ负极1)带精度参数λτ我们的目标是找到BLUP用于治疗和生育对比,以及REML对精确参数的估计。为此,我们可以推广一般的最小二乘方程(6)通过
00=T型F类00Bτψ+εξζ,
哪里ξ跟随N个(0,λτ负极1)这个新的广义最小二乘问题产生了一组新的稀疏正规方程,可以使用第节中开发的方法再次求解4以获得品种和生育率对比的预测。此外,与上述一般最小二乘问题相关的新精度矩阵的对角项是精度参数λ的线性组合, λτ, λ01和λ10,因此可以使用伽马GLM进行估计。

品种的概率排序和选择对于田间试验很重要,这可能需要计算各种复杂的概率。例如,可能需要计算以下联合概率τ负极τ¯^τ负极τ¯^位列前五。从频率学家的角度来看,可以应用参数引导法来计算这些概率。注意,一旦获得REML精度参数,其想法是模拟正向模型中的伪数据,然后获得估计值的自举样本。这种估计的自举样本可以在必要时用于计算经验概率。此外,通过推导统计理论来获得更好的均方误差或预测区间估计值,可以扩大自举方法的范围,如霍尔和梅蒂所做的那样(2006年a,2006年b)和查特吉. (2008)对于经典的独立随机效应模型。在未来的研究中,我们将研究空间统计中bootstrap方法的这些方面。

通常,在涉及不同品种的田间试验中,地块被边界隔开,即每个地块的边界上都有一些未种植的空间。如果可以获得关于边界宽度的信息,我们原则上可以调整我们的模型以纳入这些信息。这主要是因为我们可以将每个情节嵌入×以这样的方式,对原始产量的贡献将来自“内部”子地块和“边界”子地块,将考虑每个地块边界沿线的未种植空间。然而,在这一点上,我们不太确定这种分析可能带来的好处。请注意,第节中我们的近似变异函数计算的形式5在这种情况下保持不变,并且,如果与每个地块内的种植面积相比,边界空间较小,则处理对比度的估计值不应受到这种调整的显著影响。然而,还需要进一步的工作来充分确定这种情况的影响。

同样,在精准农业中,人们普遍认识到,监测到的平均产量可能与收获方向上的相邻地块相混淆。这种卷积效应和与全球定位系统使用相关的位置误差可以对对比度的BLUP进行统计解释ψ有问题。因此,总是需要收集有关收获方向的额外信息,以便建立一个比第节中使用的更有意义的统计模型6.2对于监测的产量可以推导和实现。此外,我们认识到,大面积农田(如精准农业中使用的农田)的肥力可能存在显著的局部差异和不均匀性,直接的最近邻分析可能无法解释空间不确定性的所有方面。因此,研究经验半变异函数和其他二阶结构非常重要。在这方面,Mondal和Percival工作的随机场扩展(2012)非规则采样时间序列数据的小波方差估计对于探索Fairfield–Smith定律、拟周期性、局部同质性和最近邻分析残差的随机性非常有用。

还有进一步扩展我们小时-更精细的空间模型的似然方法在其他科学应用中很重要。例如,我们可以将一阶和二阶固有自回归结合起来,并考虑ψ有一个精确的矩阵W公司表单的
W公司=λ01c(c)W公司第页+λ10W公司c(c)第页+λ11W公司c(c)W公司第页.
由于Balram和Moura的工作,该方程导致八邻固有自回归,可以处理平面任何方向的几何各向异性,并在图像分析和其他相关领域具有一定的可见性(1993). 对于此模型,我们可以再次获得以下对比度的预测ψ通过求解稀疏线性方程,并通过计算相应的伽马GLM获得精度参数的REML估计。通过允许额外的λ,我们还可以接受具有有限范围参数的条件自回归模型00  c(c) 第页到上面W公司有关此类模型的应用,请参见Banerjee. (2004). 另请参见蒙达尔(2013),世卫组织提供了进一步的参数化高阶高斯内禀自回归类,可应用这些推理程序。最后,值得一提的是,我们可以在我们的公式中包括一个近似(平稳或内在)马特恩模型。实现此目的的一种方法是引入平滑度参数υ>0,并写入的精度矩阵ψ作为
W公司=(λ01c(c)W公司第页+λ10W公司c(c)第页)υ=M(M)T型(λ01D类01+λ10D类10)υM(M).
因此,对于该模型,精度矩阵并不稀疏,但我们可以应用离散余弦变换和逆离散余弦转换来求解非解析法方程,并获得对比度预测ψ此外,我们可以应用非线性伽马模型来估计REML精度和平滑度参数(参见Dutta和Mondal(2014年a)详细信息)。

如果不提到这里开发的共轭梯度法具有更广泛的适用性,我们的讨论就不完整。例如,它可以用于改进Rue中提出的迭代拉普拉斯嵌套近似(INLA). (2009). 对于一大类空间模型,INLA提供了对给定数据的单个空间分量条件分布的估计。INLA的两个关键步骤是求解稀疏线性方程和计算稀疏精度矩阵逆的对角线和某些非对角线项。虽然Lanczos算法可以改进求解稀疏线性方程式系统的计算,我们可以通过使用嵌套的剖分来利用快速的逆计算(Li.,2008)找到稀疏精度矩阵逆矩阵的对角线。这将是对当前仅依赖递归的稀疏Cholesky计算的一个改进。然而,还需要进一步的工作来纠正通过传统Lanczos算法计算稀疏精度矩阵逆矩阵对角线时的偏差,并使其在INLA计算中可用。在这方面,我们可以考虑Malioutov开发的近似值. (2006,2008). 对所有这些程序的优缺点的研究将是未来研究的主题。

Lanczos算法的另一个优点是,它不仅可以用于求解阿兹=b条而且A类 1/2 z(z)=b条,其中A类是一个稀疏精度矩阵。后一种计算可以通过使用Borici中讨论的策略以无矩阵的方式进行(2000)帕克和福克斯(2012)并可用于高斯马尔可夫随机场的各种无矩阵贝叶斯计算(参见Rue和Held(2005)等)。在杜塔和蒙达尔(2014年b),我们将详细探讨这些计算。

在某些统计应用中,与精度矩阵相关联的依赖图W公司可以是非结构化的。示例包括与不规则采样空间位置的Delaunay三角剖分相关的不规则依赖图;参考林格伦的工作. (2011). 在这种情况下W公司可能以易于计算的形式提供,并且我们将无法通过离散余弦变换利用快速矩阵向量计算。然而,我们仍然可以通过稀疏Lanczos求解获得无矩阵的BLUE和BLUP计算,通过随机轨迹近似估计REML参数,并以无矩阵的方式获得条件模拟。然而,请注意,在这种情况下,典型的INLA计算并不是无矩阵的,因此使用我们的方法进行推理具有优势。

值得注意的是,Lanczos算法并不是推导空间线性模型无矩阵计算的唯一方法。事实上,还有许多其他共轭梯度方法可以适用于某些其他类型的空间应用,值得进一步研究。例如,Mondal中暗示的基于扩散小波的计算(2011)对于不规则晶格数据和获得多尺度推断特别有用。在未来的研究中,我们将探索空间统计领域中的此类无矩阵计算。

最后,正如副主编所问,我们开始对最近的邻居进行一些一般性的评论和观察使用“灵活”估计空间相关性特别的农业或品种试验的数据驱动技术。就农业品种或均匀性试验而言,我们的观点是,使用数据驱动技术,通过从许多可能的协方差或变差函数模型中选择的协方差函数(或半变差函数)来估计相关性的方法很少有用。这主要是因为,在农业品种试验中,我们在非常小的阵列上收集空间数据,并且可以通过使用最简单的最近邻调整(基于de Wijs过程加上白噪声)来解释许多空间变化。事实上,这一点得到了McCullagh和Clifford的强调(2006),他广泛研究了均匀性试验,并实际提供了他们的模型(即de-Wijs过程加白噪声)与Matérn协方差加白噪声模型的比较,发现基于Matörn协变的随机场方法没有什么优势。我们知道,马特恩协方差可能不是人们能想到的唯一的协方差参数族,但是,在将de Wijs过程加上白噪声模型拟合到均匀性或多样性试验数据后,残差中很少会留下需要考虑的东西。我们需要的是真实的数据示例,我们将看到de-Wijs过程加上白噪声模型给出了与数据驱动方法截然不同的答案。目前,我们不知道有这样的例子。总的来说,我们对此持怀疑态度特别的众所周知,在小数据集中,变异函数估计是不可靠的(例如,参见Besag和Higdon中给出的论点(1999)). 此外,我们反对引入任意协方差公式,如高斯或球面相关性。然而,我们认识到为大型空间数据开发严格的非参数方法的重要性。这主要是因为在实际数组大小巨大的大型空间应用中,可能存在大量的局部变化、显著的肥力梯度、各向异性、跳跃和离群值,而参数化空间模型(如de Wijs过程加白噪声)可能达不到要求。从建模的角度来看,人们的兴趣还在于开发更复杂的空间模型,以便在这种情况下进行进一步的调整。

致谢

朱利安·贝萨格介绍小时-Debashis Mondal的似然法。Choi Sou Cheng向我们提供了参考资料Greenbaum和Strakos(1992)和李. (2008). 两位审稿人和副主编通过他们的评论帮助改进了原稿的早期版本。最后,这项工作得到了国家科学基金会DMS 0906300和DMS 1254840奖的支持。

工具书类

Anitescu公司
,
M。
,
,
J。
,
L。
(
2012
)
求解高斯过程最大似然问题的无矩阵方法
.
SIAM J.科学计算。
,
34
,
A240型
——
A262型
.

巴勒姆
,
N。
莫拉
,
J·M·。
(
1993
)
非因果高斯-马尔可夫随机场:参数结构和估计
.
IEEE传输。通知。西奥。
,
39
,
1333
——
1355
.

班纳吉
,
S公司
.,
卡林
,
业务伙伴
.和
盖尔芬德
,
A.电气
. (
2004
)
空间数据的层次化建模与分析
.
纽约
:
查普曼和霍尔
.

巴特利特
,
医学硕士。
(
1978
)
田间试验分析中的最近邻模型(附讨论)
.
J.R.统计。Soc.B公司
,
40
,
147
——
174
.

贝拉维亚
,
美国。
,
贡齐奥
,
J。
莫里尼
,
B。
(
2013
)
稀疏对称正定系统和最小二乘问题的无矩阵预条件
.
SIAM J.科学计算。
,
35
,
A192型
——
答211
.

本齐
,
M。
(
2002
)
大型线性系统的预处理技术综述
.
计算机物理杂志。
,
182
,
418
——
477
.

贝萨格
,
J。
(
2002
)
讨论McCullagh的论文“什么是统计模型?”
.
安。统计师。
,
30
,
1267
——
1277
.

贝萨格
,
J。
绿色
,
第J页。
(
1993
)
空间统计和贝叶斯计算
.
J.R.统计。Soc.B公司
,
55
,
25
——
37
.

贝萨格
,
J。
希格顿
,
D。
(
1999
)
农业田间试验的贝叶斯分析(附讨论)
.
J.R.统计。Soc.B公司
,
61
,
691
——
746
.

贝萨格
 
J。
肯普顿
,
R。
(
1986
)
利用相邻地块进行田间试验的统计分析
.
生物计量学
,
42
,
231
——
251
.

贝萨格
,
J·E。
蒙道
,
D。
(
2005
)
一阶内禀自回归与de Wijs过程
.
生物特征
,
92
,
909
——
920
.

博里西
,
答:。
(
2000
)
求解大型稀疏矩阵平方根的Lanczos方法
.
计算机物理杂志。
,
162
,
123
——
131
.

查特吉
,
美国。
,
拉希里
,
第页。
,
H。
(
2008
)
线性混合模型中EBLUP分布和相关预测区间的参数自举近似
.
安。统计师。
,
36
,
1221
——
1245
.

,
S.T.公司。
,
佩奇
,
C.C.公司。
桑德斯
,
文学硕士。
(
2011
)
MINRES-QLP:不定或奇异对称系统的Krylov子空间方法
.
SIAM J.科学计算。
,
33
,
1810
——
1836
.

克利福德
,
D。
,
麦克布拉特尼
,
答:B。
,
泰勒
,
J。
惠兰
,
B.M.公司。
(
2006
)
产量监测数据空间变异的广义分析
.
《农业杂志》。科学。
,
144
,
45
——
51
.

卡利斯
,
B.R.公司。
格里森
,
交流。
(
1991
)
野外实验的空间分析——二维扩展
.
生物计量学
,
47
,
1449
——
1460
.

卡利斯
,
B.R.公司。
,
戈格尔
,
B。
,
维比拉
,
答:。
汤普森
,
R。
(
1998
)
多环境早代品种试验的空间分析
.
生物计量学
,
54
,
1
——
18
.

迪特里希
,
C.R.公司。
纽萨姆
,
G.编号。
(
1995
)
通过对协方差矩阵的对称平方根的切比雪夫矩阵多项式近似有效地生成条件模拟
.
数学。地质。
,
27
,
207
——
228
.

挖掘
,
第J页。
(
1988
)
重复测量的分析方法
.
生物计量学
,
44
,
959
——
971
.

杜塔
,
美国。
蒙道
,
D。
(
2014年a
)
基于具有金块效应的近似固有Matérn依赖性的空间混合线性模型的REML分析
。待发布。

杜塔
,
美国。
蒙道
,
D。
(
2014年b
)
高斯马尔可夫随机场及其相关空间过程的无矩阵条件模拟
。待发布。

,
D。
桑德斯
,
M。
(
2011
)
LSMR:稀疏最小二乘问题的迭代算法
.
SIAM J.科学。计算。
,
33
,
2950
——
2971
.

吉尔穆尔
,
A.R.公司。
,
卡利斯
,
B.R.公司。
维比拉
,
A.P.公司。
(
1997
)
野外实验分析中自然变化和外来变化的解释
.
《农业杂志》。生物与环境。统计人员。
,
2
,
269
——
293
.

吉尔穆尔
,
A.R.公司。
,
汤普森
,
R。
卡利斯
,
B.R.公司。
(
1995
)
平均信息REML:线性混合模型方差参数估计的一种有效算法
.
生物计量学
,
51
,
1440
——
1450
.

格里森
,
交流。
卡利斯
,
B.R.公司。
(
1987
)
田间试验邻域模型的剩余最大似然估计
.
生物计量学
,
43
,
277
——
287
.

格林鲍姆
,
答:。
斯特拉科斯
,
Z.公司。
(
1992
)
预测有限精度Lanczos和共轭梯度计算的行为
.
SIAM J.材料。分析。申请。
,
13
,
121
——
137
.

霍尔
,
第页。
梅蒂
,
T。
(
2006年a
)
嵌套误差回归模型中均方预测误差的非参数估计
.
安。统计师。
,
34
,
1733
——
1750
.

霍尔
,
第页。
梅蒂
,
T。
(
2006年b
)
小面积预测的参数自举方法
.
J.R.统计。Soc.B公司
,
68
,
221
——
238
.

阿尔维尔
,
D.A.博士。
(
1977
)
方差分量估计的最大似然方法及相关问题
.
《美国统计杂志》。助理。
,
72
,
320
——
338
.

亨德森
,
C.R.公司。
(
1950
)
遗传参数估计
.
安。数学。统计人员。
,
21
,
309
——
310
.

亨德森
,
C.R.公司。
(
1975
)
选择模型下的最佳线性无偏估计和预测
.
生物计量学
,
31
,
423
——
447
.

哈钦森
,
平方英尺。
(
1989
)
拉普拉斯光滑样条影响矩阵迹的随机估计
.
Communs Statist公司。模拟计算
,
19
,
433
——
450
.

琼斯
,
麻省理工学院。
普拉斯曼
,
体育。
(
1995
)
改进的不完全Cholesky因子分解
.
ACM事务处理。数学。软件。
,
21
,
5
——
17
.

肯普顿
,
注册会计师。
豪斯
,
C.W.公司。
(
1981
)
相邻地块值在品种试验分析中的应用
.
申请。统计人员。
,
30
,
59
——
70
.

科尔肖
,
D.S.公司。
(
1978
)
线性方程组迭代解的不完全Cholesky共轭梯度法
.
计算机物理杂志。
,
26
,
43
——
65
.

昆施
,
H.R.公司。
(
1987
)
二维格上的内禀自回归及其相关模型
.
生物特征
,
74
,
517
——
524
.

,
年。
内尔德
,
J.A.公司。
(
1996
)
层次广义线性模型(含讨论)
.
J.R.统计。Soc.B公司
,
58
,
619
——
678
.

,
年。
内尔德
,
J.A.公司。
(
2001
)
层次广义线性模型:广义线性模型、随机效应模型和结构化离散的综合
.
生物计量学
,
88
,
987
——
1006
.

,
Y(Y)
.,
内尔德
,
J.答
.和
帕维坦人
,
Y(Y)
. (
2006
)
具有随机效应的广义线性模型的H-似然统一分析
.
博卡拉顿
:
查普曼和霍尔
.

,
美国。
,
克里梅克
,
G.公司。
Darve公司
,
E.公司。
(
2008
)
使用FIND算法计算稀疏矩阵的逆项
.
计算机物理杂志。
,
227
,
9408
——
9427
.

,
C.J。
莫雷
,
J·J。
(
1999
)
内存有限的不完全Cholesky分解
.
SIAM J.科学计算。
,
21
,
24
——
45
.

林格伦
,
F、。
,
Rue街
,
H。
林德斯特伦
,
J。
(
2011
)
高斯场和高斯-马尔可夫随机场之间的明确联系:随机偏微分方程方法(附讨论)
.
J.R.统计。Soc.B公司
,
73
,
423
——
498
.

利特尔
,
钢筋混凝土。
,
米利肯
,
总会计师。
,
频闪
,
西-西。
沃尔芬格
,
钢筋混凝土。
(
1996
)
用于混合模型的SAS系统
.
卡里
:
SAS研究所
.

马利奥托夫
,
D.M.博士。
,
约翰逊
,
J.K。
,
,
医学博士。
威尔斯基
,
A.S.公司。
(
2008
)
GMRF模型中的低秩方差近似:单尺度和多尺度方法
.
IEEE传输。Signl流程。
,
56
,
4621
——
4634
.

马利奥托夫
,
D.M公司
.,
约翰逊
,
J·K
.和
威尔斯基
,
A.S公司
. (
2006
)大规模GMRF模型中的低秩方差估计。
程序。国际协调声学、语音和信号处理
.
图卢兹
:
电气和电子工程师协会
.

曼陀菲尔
,
T.A.公司。
(
1980
)
正定线性系统的不完全因子分解技术
.
数学。计算机
,
34
,
473
——
497
.

麦库拉
,
第页。
(
2002
)
什么是统计模型(有讨论)?
 
安。统计师。
,
30
,
1225
——
1310
.

麦库拉
,
P(P)
. (
2006
)高斯模型的边际似然。
技术报告
.
芝加哥大学
,
芝加哥
.

麦库拉
,
第页。
克利福德
,
D。
(
2006
)
作物产量保角不变性的证据
.
程序。R.Soc.伦敦。A类
,
462
,
2119
——
2143
.

蒙道
,
D类
. (
2005
)一阶内禀自回归和de Wijs过程的变异函数计算。
技术报告479
.
华盛顿大学统计系
,
西雅图
.

蒙道
,
D。
(
2011
)
关于“高斯场和高斯-马尔可夫随机场之间的明确联系:随机偏微分方程方法”的讨论(F.Lindgren、H.Rue和J.Lindström)
.
J.R.统计。Soc.B公司
,
73
,
483
.

蒙道
,
D类
. (
2013
)
边缘校正与内禀自回归的局部二次性
。已提交至生物特征.

蒙道
,
D类
.和
珀西瓦尔
,
D.B公司
. (
2012
)规则和非规则采样时间序列的Slepian小波方差。
现代天文学中的统计挑战V
(编辑
G·J。
 
巴布
电气工程师。
 
菲格尔森
)第38章,pp。
403
——
418
.
纽约
:
施普林格
.

佩奇
,
C.C.公司。
桑德斯
,
文学硕士。
(
1975
)
稀疏线性方程组的求解
.
SIAM J.数字。分析。
,
12
,
617
——
629
.

佩奇
,
C.C.公司。
桑德斯
,
文学硕士。
(
1982
)
LSQR:稀疏线性方程组和稀疏最小二乘的一种算法
.
ACM事务处理。数学。软件。
,
8
,
43
——
71
.

帕克
,
答:。
福克斯
,
C、。
(
2012
)
具有共轭梯度的Krylov空间中的采样高斯分布
.
SIAM J.科学计算
,
34
,
B312型
——
B334型
.

帕特森
,
高密度。
汤普森
,
R。
(
1971
)
块大小不相等时块间信息的恢复
.
生物特征
,
58
,
545
——
554
.

皮涅罗
,
J。
,
贝茨
,
D。
,
德布罗伊
,
美国。
萨卡
,
D。
(
2007
)
NLME:线性和非线性混合效应模型。R软件包版本3.1-57
.

罗宾逊
,
G.K.公司。
(
1991
)
BLUP是一件好事:随机效应的估计
.
统计人员。科学。
,
6
,
15
——
32
.

Rue街
,
H(H)
.和
持有
,
L(左)
. (
2005
)
高斯马尔可夫随机场:理论与应用
.
纽约
:
查普曼和霍尔
.

Rue街
,
H。
,
马蒂诺
,
美国。
肖邦
,
N。
(
2009
)
利用集成嵌套拉普拉斯近似对潜在高斯模型进行近似贝叶斯推断(附讨论)
.
J.R.统计。Soc.B公司
,
71
,
319
——
392
.

萨阿德
,
Y(Y)
. (
2003
)
稀疏线性系统的迭代方法
费城:工业和应用数学学会。

斯坦因
,
M.L公司
. (
1999
)
空间数据插值:克里格的一些理论
.
纽约
:
施普林格
.

频闪
,
西-西。
,
巴恩齐格尔
,
附言。
穆利兹
,
D.K.博士。
(
1994
)
消除小麦产量试验中的空间变异:方法比较
.
作物科学。
,
34
,
62
——
66
.

频闪
,
西-西。
穆利兹
,
D.K.博士。
(
1991
)
最近邻调整最佳线性无偏预测
.
美国统计局
,
45
,
194
——
200
.

威尔金森
,
G.编号。
,
埃克特
,
S.R.公司。
,
汉考克
,
总重量。
梅奥
,
O。
(
1983
)
现场实验的最近邻(NN)分析(讨论)
.
J.R.统计。Soc.B公司
,
45
,
151
——
211
.

齐默尔曼
,
D.L.公司。
阿尔维尔
,
D.A.博士。
(
1991
)
分析田间小区实验和其他空间实验的随机场方法
.
生物计量学
,
47
,
223
——
239
.

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)