总结
有些模型的可能性评估在实践中是不可行的。对于这些模型,无法轻松计算大都会-黑斯廷斯接受概率。例如,当克/克/观察到1个队列,需要对到达和服务分布进行推断。间接推断是一种估计参数的方法θ在模型中,其似然函数不具有分析闭合形式,但可以从中提取固定值的随机样本θ首先选择一个辅助模型,其参数为β可以直接估计。接下来,对原始数据估计辅助模型中的参数,从而进行估计.参数β也可以通过使用多个采样数据集进行估计,这些数据集是从原始模型模拟出的原始参数的不同值θ最后,参数θ这将导致最佳匹配被选为间接推断估计。我们分析了辅助模型应该具有哪些属性才能给出令人满意的间接推断。我们看看数据在向量统计中汇总的情况T型,并选择辅助模型,以便β来自T型只有。在适当的假设下,间接估计量的渐近协方差矩阵与T型与导数的平方成反比的分量θ的预期值T型我们讨论了如何将这些结果用于选择好的估计函数。我们将我们的发现应用于排队问题。
1.简介
间接推理方法(古里鲁等。,1993)已开发用于估计参数向量θ在可以抽样的模型中,但其似然函数没有闭合的分析形式。首先选择一个辅助模型,其参数β可以估计。然后,使用原始数据估计辅助模型的参数,从而进行估计。参数也可以通过使用从原始模型模拟的数据集来估计,这些数据集用于原始参数的各种值θ,导致估算最后,θ被选中,以便比赛最好的。辅助模型应该具有哪些特性才能对θ? Gallant和Tauchen(1996)建议采用包含真实模型的通用模型作为辅助模型。古里埃鲁克斯等。(1993)倾向于使用在某种程度上接近真实模型的辅助模型。直觉表明,辅助模型与真实模型越相似,间接推理效果越好。我们研究了这种相似性的确切含义,并提出了在不同辅助模型之间进行选择的指导原则。
考虑一个数据集年N个=(年1,…,年N个)'假设由具有未知参数的平稳随机过程生成θ.除参数值外,让生成过程已知θ,以便可以为给定的θ更准确地说,让克成为一个N个-值函数,可能取决于θ,并让x是一组具有已知联合密度函数的随机变量,也可能取决于θ,因此年N个=克(θ,x). 如果逆向集{x:年N个=克(θ,x)}计算起来既复杂又费时,就像是2的并集N个子集。那么,即使是中等规模的N个实际中无法计算似然,无法应用计算最大似然估计的算法。这包括马尔可夫链蒙特卡罗方法,因为接受概率需要评估可能性。
隐式统计模型(使用Diggle和Gratton术语(1984))已开发并应用于计量经济学、金融学和人口动力学(古里·鲁克斯和蒙福特,1996; 麦金农和史密斯,1998; 科尔多瓦,1997; 米利和兰皮奇尼,1999; 卡尔佐拉里等。,2001; 施韦德尔等。,1999; 帕斯托雷洛等。,2000)尽管Billio等。(1998)表明,通常可以通过使用隐变量和马尔可夫链蒙特卡罗抽样绕过难以处理的可能性。我们提出了这样一个问题,即用隐藏变量进行扩充无济于事,而据我们所知,间接推断是唯一的可能性。最近,人们注意到排队系统中的事务数据,这些数据只包括单个服务的开始和结束时间,这可能是从自动银行出纳员机器或电信网络节点获得的。这些不完整的数据使推断更加复杂;参见Bhat等。(1997),卢武铉(1999)和琼斯(1999)例如。在节中5我们认为克/克/只有出发时间可用的1个队列。尽管该模型很容易进行模拟,但对似然函数的评估是很难的。在节中2我们描述了间接推理,重点讨论了辅助模型的选择。在节中三我们用一个简单的例子来说明间接推理χ2-分布,并研究辅助模型的选择对参数估计的影响。当推理仅依赖于通过相同统计数据的数据时,不同的模型给出了相同的结果。使用带参数的辅助估计函数β维度高于θ与Gallant和Tauchen相反,可以给出很差的估计(1996). 第节中介绍的渐近理论4和χ2-示例表明,最好根据统计信息选择辅助估计函数T型它有一个小的方差和一个期望值,关于θ.在第节中5,我们将我们的发现应用于从克/克/1个队列。我们建议使用某些图来选择作为辅助估计函数基础的统计数据。最后,第节6包含一些讨论。
2.一类通用的间接推理方法
我们从一个一般的估计函数开始问N个(年N个;β),取决于辅助参数向量β估计函数可以是数据的更简单的似然模型。我们计算了β通过最大化估计函数
1
我们假设问N个几乎可以肯定的是N个→ ∞ 达到确定性极限问∞(θ,β)这取决于θ,数据生成过程的未知参数。让
是绑定函数,并假设它是内射函数。直觉是N个增长到∞,数据年N个携带越来越多关于θ到估算函数中。如果绑定函数b条已知,一对一,一致估计θ将是解决方案属于.想法是替换未知函数b条(·)通过基于模拟的估计。首先我们取样S公司独立数据集
2
从给定的数据生成过程θ.用表示整个模拟数据.然后我们估计参数β从这些模拟中
三
作为N个→ ∞, 这相当于
4
对于每个S公司; 见古里·鲁克斯等。(1993). 在这两种情况下,是的一致函数估计量b条(·)作为N个→ ∞. 下一步是校准θ对于对称正定矩阵ΩN个,我们估计θ将
5
使用Ω定义的度量,最小化基于实际数据的估计和基于模拟数据的估计之间的距离N个. ΩN个在实践中可以用根据数据估计的矩阵来代替。
另一种方法是使用
6
它是一致的和渐近正态的,但不如基于最佳可能Ω的估计(5)有效N个这取决于θ.当尺寸θ和β是相同的,所有无论选择ΩN个和也与见古里·鲁克斯等。(1993)了解详细信息。
显然,估计量的质量在很大程度上取决于估计函数问N个。可能的选择问N个与辅助模型的对数似然函数成正比
7
哪里近似数据的可能性,而β可以估计。数字N个模拟数据集(2)和原始数据集中的点年N个应该是一样的。估计θ是基于最小化和.保持不变N个我们将由于有限样本偏差导致的估计误差降到最低β.如果实际上是对θ,上述程序可用于校正有限样本偏差;见Kuk(1995)对于广义线性混合模型的情况。校正类似于使用引导程序;见古里·鲁克斯和蒙福特(1996). 卡尔佐拉里等。(1998)合并控制变量以减少间接推断中的方差。
还有其他基于仿真的估计方法。矩的模拟方法(McFadden,1989; 达菲和辛格尔顿,1993; 帕克斯和波拉德,1989)是间接推理的特例,它是在其他方法之前发明的,当,其中米我是我第个时刻。Gouriéroux和Monfort中描述了模拟的最大似然(1996). 其想法是寻找一组潜在变量u个和一个无偏见的模拟器属于(f)(年t吨;θ)这样的话.的模拟最大似然估计器θ是
哪里,t吨=1,…,N个,是已知分布的独立图纸u个.挖掘和雕刻(1984)和Hazelton(1995)还使用了真实模型中不同值的模拟θ通过非参数密度估计估计真似然函数。费曼和萨拉尼(2001)证明了带宽为0时的渐近效率。
3.哪个估算函数?
让数据年N个是来自χ2-带参数分布θ=3个自由度。我们创建了500个大小的数据集N个= 100. 对于每个这样的数据集,有S公司=50个大小的模拟数据集N个=100由χ2-几个值的分布θ,z(z)N个(θ),θ= 0.60,0.62,…,5.40,秒= 1,…,S公司.确保不同θ在模拟数据中θ的每个值使用相同的随机数θ重复50次。我们比较了四种辅助模型:
- (a)
gamma(两个参数);
- (b)
χ2(一个参数);
- (c)
正常(两个参数);
- (d)
指数(一个参数);
我们使用了估计函数(7)。此外,我们采用了矩匹配方法:
- (e)
- (f)
匹配原始数据和模拟数据的对数平均值,后者是一个充分的统计量,(8b)
表1显示了六种不同估计值的500个独立实验的平均值、标准偏差和平方根误差(RMSE)θ为了进行比较,第一行显示了在正确模型上通过最大似然法获得的结果。
模型. | 平均值. | 标准偏差. | RMSE公司. |
---|
最大可能性 | 3 | 0.217 | 0.216 |
(a) 伽马射线 | 2.996 | 0.215 | 0.215 |
(b)χ2 | 3.038 | 0.219 | 0.222 |
(c) 正常 | 3.020 | 0.331 | 0.331 |
(d) 指数 | 3.025 | 0.251 | 0.252 |
(e) 平均值 | 3.025 | 0.251 | 0.252 |
(f) 平均对数 | 3.047 | 0.219 | 0.224 |
模型. | 平均值. | 标准偏差. | RMSE公司. |
---|
最大可能性 | 3 | 0.217 | 0.216 |
(a) 伽马射线 | 2.996 | 0.215 | 0.215 |
(b)χ2 | 3.038 | 0.219 | 0.222 |
(c) 正常 | 3.020 | 0.331 | 0.331 |
(d) 指数 | 3.025 | 0.251 | 0.252 |
(e) 平均值 | 3.025 | 0.251 | 0.252 |
(f) 平均对数 | 3.047 | 0.219 | 0.224 |
模型. | 平均值. | 标准偏差. | RMSE公司. |
---|
最大可能性 | 3 | 0.217 | 0.216 |
(a) 伽马射线 | 2.996 | 0.215 | 0.215 |
(b)χ2 | 3.038 | 0.219 | 0.222 |
(c) 正常 | 3.020 | 0.331 | 0.331 |
(d) 指数 | 3.025 | 0.251 | 0.252 |
(e) 平均值 | 3.025 | 0.251 | 0.252 |
(f) 平均对数 | 3.047 | 0.219 | 0.224 |
模型. | 平均值. | 标准偏差. | RMSE公司. |
---|
最大可能性 | 3 | 0.217 | 0.216 |
(a) 伽马射线 | 2.996 | 0.215 | 0.215 |
(b)χ2 | 3.038 | 0.219 | 0.222 |
(c) 正常 | 3.020 | 0.331 | 0.331 |
(d) 指数 | 3.025 | 0.251 | 0.252 |
(e) 平均值 | 3.025 | 0.251 | 0.252 |
(f) 平均对数 | 3.047 | 0.219 | 0.224 |
我们看到手段都非常相似。伽马的标准偏差,χ2匹配对数的平均值也同样小。使用指数或匹配平均值是相同的,但稍差一些。正常辅助模式最差。具有固定方差的正态辅助模型给出与指数辅助模型相同的结果。因此,选择一个比数据生成模型参数更多的辅助模型可能会导致较差的结果。估计函数(7),带有(f)一指数密度仅取决于数据的平均值,就像使用估计函数时一样(8)。虽然指标不同,但结果完全相同。让T型N个表示数据的统计向量年N个,因此
9
为简单起见,假设S公司= 1. 然后和是的估计器θ.假设T型N个,β和θ具有相同的尺寸,并且值为θ这样的话T型N个{z(z)N个(θ)} =T型N个(年N个). 那么,任何合理的功能(f)用于测量匹配的值将导致相同的结果。
如果我们可以选择辅助统计,间接推断是成功的T型N个{z(z)N个(θ)}对相关参数的变化敏感θ但对样本的随机变化具有鲁棒性对于给定的此类θ,即当我们模拟数据时对于不同的值θ并使用相同的随机数T型N个{z(z)N个(θ)}应在以下方面有所不同θ.何时θ保持不变,并使用不同的随机数进行模拟,我们希望统计数据保持稳定。更准确地说,var{T型N个(z(z)N个(θ)}应分量较小,且E类[T型N个{z(z)N个(θ)}]/∂θ组件大小,至少在真实值附近θ.间接推理必须能够识别θ通过以下样品T型N个{z(z)N个(θ)}. 如果T型N个{z(z)N个(θ)}与预期的导数相比,它很大,将更难检测到θ通过变化T型N个.
在χ2-例如,我们使用三个自然统计数据来说明这些标准
大致在同一尺度上。我们从500个数据实验中估计了统计数据的方差。三个方差分别为0.062、0.079和0.044。的预期值χ2-分布是θ,方差为2θ.因此
对于秒=1,…,50在θ,当相同的随机数用于θ.近似为√(2θ). 自T型(2)此外,其方差大于T型(1),不应首选。
绘图对于秒=1,…,50作为的函数θ∈{0.60,0.62,…,5.40}和我=1,2,3,我们发现T型(1)线性增长T型(2)作为平方根和T型(3)至少对于θ>1.5; 参见Heggland和Frigessi(2003)了解详细信息。所有三个统计数据的分布范围在θ.T型(2)变化较小:最大值为θ使用过的,θ= 5.4,T型(2)介于2.5和4.0之间;什么时候θ=3,介于1.8和3.2之间。这证实了T型(2)不是一个好的辅助统计。我们估计的导数E类(T型(我))英寸θ=3.0,作为
得到了0.99、0.41和0.96。T型(2)具有最小的导数。T型(3)导数略小于T型(1)但方差要小得多,这与基于此统计的估计量似乎具有更好的性能这一事实是一致的。
4.渐近
现在我们来看一下间接推断估计量的渐近性质。追随古里·鲁克斯等。(1993),我们可以证明N个→ ∞ 在某些假设下,间接推断估计量的质量等式中给出(5)取决于所选统计的期望梯度和协方差矩阵。为了完整性,我们在这里总结结果。
定理1。让T型N个{z(z)N个(θ)}是辅助统计的向量。假设期望和协方差矩阵有极限
假设所选估算函数仅依赖于以下数据T型N个,因此有一些功能(f)对于其中问N个(z(z)N个,β)=(f)[T型N个{z(z)N个(θ)},β]. 假设这个表达式几乎肯定收敛到极限(f){μ(θ),β}. 让θ0是用于生成数据的真实值,并且
让是间接估计量(5)。让ΩN个几乎肯定会收敛到极限ΩN个→ ∞. 然后,在进一步的规则性条件下附录A,有一个正定矩阵W公司(S公司,Ω),以便
作为分发N个→ ∞ 对于任何固定S公司.如果是ΩN个选择使其极限Ω=Ω*最小化W公司(S公司,Ω),然后
10
什么时候?T型N个,β和θ尺寸相同,那么
11
与Ω无关*.矩阵ψμ′(θ0)/∂θ有(我,j个)第th个元素≠μ我(θ)/∂θj个计算单位:θ0类似地,条目(k个,我)单位:2(f){μ(θ),β}/∂β∂μ为2(f){μ(θ),β}/∂βk个∂μ我.
有关证明,请参见附录A.
渐近协方差(11)与所选的特定估计函数无关(f)最有趣的是,它与∑成正比(θ0),所选统计量的渐近协方差矩阵,与导数的元素成反比μ′(θ0)/∂θ,是统计期望值极限的导数。
什么时候?T型N个是真模型和dim的充分统计量(T型N个)=尺寸(β)=尺寸(θ),方程式(11)等于最大似然估计量的渐近方差,因子1+1除外/S公司除此之外,当辅助模型是真实模型或仅通过真实模型的充分统计量依赖于数据时,间接推断估计器是有效的。当T型N个,β和θ不一样,等式(10)持有。再一次是μ′(θ0)/∂θ和∑(θ0)虽然以更复杂的方式呈现。
为了比较不同的辅助统计数据,我们可以估计和,从真实模型中以一定值进行模拟这代表了对θ虽然是一个迭代方案(估计θ0,找到最佳统计,估计θ0使用这个等等)可能会更好。
在χ2-第节中的示例三,我们比较了基于统计的间接估计量的渐近方差
自E类(z(z)我)=θ,变量(z(z)我)=2θ,和,因此
我们得到了θ基于T型(1),T型(4)和T型(5)分别地
我们看到了W公司(5)(S公司) >W公司(4)(S公司) >W公司(1)(S公司)为所有人θ> 0. 一种基于T型(5)其渐近方差比基于T型(1)这里,基于平均值的估计值要比基于标准偏差的估计值好得多。
5.从起飞时间推断克/克/1个队列
克/克/1是一个单服务器先到先服务队列,具有到达间隔和服务时间的一般分布。假设只观察到出发时间,并且到达和服务过程的分布在参数范围内已知。我们首先表明,可能性是难以处理的,因为它的评估需要在维度上呈指数级的多个步骤N个数据的。
让Y(Y)n个表示与n个第个客户。让W公司n个是相应的到达间隔时间U型n个服务时间相互独立,具有有限的期望和方差。让E类(W公司)>E类(U型). 到达间隔和服务时间具有已知的参数密度
考虑到部门之间的时间年N个=(年1,年2,…,年N个)我们对θ.对于跨部门时间流程{Y(Y)n个}它认为
12
很明显{Y(Y)n个,n个=1,2,…}通常不是马尔可夫过程,因为Y(Y)n个依赖于所有的过去和相关结构是复杂的。
我们需要反复评估可能性
13
可以写成2N个-给定数据集的维积分年N个和不同的参数向量θ。在这里(f)(年N个|u个N个,w个N个)是一个δ函数,因为年N个鉴于u个N个和w个N个具有确定性。因此,所有可能的组合u个N个和w个N个需要确定,这可能会产生观测数据。我们用根表示构造一棵二叉树年1=u个1。下一级有两种可能性:年2=u个2如果w个1+w个2<u个1; 否则年2=u个2−u个1+w个1+w个2。我们这样做是为了构建一棵有2N个树叶。从根到叶的每一条路径都描述了一组等式和不等式,如果这些等式和不等式可以联合求解,则表示一个可行的选择(u个N个,w个N个)这与数据是一致的。树的每一层都有一个新的w个-添加变量,以便路径上所有条件的交集通常不为空。(在特殊情况下,例如当到达间密度具有有限支持时,它可以为空。)步数为指数(inN个)必须执行以计算积分(13),这在实践中是不可行的,即使是中等大小的N个.
比利奥等。(1998)提出了一种计算最大似然估计的替代方法,称为模拟似然比法。最大化可能性(f)(年N个)等于最大化条件期望对于固定值,其中小时是一组潜在变量,期望是关于小时鉴于年N个和.给定样品小时1,…,小时S公司根据这个条件密度,期望值可以近似为
如果全关节模型(f)(年N个,小时)可以进行评估,然后有一个马尔可夫链蒙特卡罗算法可以生成所需的样本小时1,…,小时S公司,仅基于比率评估.但密度(f)(年N个,u个N个,w个N个)实际中无法评估出发时间。
计算可能性的另一种方法是根据潜在变量设定条件V(V)n个表示未观察到的等待时间。它认为
14
变量{U型n个−1−W公司n个}是独立的,也是U型n个−1−W公司n个属于V(V)n个−1. {V(V)n个}是马尔可夫链,可以写出向量密度的显式表达式V(V)n个.以等待时间为条件,部门间时间流程满足
15
即使有条件{V(V)n个}Y(Y)n个s不是马尔可夫链。表达式(15)W公司n个和U型n个−1不独立于V(V)n个。正在尝试条件U型N个和W公司N个导致类似的问题。
可能会引入不同的、不太自然的潜在变量,从而采用多项式方法来评估可能性,尽管我们推测该问题通常是NP难的;见加里和约翰逊(1979). 羽毛头(2003)讨论了特殊情况,包括克/M(M)/1个队列,可以为其设计多项式算法。在Heggland和Frigessi(2003)我们描述了一种进一步的方法,它不是基于方程(13)导致指数算法。
间接推断不需要评估可能性。为了具体起见,假设服务时间在间隔内均匀分布[θ1,θ2]到达间隔时间随参数呈指数分布θ三。我们用一个数据集进行实验,该数据集包括N个=从稳定队列生成的100个连续间隔时间θ1= 0.3,θ2=0.9和θ三= 1. 我们已经创建了50个独立的数据副本,我们称之为原始数据。利用50个数据集,我们可以获得各种间接推断估计量分布的合理概念。为了公平比较辅助模型,相同的模拟数据用于所有实验。在我们的设置中,间接推断基于一组统计数据,这些统计数据可以总结出未知的数据生成分布。由于平均服务时间小于平均到达间隔时间,因此到达和离开过程应该相似。因此,我们选择间隔时间的平均值作为此类统计数据之一。最小间隔时间不能小于最小服务时间。由于服务是均匀分布的,所以我们取观察到的最小间隔。我们通过可视化其可变性的图表分析这些统计数据的期望值和方差。让T型N个{z(z)N个(θ)}是模拟间隔时间的任何统计数据,其中θ=(θ1,θ2,θ三). 我们依次改变每个参数,同时保持其他参数不变。因为我们知道真实值(0.3,0.9,1.0),所以我们简化了练习并将其分配给固定参数。在实际环境中,必须进行一些初步估计(可能会重复进行)。说θ三变化范围为[0.8,1.3]。对于每个这样的值,我们进行采样z(z)N个(0.3,0.9,θ三)使用相同的随机数并计算统计数据T型N个{z(z)N个(θ)}. 这将生成一个T型N个{z(z)N个(θ)}作为的函数θ三然后用新的随机数重复该过程,比如每次重复50次,以研究不同模拟数据集之间变异性的影响。我们从开始 图1(a) 显示了这50条曲线,作为θ1同样,图1(b)和1(c) 显示的可变性作为的功能θ2和θ三.更改的值θ1或θ2不影响,而在θ三和。接下来我们考虑统计数据生成的最小数据。此图绘制于图1(d)-1(f)作为每个参数的函数。更改的值θ2和θ三不影响最小值,但与θ1(注意一些曲线的不连续性,如果N个足够大。)这表明z(z)N个可能导致估计θ1和θ三。两者似乎都没有传播信息θ2我们尝试了其他统计数据,包括中值z(z)医学属于z(z)N个.图1(g)-1(i))显示中值随着θ2但与期望的导数相比,其方差太大。
![(a) z³对θ1;(b) z³对θ2;(c) z³对θ3;(d) zminversusθ1;(e) zmin与θ2的关系;(f) zminversusθ3;(g) zmed与θ1;(h) zmed与θ2;(i) zmed与θ3;(j) β^2MLversusθ1;(k) β^2MLversusθ2;(l) β^2MLversusθ3](https://oup.silverchair-cdn.com/oup/backfile/Content_public/Journal/jrsssb/66/2/10.1111_j.1369-7412.2003.05341.x/4/m_rssb_66_2_447_f1.gif?Expires=1721239354&Signature=IDJvwhlpSrvpWCvYW5eTXl51xHUCY9wDJCkw3XBpScCeGZtt-cifSlWyGA7xsaWNU-lS3rwApTkj9CLXNwe2udALUcPl0igBhpHjmLq806Ckgk8GmqqlEGxXQRKtNjhyT3JoBPL2fVsevfR7qnzNVFJQXFqVHnVdsx5~OaIRILkpon2bRJmzfma8WeyMlf0k66M7tivwVvxahcc1SQB0LR8HmDDcdz8eFCCZOjUpTrPmBkR9BZ06w-pTyWRAjWaWj4oga3Om5N7L~kyQXkP578I4xEvdpHkPvBioXG3QTgMcaA2hRqU5sY9alfrvoRYqPNxiiAG-7hpdkmSEbgpZKA__&Key-Pair-Id=APKAIE5G5CRDK6RD3PGA)
图1
(a)与θ1; (b)与θ2; (c)与θ三; (d)z(z)最小值与θ1; (e)z(z)最小值与θ2; (f)z(z)最小值与θ三; (g)z(z)医学与θ1; (h)z(z)医学与θ2; (i)z(z)医学与θ三; (j)与θ1; (k)与θ2; (l)与θ三
为了找到均匀分布上限的统计量,我们选择了一个辅助模型,其参数的最大似然估计可以作为统计量。接头密度c(年)从稳定状态开始的一次产后时间M(M)/克/可以计算出1个具有独立指数间隔的队列;见格罗斯和哈里斯(1998),第234页。对于统一服务时间,这是
16
我们假设辅助模型具有独立的出发时间,每个出发时间具有边际密度(16)。我们将其三个参数表示为β=(β1,β2,β三)其中[β1,β2]是均匀密度和β三是指数参数。很容易看出β1是最小起飞时间z(z)最小值.让表示的最大似然估计量β2.图1(j)-1(l)显示密谋反对θ1,θ2和θ三,对于大多数数据集在中似乎是线性的θ2,而θ1和θ三似乎收效甚微。
我们选择统计数据一种替代方法是通过辅助模型(16),该辅助模型不使用但是这两个统计数据非常相似(Heggland和Frigessi,2003). 这导致两种变体的性能非常相似。
接下来,我们决定在方程式中使用估计函数(9)(1). 当统计量和参数的维数相同时,渐近方差与估计函数无关,如本例所示。所以我们选择了(f)(T型N个,β)这样的话
我们使用等式(5)计算,我们取ΩN个作为统计量的协方差矩阵的倒数T型,根据原始50个数据集估计。逐渐选择ΩN个没有影响。在实际情况下,当只有一个数据集可用时,这是不可能的,我们将首先估计参数θ使用单位矩阵作为ΩN个然后模拟几个数据集来估计β见古里·鲁克斯等。(1993)有关选择Ω的更多详细信息N个.
优化和估算如下。首先,我们模拟数据来自克/克/网格上的1个队列θ-值(0.20,0.24,……,0.40)×(0.80,0.84,…,1.04)×(0.90,0.88,…,1.28)。对于每个网格点,总计S公司=生成50个数据集。当模拟不同的值时θ通过函数,则仅θ是可变的,而随机变量X(X)保持固定。估计值属于θ对于每个数据集,使用以下等式(5)最大化是最重要的θ-网格的值。原则上可以执行牛顿-拉斐逊最大化或模拟退火,而不是基于普通网格的搜索。事实上,正如Diggle和Gratton所建议的那样,我们改进了网格搜索,用最小二乘法拟合局部二次近似(1984). 将二次曲面最大化以获得最终的间接推断估计θ参见Heggland和Frigessi(2003)了解更多详细信息。这个程序给了我们50个估计值.估计平均值、标准偏差和RMSE,,可以计算。
在表中2我们给出了统计结果,非常好。估计θ三在等式中使用带独立边距(16)的对数似然法时没有改善(7). 那里显示而不是。尽管总体统计数据看起来最好,我们可以得到更好的估计θ三(就小RMSE而言)使用两个正态分布和五维参数的混合物作为辅助模型β=(μ1,σ1,μ2,σ2,第页),每个分布的两个参数和混合参数第页.假设间隔时间独立。此模型与真实模型没有正式关系。我们从表中看到2估计θ三更好。我们尝试了一种均匀指数混合作为辅助模型,具有独立的区间时间。辅助参数是四维的。该模型表现较差,三个参数的RMSE分别为0.043,0.076,0.099。令人惊讶的是,这种模型比混合法线模型更糟糕,因为均匀分量和指数分量更自然。部分间隔时间均匀分布,而其余时间遵循指数和均匀密度的卷积。
参数. | 手段. | 标准偏差. | RMSE公司. |
---|
(a). | (b). | (c). | (a). | (b). | (c). | (a). | (b). | (c). |
---|
θ1 | 0.301 | 0.301 | 0.302 | 0.011 | 0.011 | 0.035 | 0.011 | 0.011 | 0.035 |
θ2 | 0.886 | 0.883 | 0.868 | 0.040 | 0.041 | 0.060 | 0.042 | 0.043 | 0.068 |
θ三 | 0.982 | 1.005 | 0.987 | 0.100 | 0.110 | 0.091 | 0.100 | 0.109 | 0.091 |
参数. | 手段. | 标准偏差. | RMSE公司. |
---|
(a). | (b). | (c). | (a). | (b). | (c). | (a). | (b). | (c). |
---|
θ1 | 0.301 | 0.301 | 0.302 | 0.011 | 0.011 | 0.035 | 0.011 | 0.011 | 0.035 |
θ2 | 0.886 | 0.883 | 0.868 | 0.040 | 0.041 | 0.060 | 0.042 | 0.043 | 0.068 |
θ三 | 0.982 | 1.005 | 0.987 | 0.100 | 0.110 | 0.091 | 0.100 | 0.109 | 0.091 |
参数. | 手段. | 标准偏差. | RMSE公司. |
---|
(a). | (b). | (c). | (a). | (b). | (c). | (a). | (b). | (c). |
---|
θ1 | 0.301 | 0.301 | 0.302 | 0.011 | 0.011 | 0.035 | 0.011 | 0.011 | 0.035 |
θ2 | 0.886 | 0.883 | 0.868 | 0.040 | 0.041 | 0.060 | 0.042 | 0.043 | 0.068 |
θ三 | 0.982 | 1.005 | 0.987 | 0.100 | 0.110 | 0.091 | 0.100 | 0.109 | 0.091 |
参数. | 手段. | 标准偏差. | RMSE公司. |
---|
(a). | (b). | (c). | (a). | (b). | (c). | (a). | (b). | (c). |
---|
θ1 | 0.301 | 0.301 | 0.302 | 0.011 | 0.011 | 0.035 | 0.011 | 0.011 | 0.035 |
θ2 | 0.886 | 0.883 | 0.868 | 0.040 | 0.041 | 0.060 | 0.042 | 0.043 | 0.068 |
θ三 | 0.982 | 1.005 | 0.987 | 0.100 | 0.110 | 0.091 | 0.100 | 0.109 | 0.091 |
最后,我们对该框架中不连续似然函数的影响进行了评论。考虑均匀指数混合模型,并表示为一和b条均匀分量的参数。这些应该是合理的估计θ1和θ2.当我们改变时θ2在真实模型中,这应该反映在对b条不幸的是,对于小型企业来说,这可能并不一定如此N个.考虑的最大似然估计b条。通过构造,这将始终位于其中一个数据点。回想一下,我们通过使用相同的随机数模拟真实模型中的数据集,只需更改参数的值。说我们保持θ1和θ三不变,但有所改变θ2。然后,数据集中给定点的值随θ2然而,最大似然估计b条可能会突然改变:θ2可能导致对b条估计的结合函数的这种不连续性使得间接推断变得困难。什么时候?N个足够大时,这个问题就不那么严重了,因为数据点之间会更接近,而且更一般地说,绑定功能是连续的。此外,通过对几个(我们取50个)模拟数据集的辅助参数估计值进行平均,也可以降低影响,但无法解决。注意,使用正常混合模型时不会出现此问题,因为似然函数是连续的,因此辅助参数是真实参数的平滑函数。
6.讨论
间接推理方法是在具有难以处理的似然函数的模型中进行参数估计的有用工具。当间接推断基于统计时,间接推断估计器的渐近方差与该统计的渐近方差成正比,与该统计期望值相对于参数的导数成反比。因此,估计函数的选择应该以这些标准为指导。这对估计质量的影响是显著的。选择正确的统计数据是一项困难的任务,图形方法是我们选择对参数变化敏感的统计数据的最佳工具θ,但对用相同方法生成的样本中的随机变化不敏感θ。由于需要进行数值优化,统计值应随θ对于小样本,这可能是一个关键点。
通常使似然函数难以推导的是数据的复杂依赖结构。如果可以计算边际分布,并且这些分布包括所有感兴趣的参数,那么可以最大化这些边际的乘积,而不是完全似然,从而忽略相关性。这通常会导致有偏差和无效的估计。一个例子是离散观测到的扩散;见比比和瑟伦森(2001)和瑟伦森(2001)例如。在空间吉布斯模型中感兴趣的参数通常存在于相互作用项和伪似然中(Besag,1986)相反,可以最大化,从而再次导致次优估计。在所有这些情况下,基于这些估计函数的间接推断都可以用于纠正估计量的偏差。一种估计函数,用于从克/克/1队列基于此思想,性能良好。忽略相关性并最大化边际乘积,我们得到的RMSE等于0.015、0.045和0.105θ1,θ2和θ三分别是。将此与表进行比较2我们看到这类似于使用间接推理作为辅助模型。主要差异在于θ1,其中RMSE因偏差增加而增加。
间接推理方法已被考虑用于经常光顾的场合。将它们扩展到贝叶斯上下文将非常有趣。假设关于θ可以用先前的密度来概括π(θ). 让根据方程式计算(3)或(4)。然后不用方程式(6)我们建议计算作为贝叶斯点估计θ类似地,方程式(5)可能会受到处罚。
最近,Genton和Ronchetti(2003)考虑了模型的误指定和间接推断估计的稳健性。如果数据年N个不完全遵循模拟假设的模型,间接推理是如何执行的?他们研究了估计器的局部稳健性,并导出了影响函数。这使得他们能够设计出在与假设模型存在微小偏差的情况下稳定的间接推理程序。
致谢
我们感谢Magne Aldrin,他建议克/克/例如,英格丽德·格拉德(Ingrid Glad)、梅特·兰格斯(Mette Langaas)和本特·纳特维格(Bent Natvig)就间接推理进行了许多有趣且富有成果的讨论。这项研究得到了欧盟网络ERB-FMRX-CT96-0095和挪威研究委员会通过项目121144/420和BeMatA的支持。
工具书类
附录A
为了完整起见,我们给出了Gouriéroux中主要结果的一个版本等。(1993),它关系到绑定函数的导数。假设估算函数问N个满足limN个→∞[问N个{z(z)N个(θ0),β}]=问∞(θ0,β),取决于真参数θ0.让问∞在中连续β并且具有独特的最大值β0=arg最大值{问∞(θ0,β)}. 然后是的一致估计量β0.让binding函数
哪里k个和我是的尺寸θ和β分别是内射的,并设β0=b条(θ0). 这个k个×我矩阵∏2问∞/∂θ∂β'已(我,j个)-形式为∏的条目2问∞(θ,β)/∂θ我∂βj个.让矩阵ξb条(θ0)/∂θ′=∂b条(θ)/∂θ′|θ=θ0具有完整的列级别。假设真实模型足够规则
具有零均值和一些有限渐近协方差矩阵lim的渐近正态N个→∞{变量θ0(ξN个)}. 让极限
和
存在。然后,作为N个→ ∞, 间接估计是一致的和渐近正态的
哪里
最小化W公司(S公司,Ω)相对于Ω导致最佳权重函数。通过此选择,渐近协方差矩阵等于
当β和θ都一样,我们有和
在定理1中,结合函数和渐近估计函数的导数被与所选择的统计量相关的量所取代。
A.1、。定理1的证明
自分化以来β和θ'给予
导数的一阶展开(f)/∂β围绕μ(θ)是
渐近保持在N个。我们现在可以导出我0和J0作为μ(θ)和∑(θ):
和
Ω的最佳选择是
间接推断估计量的渐近方差为
如果T型N个,β和θ都有相同的尺寸,我们有
假设矩阵导数2(f){μ(θ0),β0}/∂β∂μ′和ψμ′(θ0)/∂θ是可逆的。
©2004皇家统计学会