间接推理中的函数估计

估计值的平均值、标准偏差和RMSEθ使用不同的辅助模型

模型	平均值	标准偏差	RMSE公司
最大可能性	3	0.217	0.216
（a）伽马射线	2.996	0.215	0.215
（b）χ²	3.038	0.219	0.222
（c）正常	3.020	0.331	0.331
（d）指数	3.025	0.251	0.252
（e）平均值	3.025	0.251	0.252
（f）平均对数	3.047	0.219	0.224

模型	平均值	标准偏差	RMSE公司
最大可能性	3	0.217	0.216
（a）伽马射线	2.996	0.215	0.215
（b）χ²	3.038	0.219	0.222
（c）正常	3.020	0.331	0.331
（d）指数	3.025	0.251	0.252
（e）平均值	3.025	0.251	0.252
（f）平均对数	3.047	0.219	0.224

表1

估计值的平均值、标准偏差和RMSEθ使用不同的辅助模型

模型	平均值	标准偏差	RMSE公司
最大可能性	3	0.217	0.216
（a）伽马射线	2.996	0.215	0.215
（b）χ²	3.038	0.219	0.222
（c）正常	3.020	0.331	0.331
（d）指数	3.025	0.251	0.252
（e）平均值	3.025	0.251	0.252
（f）平均对数	3.047	0.219	0.224

模型	平均值	标准偏差	RMSE公司
最大可能性	3	0.217	0.216
（a）伽马射线	2.996	0.215	0.215
（b）χ²	3.038	0.219	0.222
（c）正常	3.020	0.331	0.331
（d）指数	3.025	0.251	0.252
（e）平均值	3.025	0.251	0.252
（f）平均对数	3.047	0.219	0.224

我们看到手段都非常相似。伽马的标准偏差，χ²匹配对数的平均值也同样小。使用指数或匹配平均值是相同的，但稍差一些。正常辅助模式最差。具有固定方差的正态辅助模型给出与指数辅助模型相同的结果。因此，选择一个比数据生成模型参数更多的辅助模型可能会导致较差的结果。估计函数（7），带有（f）_一指数密度仅取决于数据的平均值，就像使用估计函数时一样（8）。虽然指标不同，但结果完全相同。让T型_N个表示数据的统计向量年_N个，因此

问_{N个} (年_{N个}, β) = （f） {{T型}_{N个} (年_{N个}), β} .

9

为简单起见，假设S公司= 1. 然后 ${\hat{β}}_{N个} (θ) = 参数 {最大值}_{β} (（f） [{T型}_{N个} {{z（z）}_{N个} (θ)}, β])$ 和 ${\tilde{θ}}_{N个} = 参数 {最大值}_{θ} [（f） {{T型}_{N个} (年_{N个}), {\hat{β}}_{N个} (θ)}]$ 是的估计器θ.假设T型_N个,β和θ具有相同的尺寸，并且值为θ这样的话T型_N个{z（z）_N个(θ)} =T型_N个(年_N个). 那么，任何合理的功能（f）用于测量匹配的值将导致相同的结果。

如果我们可以选择辅助统计，间接推断是成功的T型_N个{z（z）_N个(θ)}对相关参数的变化敏感θ但对样本的随机变化具有鲁棒性 ${z（z）}_{N个}^{秒} (θ)$ 对于给定的此类θ，即当我们模拟数据时 ${z（z）}_{N个}^{秒} (θ)$ 对于不同的值θ并使用相同的随机数T型_N个{z（z）_N个(θ)}应在以下方面有所不同θ.何时θ保持不变，并使用不同的随机数进行模拟，我们希望统计数据保持稳定。更准确地说，var{T型_N个(z（z）_N个(θ)}应分量较小，且E类[T型_N个{z（z）_N个(θ)}]/∂θ组件大小，至少在真实值附近θ.间接推理必须能够识别θ通过以下样品T型_N个{z（z）_N个(θ)}. 如果T型_N个{z（z）_N个(θ)}与预期的导数相比，它很大，将更难检测到θ通过变化T型_N个.

在χ²-例如，我们使用三个自然统计数据来说明这些标准

\begin{matrix} {T型}^{(1)} = \frac{1}{N个} \sum_{n个 = 1}^{N个} {z（z）}_{n个} (θ), \\ {T型}^{(2)} = \sqrt{[} \frac{1}{N个 - 1} \sum_{n个 = 1}^{N个} {{z（z）}_{n个} (θ) - {T型}^{(1)}}^{2}], \\ {T型}^{(三)} = 经验 [\frac{1}{N个} \sum_{n个 = 1}^{N个} 日志 {{z（z）}_{n个} (θ)}], \end{matrix}

大致在同一尺度上。我们从500个数据实验中估计了统计数据的方差。三个方差分别为0.062、0.079和0.044。的预期值χ²-分布是θ，方差为2θ.因此

{T型}_{秒}^{(1)} (θ) = \frac{1}{N个} \sum_{n个 = 1}^{N个} {z（z）}_{n个}^{秒} (θ)

对于秒=1，…，50在θ，当相同的随机数用于θ. ${T型}_{秒}^{(2)} (θ)$ 近似为√（2θ). 自T型⁽²⁾此外，其方差大于T型⁽¹⁾，不应首选。

绘图 ${T型}_{秒}^{(我)} (θ)$ 对于秒=1，…，50作为的函数θ∈{0.60,0.62，…，5.40}和我=1,2,3，我们发现T型⁽¹⁾线性增长T型⁽²⁾作为平方根和T型⁽³⁾至少对于θ>1.5; 参见Heggland和Frigessi(2003)了解详细信息。所有三个统计数据的分布范围在θ.T型⁽²⁾变化较小：最大值为θ使用过的，θ= 5.4,T型⁽²⁾介于2.5和4.0之间；什么时候θ=3，介于1.8和3.2之间。这证实了T型⁽²⁾不是一个好的辅助统计。我们估计的导数E类(T型^(我))英寸θ=3.0，作为

{\frac{\partial}{\partial θ} E类 ({T型}^{(我)}) |}_{θ = 三} \approx \frac{(1 / 50) \sum_{秒 = 1}^{50} {T型}_{秒}^{(我)} (3.02) - (1 / 50) \sum_{秒 = 1}^{50} {T型}_{秒}^{(我)} (2.98)}{3.02 - 2.98} 我 = 1, 2, 三,

得到了0.99、0.41和0.96。T型⁽²⁾具有最小的导数。T型⁽³⁾导数略小于T型⁽¹⁾但方差要小得多，这与基于此统计的估计量似乎具有更好的性能这一事实是一致的。

4.渐近

现在我们来看一下间接推断估计量的渐近性质。追随古里·鲁克斯等。(1993)，我们可以证明N个→ ∞ 在某些假设下，间接推断估计量的质量 ${\hat{θ}}_{S公司 N个}$ 等式中给出(5)取决于所选统计的期望梯度和协方差矩阵。为了完整性，我们在这里总结结果。

定理1。让T型_N个{z（z）_N个(θ)}是辅助统计的向量。假设期望和协方差矩阵有极限

\begin{matrix} μ (θ) : = \underset{N个 \to \infty}{林} ({E类}_{θ} [{T型}_{N个} {{z（z）}_{N个} (θ)}]), \\ Σ (θ) : = \underset{N个 \to \infty}{林} ({无功功率，无功功率}_{θ} [{N个}^{1 / 2} {T型}_{N个} {{z（z）}_{N个} (θ)}]) . \end{matrix}

假设所选估算函数仅依赖于以下数据T型_N个，因此有一些功能（f）对于其中问_N个(z（z）_N个,β)=（f）[T型_N个{z（z）_N个(θ)},β]. 假设这个表达式几乎肯定收敛到极限（f）{μ(θ),β}. 让θ₀是用于生成数据的真实值，并且

β_{0} = 参数 \underset{_{β}}{最大值} [（f） {μ (θ_{0}), β}] .

让 ${\hat{θ}}_{S公司 N个} (Ω_{N个})$ 是间接估计量（5）。让Ω_N个几乎肯定会收敛到极限ΩN个→ ∞. 然后，在进一步的规则性条件下附录A，有一个正定矩阵W公司(S公司，Ω），以便

{N个}^{1 / 2} {{\hat{θ}}_{S公司 N个} (Ω_{N个}) - θ_{0}} \to N个 {0, W公司 (S公司, Ω)}

作为分发N个→ ∞ 对于任何固定S公司.如果是Ω_N个选择使其极限Ω=Ω^*最小化W公司(S公司，Ω），然后

\begin{array}{l} W公司 (S公司, Ω^{*}) = (1 + \frac{1}{S公司}) (\frac{\partial μ}{\partial θ^{'}} (θ_{0}) \frac{\partial^{2} （f）}{\partial μ \partial β^{'}} {μ (θ_{0}), β_{0}} \\ \times {[\frac{\partial^{2} （f）}{\partial β \partial μ^{'}} {μ (θ_{0}), β_{0}} Σ (θ_{0}) \frac{\partial^{2} （f）}{\partial μ \partial β^{'}} {μ (θ_{0}), β_{0}}]}^{- 1} \\ {\times \frac{\partial^{2} （f）}{\partial β \partial μ^{'}} {μ (θ_{0}), β_{0}} \frac{\partial μ^{'}}{\partial θ} (θ_{0}))}^{- 1} \end{array}

10

什么时候？T型_N个,β和θ尺寸相同，那么

W公司 (S公司, Ω^{*}) = W公司 (S公司) = (1 + \frac{1}{S公司}) {\frac{\partial μ^{'}}{\partial θ} (θ_{0})}^{- 1} Σ (θ_{0}) {\frac{\partial μ}{\partial θ^{'}} (θ_{0})}^{- 1}

11

与Ω无关^*.矩阵ψμ′(θ₀)/∂θ有(我,j个)第th个元素≠μ_我(θ)/∂θ_j个计算单位：θ₀类似地，条目(k个,我)单位：²（f）{μ(θ),β}/∂β∂μ为²（f）{μ(θ),β}/∂β_k个∂μ_我.

有关证明，请参见附录A.

渐近协方差（11）与所选的特定估计函数无关（f）最有趣的是，它与∑成正比(θ₀)，所选统计量的渐近协方差矩阵，与导数的元素成反比μ′(θ₀)/∂θ，是统计期望值极限的导数。

什么时候？T型_N个是真模型和dim的充分统计量(T型_N个)=尺寸(β)=尺寸(θ)，方程式(11)等于最大似然估计量的渐近方差，因子1+1除外/S公司除此之外，当辅助模型是真实模型或仅通过真实模型的充分统计量依赖于数据时，间接推断估计器是有效的。当T型_N个,β和θ不一样，等式(10)持有。再一次是μ′(θ₀)/∂θ和∑(θ₀)虽然以更复杂的方式呈现。

为了比较不同的辅助统计数据，我们可以估计 $\partial μ^{'} (\tilde{θ}) / \partial θ$ 和 $\sum (\tilde{θ})$ ⁠，从真实模型中以一定值进行模拟 $\tilde{θ}$ 这代表了对θ虽然是一个迭代方案（估计θ₀，找到最佳统计，估计θ₀使用这个等等）可能会更好。

在χ²-第节中的示例三，我们比较了基于统计的间接估计量的渐近方差

\begin{matrix} {T型}^{(1)} = \frac{1}{N个} \sum_{n个 = 1}^{N个} {z（z）}_{n个}, \\ {T型}^{(4)} = \frac{1}{N个} \sum_{n个 = 1}^{N个} {z（z）}_{n个}^{2}, \\ {T型}^{(5)} = \frac{1}{N个} \sum_{n个 = 1}^{N个} {({z（z）}_{n个} - {T型}^{(1)})}^{2} . \end{matrix}

自E类(z（z）_我)=θ，变量(z（z）_我)=2θ, $E类 ({z（z）}_{我}^{三}) = θ (θ + 2) (θ + 4)$ 和 $E类 ({z（z）}_{我}^{4}) = θ (θ + 2) (θ + 4) (θ + 6)$ ⁠，因此

\begin{matrix} \underset{N个 \to \infty}{林} {{E类}_{0} ({T型}_{N个}^{(1)})} = θ, \\ \underset{N个 \to \infty}{林} {{E类}_{0} ({T型}_{N个}^{(4)})} = θ^{2} + 2 θ, \\ \underset{N个 \to \infty}{林} {{E类}_{0} ({T型}_{N个}^{(5)})} = 2 θ, \end{matrix}

\begin{matrix} \underset{N个 \to \infty}{林} {无功功率，无功功率 ({N个}^{1 / 2} {T型}_{N个}^{(1)})} = 2 θ, \\ \underset{N个 \to \infty}{林} {无功功率，无功功率 ({N个}^{1 / 2} {T型}_{N个}^{(4)})} = 8 θ (θ + 2) (θ + 三), \\ \underset{N个 \to \infty}{林} {无功功率，无功功率 ({N个}^{1 / 2} {T型}_{N个}^{(5)})} = 48 θ . \end{matrix}

我们得到了θ基于T型⁽¹⁾,T型⁽⁴⁾和T型⁽⁵⁾分别地

\begin{matrix} {W公司}^{(1)} (S公司) = (1 + \frac{1}{S公司}) 2 θ, \\ {W公司}^{(4)} (S公司) = (1 + \frac{1}{S公司}) 2 θ \frac{(θ + 2) (θ + 三)}{{(θ + 1)}^{2}}, \\ {W公司}^{(5)} (S公司) = (1 + \frac{1}{S公司}) 12 θ . \end{matrix}

我们看到了W公司⁽⁵⁾(S公司) >W公司⁽⁴⁾(S公司) >W公司⁽¹⁾(S公司)为所有人θ> 0. 一种基于T型⁽⁵⁾其渐近方差比基于T型⁽¹⁾这里，基于平均值的估计值要比基于标准偏差的估计值好得多。

5.从起飞时间推断克/克/1个队列

克/克/1是一个单服务器先到先服务队列，具有到达间隔和服务时间的一般分布。假设只观察到出发时间，并且到达和服务过程的分布在参数范围内已知。我们首先表明，可能性是难以处理的，因为它的评估需要在维度上呈指数级的多个步骤N个数据的。

让Y（Y）_n个表示与n个第个客户。让W公司_n个是相应的到达间隔时间U型_n个服务时间相互独立，具有有限的期望和方差。让E类(W公司)>E类(U型). 到达间隔和服务时间具有已知的参数密度

{（f）}_{(u个, w个)} ({u个}_{N个}, {w个}_{N个}, θ) = \prod_{n个 = 1}^{N个} {（f）}_{u个} ({u个}_{n个}, θ_{u个}) {（f）}_{w个} ({w个}_{n个}, θ_{w个}), θ = (θ_{u个}, θ_{w个}) .

考虑到部门之间的时间年_N个=(年₁,年₂,…,年_N个)我们对θ.对于跨部门时间流程{Y（Y）_n个}它认为

{Y（Y）}_{n个} = {\begin{array}{l} {U型}_{n个} & 如果 \sum_{我 = 1}^{n个} {W公司}_{我} ⩽ \sum_{我 = 1}^{n个 - 1} {Y（Y）}_{我}, \\ {U型}_{n个} + \sum_{我 = 1}^{n个} {W公司}_{我} - \sum_{我 = 1}^{n个 - 1} {Y（Y）}_{我} & 如果 \sum_{我 = 1}^{n个} {W公司}_{我} > \sum_{我 = 1}^{n个 - 1} {Y（Y）}_{我} . \end{array}

12

很明显{Y（Y）_n个,n个=1,2，…}通常不是马尔可夫过程，因为Y（Y）_n个依赖于所有的过去和相关结构是复杂的。

我们需要反复评估可能性

{（f）}_{θ} (年_{N个}) = \int {（f）}_{θ} (年_{N个} ∣ {u个}_{N个}, {w个}_{N个}) {（f）}_{(u个, w个)} ({u个}_{N个}, {w个}_{N个}, θ) d日 {u个}_{N个} d日 {w个}_{N个},

13

可以写成2N个-给定数据集的维积分年_N个和不同的参数向量θ。在这里（f）(年_N个|u个_N个,w个_N个)是一个δ函数，因为年_N个鉴于u个_N个和w个_N个具有确定性。因此，所有可能的组合u个_N个和w个_N个需要确定，这可能会产生观测数据。我们用根表示构造一棵二叉树年₁=u个₁。下一级有两种可能性：年₂=u个₂如果w个₁+w个₂<u个₁; 否则年₂=u个₂−u个₁+w个₁+w个₂。我们这样做是为了构建一棵有2^N个树叶。从根到叶的每一条路径都描述了一组等式和不等式，如果这些等式和不等式可以联合求解，则表示一个可行的选择(u个_N个,w个_N个)这与数据是一致的。树的每一层都有一个新的w个-添加变量，以便路径上所有条件的交集通常不为空。（在特殊情况下，例如当到达间密度具有有限支持时，它可以为空。）步数为指数（inN个)必须执行以计算积分（13），这在实践中是不可行的，即使是中等大小的N个.

比利奥等。(1998)提出了一种计算最大似然估计的替代方法，称为模拟似然比法。最大化可能性（f）(年_N个)等于最大化条件期望 ${E类}_{\bar{θ}} [{{（f）}_{θ} (年_{N个}, 小时) / {（f）}_{\bar{θ}} (年_{N个}, 小时)} | 年_{N个}]$ 对于固定值 $\bar{θ}$ ⁠，其中小时是一组潜在变量，期望是关于小时鉴于年_N个和 $\bar{θ}$ ⁠.给定样品小时¹,…,小时^S公司根据这个条件密度，期望值可以近似为

\frac{1}{S公司} \sum_{秒 = 1}^{S公司} {{（f）}_{θ} (年_{N个}, {小时}^{秒}) / {（f）}_{\bar{θ}} (年_{N个}, {小时}^{秒})} .

如果全关节模型（f）(年_N个,小时)可以进行评估，然后有一个马尔可夫链蒙特卡罗算法可以生成所需的样本小时¹,…,小时^S公司，仅基于比率评估 ${（f）}_{\bar{θ}} (年_{N个}, 小时) / {（f）}_{\bar{θ}} (年_{N个}, \bar{小时})$ ⁠.但密度（f）(年_N个,u个_N个,w个_N个)实际中无法评估出发时间。

计算可能性的另一种方法是根据潜在变量设定条件V（V）_n个表示未观察到的等待时间。它认为

{V（V）}_{n个} = {\begin{array}{l} {V（V）}_{n个 - 1} + {U型}_{n个 - 1} - {W公司}_{n个} & 如果 {V（V）}_{n个 - 1} + {U型}_{n个 - 1} - {W公司}_{n个} > 0, \\ 0 & 如果 {V（V）}_{n个 - 1} + {U型}_{n个 - 1} - {W公司}_{n个} ⩽ 0 \end{array}

14

变量{U型_n个−1−W公司_n个}是独立的，也是U型_n个−1−W公司_n个属于V（V）_n个−1. {V（V）_n个}是马尔可夫链，可以写出向量密度的显式表达式V（V）_n个.以等待时间为条件，部门间时间流程满足

{Y（Y）}_{n个} = {\begin{array}{l} {U型}_{n个} & 如果 {V（V）}_{n个} > 0, \\ {U型}_{n个} + {W公司}_{n个} - {U型}_{n个 - 1} - {V（V）}_{n个 - 1} & 如果 {V（V）}_{n个} = 0 \end{array}

15

即使有条件{V（V）_n个}Y（Y）_n个s不是马尔可夫链。表达式（15）W公司_n个和U型_n个−1不独立于V（V）_n个。正在尝试条件U型_N个和W公司_N个导致类似的问题。

可能会引入不同的、不太自然的潜在变量，从而采用多项式方法来评估可能性，尽管我们推测该问题通常是NP难的；见加里和约翰逊(1979). 羽毛头(2003)讨论了特殊情况，包括克/M（M）/1个队列，可以为其设计多项式算法。在Heggland和Frigessi(2003)我们描述了一种进一步的方法，它不是基于方程(13)导致指数算法。

间接推断不需要评估可能性。为了具体起见，假设服务时间在间隔内均匀分布[θ₁,θ₂]到达间隔时间随参数呈指数分布θ_三。我们用一个数据集进行实验，该数据集包括N个=从稳定队列生成的100个连续间隔时间θ₁= 0.3,θ₂=0.9和θ_三= 1. 我们已经创建了50个独立的数据副本，我们称之为原始数据。利用50个数据集，我们可以获得各种间接推断估计量分布的合理概念。为了公平比较辅助模型，相同的模拟数据 ${z（z）}_{N个}^{秒} (θ)$ 用于所有实验。在我们的设置中，间接推断基于一组统计数据，这些统计数据可以总结出未知的数据生成分布。由于平均服务时间小于平均到达间隔时间，因此到达和离开过程应该相似。因此，我们选择间隔时间的平均值作为此类统计数据之一。最小间隔时间不能小于最小服务时间。由于服务是均匀分布的，所以我们取观察到的最小间隔。我们通过可视化其可变性的图表分析这些统计数据的期望值和方差。让T型_N个{z（z）_N个(θ)}是模拟间隔时间的任何统计数据，其中θ=(θ₁,θ₂,θ_三). 我们依次改变每个参数，同时保持其他参数不变。因为我们知道真实值（0.3,0.9,1.0），所以我们简化了练习并将其分配给固定参数。在实际环境中，必须进行一些初步估计（可能会重复进行）。说θ_三变化范围为[0.8,1.3]。对于每个这样的值，我们进行采样z（z）_N个(0.3,0.9,θ_三)使用相同的随机数并计算统计数据T型_N个{z（z）_N个(θ)}. 这将生成一个T型_N个{z（z）_N个(θ)}作为的函数θ_三然后用新的随机数重复该过程，比如每次重复50次，以研究不同模拟数据集之间变异性的影响。我们从开始 $\bar{z（z）} (θ_{1}, θ_{2} = 0.9, θ_{三} = 1) = (1 / N个) \sum_{我 = 1}^{N个} {z（z）}_{我}^{秒} (θ_{1}, θ_{2} = 0.9, θ_{三} = 1), 秒 = 1, \dots, 50$ 图1(a）显示了这50条曲线，作为θ₁同样，图1（b）和1(c）显示的可变性 $\bar{z（z）}$ 作为的功能θ₂和θ_三.更改的值θ₁或θ₂不影响 $\bar{z（z）}$ ⁠，而在θ_三和 $\bar{z（z）}$ ⁠。接下来我们考虑统计数据 ${z（z）}_{最小值} = {最小值}_{我 = 1, \dots, N个} {{z（z）}_{我}^{秒} (θ_{1}, θ_{2}, θ_{三})}$ 生成的最小数据。此图绘制于图1（d）-1（f)作为每个参数的函数。更改的值θ₂和θ_三不影响最小值，但与θ₁（注意一些曲线的不连续性，如果N个足够大。）这表明z（z）_N个可能导致估计θ₁和θ_三。两者似乎都没有传播信息θ₂我们尝试了其他统计数据，包括中值z（z）_医学属于z（z）_N个.图1（g）-1（i）)显示中值随着θ₂但与期望的导数相比，其方差太大。

（a） z³对θ1；（b） z³对θ2；（c） z³对θ3；（d） zminversusθ1；（e） zmin与θ2的关系；（f） zminversusθ3；（g） zmed与θ1；（h） zmed与θ2；（i） zmed与θ3；（j） β^2MLversusθ1；（k） β^2MLversusθ2；（l） β^2MLversusθ3

图1

（a） $\bar{z（z）}$ 与θ₁; （b） $\bar{z（z）}$ 与θ₂; （c） $\bar{z（z）}$ 与θ_三; （d）z（z）_最小值与θ₁; （e）z（z）_最小值与θ₂; （f）z（z）_最小值与θ_三; （g）z（z）_医学与θ₁; （h）z（z）_医学与θ₂; （i）z（z）_医学与θ_三; （j） ${\hat{β}}_{2}^{毫升}$ 与θ₁; （k） ${\hat{β}}_{2}^{毫升}$ 与θ₂; （l） ${\hat{β}}_{2}^{毫升}$ 与θ_三

新标签中打开下载幻灯片

为了找到均匀分布上限的统计量，我们选择了一个辅助模型，其参数的最大似然估计可以作为统计量。接头密度c(年)从稳定状态开始的一次产后时间M（M）/克/可以计算出1个具有独立指数间隔的队列；见格罗斯和哈里斯(1998)，第234页。对于统一服务时间，这是

c (年) = {\begin{array}{l} 0 & 如果 年 ⩽ θ_{1}, \\ \frac{1}{θ_{2} - θ_{1}} - \frac{1 - ρ}{θ_{2} - θ_{1}} 经验 {- θ_{三}^{- 1} (年 - θ_{1})} & 如果 θ_{1} < 年 ⩽ θ_{2}, \\ \frac{1 - ρ}{θ_{2} - θ_{1}} [经验 {- θ_{三}^{- 1} (年 - θ_{2})} - 经验 {- θ_{三}^{- 1} (年 - θ_{1})}], & 如果 θ_{2} < 年 . \end{array}

16

我们假设辅助模型具有独立的出发时间，每个出发时间具有边际密度（16）。我们将其三个参数表示为β=(β₁,β₂,β_三)其中[β₁,β₂]是均匀密度和β_三是指数参数。很容易看出β₁是最小起飞时间z（z）_最小值.让 ${\hat{β}}_{2}^{毫升}$ 表示的最大似然估计量β₂.图1（j）-1（l)显示 ${\hat{β}}_{2}^{毫升} (θ)$ 密谋反对θ₁,θ₂和θ_三，对于大多数数据集 ${\hat{β}}_{2}^{毫升} (θ)$ 在中似乎是线性的θ₂，而θ₁和θ_三似乎收效甚微。

我们选择统计数据 $T型 = {\bar{z（z）}, {z（z）}_{最小值}, {\hat{β}}_{2}^{毫升} ({z（z）}_{N个})}$ ⁠一种替代方法是通过辅助模型（16），该辅助模型不使用 $\bar{z（z）}$ 但是 ${\hat{β}}_{三}^{毫升}$ ⁠这两个统计数据非常相似（Heggland和Frigessi，2003). 这导致两种变体的性能非常相似。

接下来，我们决定在方程式中使用估计函数（9）(1). 当统计量和参数的维数相同时，渐近方差与估计函数无关，如本例所示。所以我们选择了（f）(T型_N个,β)这样的话

{\hat{β}}_{N个} = 参数 \underset{_{β}}{最大值} [（f） {{T型}_{N个} (年_{N个}), β}] = {T型}_{N个} (年_{N个}) .

我们使用等式(5)计算 ${\hat{θ}}_{S公司 N个} (Ω_{N个})$ ⁠，我们取Ω_N个作为统计量的协方差矩阵的倒数T型，根据原始50个数据集估计。逐渐选择Ω_N个没有影响。在实际情况下，当只有一个数据集可用时，这是不可能的，我们将首先估计参数θ使用单位矩阵作为Ω_N个然后模拟几个数据集来估计β见古里·鲁克斯等。(1993)有关选择Ω的更多详细信息_N个.

优化和估算如下。首先，我们模拟数据 ${z（z）}_{N个}^{秒} (θ)$ 来自克/克/网格上的1个队列θ-值（0.20,0.24，……，0.40）×（0.80,0.84，…，1.04）×（0.90,0.88，…，1.28）。对于每个网格点，总计S公司=生成50个数据集。当模拟不同的值时θ通过函数 ${z（z）}_{N个}^{秒} (θ) = 克 (θ, X（X）)$ ⁠，则仅θ是可变的，而随机变量X（X）保持固定。估计值 ${\tilde{θ}}_{(S公司 = 50), (N个 = 100)}$ 属于θ对于每个数据集，使用以下等式(5)最大化是最重要的θ-网格的值。原则上可以执行牛顿-拉斐逊最大化或模拟退火，而不是基于普通网格的搜索。事实上，正如Diggle和Gratton所建议的那样，我们改进了网格搜索，用最小二乘法拟合局部二次近似(1984). 将二次曲面最大化以获得最终的间接推断估计θ参见Heggland和Frigessi(2003)了解更多详细信息。这个程序给了我们50个估计值 ${\tilde{θ}}_{(S公司 = 50), (N个 = 100)}$ ⁠.估计平均值、标准偏差和RMSE， $(1 / 50) \sum_{我 = 1}^{50} {{({\tilde{θ}}_{我} - θ)}^{2}}^{1 / 2}$ ⁠，可以计算。

在表中2我们给出了统计结果 $T型 = {\bar{z（z）}, {z（z）}_{最小值}, {\hat{β}}_{2}^{毫升} ({z（z）}_{N个})}$ ⁠，非常好。估计θ_三在等式中使用带独立边距（16）的对数似然法时没有改善(7). 那里 ${\hat{β}}_{三}^{毫升}$ 显示而不是 $\bar{z（z）}$ ⁠。尽管总体统计数据 $T型 = {\bar{z（z）}, {z（z）}_{最小值}, {\hat{β}}_{2}^{毫升} ({z（z）}_{N个})}$ 看起来最好，我们可以得到更好的估计θ_三（就小RMSE而言）使用两个正态分布和五维参数的混合物作为辅助模型β=(μ₁,σ₁,μ₂,σ₂,第页)，每个分布的两个参数和混合参数第页.假设间隔时间独立。此模型与真实模型没有正式关系。我们从表中看到2估计θ_三更好。我们尝试了一种均匀指数混合作为辅助模型，具有独立的区间时间。辅助参数是四维的。该模型表现较差，三个参数的RMSE分别为0.043,0.076,0.099。令人惊讶的是，这种模型比混合法线模型更糟糕，因为均匀分量和指数分量更自然。部分间隔时间均匀分布，而其余时间遵循指数和均匀密度的卷积。

表2

参数估计的平均值、标准偏差和RMSE，（a）使用T型，（b）使用基于独立边距（16）的辅助模型，（c）使用混合法线

参数	手段			标准偏差			RMSE公司
参数	（a）	（b）	（c）	（a）	（b）	（c）	（a）	（b）	（c）
θ₁	0.301	0.301	0.302	0.011	0.011	0.035	0.011	0.011	0.035
θ₂	0.886	0.883	0.868	0.040	0.041	0.060	0.042	0.043	0.068
θ_三	0.982	1.005	0.987	0.100	0.110	0.091	0.100	0.109	0.091

参数	手段			标准偏差			RMSE公司
参数	（a）	（b）	（c）	（a）	（b）	（c）	（a）	（b）	（c）
θ₁	0.301	0.301	0.302	0.011	0.011	0.035	0.011	0.011	0.035
θ₂	0.886	0.883	0.868	0.040	0.041	0.060	0.042	0.043	0.068
θ_三	0.982	1.005	0.987	0.100	0.110	0.091	0.100	0.109	0.091

表2

参数估计的平均值、标准偏差和RMSE，（a）使用T型，（b）使用基于独立边距（16）的辅助模型，（c）使用混合法线

参数	手段			标准偏差			RMSE公司
参数	（a）	（b）	（c）	（a）	（b）	（c）	（a）	（b）	（c）
θ₁	0.301	0.301	0.302	0.011	0.011	0.035	0.011	0.011	0.035
θ₂	0.886	0.883	0.868	0.040	0.041	0.060	0.042	0.043	0.068
θ_三	0.982	1.005	0.987	0.100	0.110	0.091	0.100	0.109	0.091

参数	手段			标准偏差			RMSE公司
参数	（a）	（b）	（c）	（a）	（b）	（c）	（a）	（b）	（c）
θ₁	0.301	0.301	0.302	0.011	0.011	0.035	0.011	0.011	0.035
θ₂	0.886	0.883	0.868	0.040	0.041	0.060	0.042	0.043	0.068
θ_三	0.982	1.005	0.987	0.100	0.110	0.091	0.100	0.109	0.091

最后，我们对该框架中不连续似然函数的影响进行了评论。考虑均匀指数混合模型，并表示为一和b条均匀分量的参数。这些应该是合理的估计θ₁和θ₂.当我们改变时θ₂在真实模型中，这应该反映在对b条不幸的是，对于小型企业来说，这可能并不一定如此N个.考虑的最大似然估计b条。通过构造，这将始终位于其中一个数据点。回想一下，我们通过使用相同的随机数模拟真实模型中的数据集，只需更改参数的值。说我们保持θ₁和θ_三不变，但有所改变θ₂。然后，数据集中给定点的值随θ₂然而，最大似然估计b条可能会突然改变：θ₂可能导致对b条估计的结合函数的这种不连续性使得间接推断变得困难。什么时候？N个足够大时，这个问题就不那么严重了，因为数据点之间会更接近，而且更一般地说，绑定功能是连续的。此外，通过对几个（我们取50个）模拟数据集的辅助参数估计值进行平均，也可以降低影响，但无法解决。注意，使用正常混合模型时不会出现此问题，因为似然函数是连续的，因此辅助参数是真实参数的平滑函数。

6.讨论

间接推理方法是在具有难以处理的似然函数的模型中进行参数估计的有用工具。当间接推断基于统计时，间接推断估计器的渐近方差与该统计的渐近方差成正比，与该统计期望值相对于参数的导数成反比。因此，估计函数的选择应该以这些标准为指导。这对估计质量的影响是显著的。选择正确的统计数据是一项困难的任务，图形方法是我们选择对参数变化敏感的统计数据的最佳工具θ，但对用相同方法生成的样本中的随机变化不敏感θ。由于需要进行数值优化，统计值应随θ对于小样本，这可能是一个关键点。

通常使似然函数难以推导的是数据的复杂依赖结构。如果可以计算边际分布，并且这些分布包括所有感兴趣的参数，那么可以最大化这些边际的乘积，而不是完全似然，从而忽略相关性。这通常会导致有偏差和无效的估计。一个例子是离散观测到的扩散；见比比和瑟伦森(2001)和瑟伦森(2001)例如。在空间吉布斯模型中感兴趣的参数通常存在于相互作用项和伪似然中（Besag，1986)相反，可以最大化，从而再次导致次优估计。在所有这些情况下，基于这些估计函数的间接推断都可以用于纠正估计量的偏差。一种估计函数，用于从克/克/1队列基于此思想，性能良好。忽略相关性并最大化边际乘积，我们得到的RMSE等于0.015、0.045和0.105θ₁,θ₂和θ_三分别是。将此与表进行比较2我们看到这类似于使用间接推理作为辅助模型。主要差异在于θ₁，其中RMSE因偏差增加而增加。

间接推理方法已被考虑用于经常光顾的场合。将它们扩展到贝叶斯上下文将非常有趣。假设关于θ可以用先前的密度来概括π(θ). 让 ${\hat{β}}_{S公司 N个} (θ)$ 根据方程式计算(3)或(4)。然后不用方程式(6)我们建议计算 $参数 {最大值}_{θ} [问_{N个} {年_{N个}; {\hat{β}}_{S公司 N个} (θ)} + 日志 {π (θ)}]$ 作为贝叶斯点估计θ类似地，方程式(5)可能会受到处罚。

最近，Genton和Ronchetti(2003)考虑了模型的误指定和间接推断估计的稳健性。如果数据年_N个不完全遵循模拟假设的模型，间接推理是如何执行的？他们研究了估计器的局部稳健性，并导出了影响函数。这使得他们能够设计出在与假设模型存在微小偏差的情况下稳定的间接推理程序。

致谢

我们感谢Magne Aldrin，他建议克/克/例如，英格丽德·格拉德（Ingrid Glad）、梅特·兰格斯（Mette Langaas）和本特·纳特维格（Bent Natvig）就间接推理进行了许多有趣且富有成果的讨论。这项研究得到了欧盟网络ERB-FMRX-CT96-0095和挪威研究委员会通过项目121144/420和BeMatA的支持。

工具书类

贝萨格

,

J。

(

1986

)

关于脏照片的统计分析（附讨论）

.

J.R.统计。Soc公司。

B、，

48

,

259

–

302

.

巴特

,

联合国。

,

米勒

,

G.K.公司。

和

饶

,

S.S.公司。

(

1997

)排队系统的统计分析。在

排队的前沿

（编辑）。

J.H。

沙拉洛

)第13章，pp。

351

–

394

.

博卡拉顿

:

出版社

.

比比

,

B.M.公司。

和

瑟伦森

,

M。

(

2001

)

具有高维参数的扩散模型的简化估计函数

.

扫描。J.统计。

,

28

,

99

–

112

.

比利奥

,

M。

,

蒙福特

,

A。

和

罗伯特

,

C.P.公司。

(

1998

)

模拟似然比（SLR）方法

.

卡福斯卡里大学

,

威尼斯

。（可从http://citeseer.nj.nec.com/bilio98simulated.html.)

卡尔佐拉里

,

G。

,

迪约里奥

,

F、。

和

佛罗伦萨

,

G。

(

1998

)

间接推断中方差减少的控制变量：连续时间利率模型

.

计量经济学。J。

,

1

,

100

–

112

.

卡尔佐拉里

,

G。

,

迪约里奥

,

F、。

和

佛罗伦萨

,

G。

(

2001

)

使用控制变量的间接估计和方差减少

.

Metron公司

,

59

,

39

–

53

.

科尔多瓦

,

M。

(

1997

)

分数时间序列模型的间接推断

.

J.统计。计算。Simuln公司

,

59

,

221

–

232

.

挖掘

,

P.J.公司。

和

格拉顿

,

R·J。

(

1984

)

隐式统计模型的蒙特卡罗推理方法（带讨论）

.

J.R.统计。Soc公司。

B、，

46

,

193

–

227

.

达菲

,

D。

和

辛格尔顿

,

K·J。

(

1993

)

资产价格马尔可夫模型的模拟矩估计

.

计量经济学

,

61

,

929

–

952

.

羽毛头

,

第页。

(

2003

)

部分观测队列的精确筛选

.手稿。

兰卡斯特大学

,

兰卡斯特

.

费尔马尼安

,

J·D·。

和

萨拉尼

,

B。

(

2001

)一种非参数模拟最大似然估计方法。

预打印

.

经济与统计研究中心

,

巴黎

.

盖朗

,

A.R.公司。

和

陶亨

,

G。

(

1996

)

要匹配的时刻

?

计量经济学。理论

,

12

,

657

–

681

.

加里

,

M.R.先生。

和

约翰逊

,

D.S.公司。

(

1979

)

计算机与不可纠正性：NP完全性理论指南

.

纽约

:

弗里曼

.

让东

,

M.G.公司。

和

龙凯蒂

,

E.公司。

(

2003

)

稳健的间接推理

.

《美国统计杂志》。助理。

,

98

,

67

–

76

.

古里埃鲁克斯

,

C、。

和

蒙福特

,

A。

(

1996

)

基于模拟的经济计量方法

.

牛津

:

牛津大学出版社

.

古里埃鲁克斯

,

C、。

,

蒙福特

,

A。

和

雷诺（Renault）

,

E.公司。

(

1993

)

间接推断

.

J.应用。计量经济学。

,

8

,

第85页

–

第118节

.

总量

,

D。

和

哈里斯

,

C.M.公司。

(

1998

)

排队论基础

.

纽约

:

威利

.

哈泽尔顿

,

M。

(

1995

)

具有加性误差模型的改进蒙特卡罗推断

.

统计师。计算。

,

5

,

343

–

350

.

黑格兰

,

英国。

和

弗里杰西

,

A。

(

2003

)间接推理中的函数估计。

研究报告933

.

挪威计算中心

,

奥斯陆

.

琼斯

,

L.K.公司。

(

1999

)

从事务数据推断阻碍行为

.

运营资源。

,

47

,

778

–

784

.

库克

,

A.Y.C.公司。

(

1995

)

具有随机效应的广义线性模型的渐近无偏估计

.

J.R.统计。Soc公司。

B、，

57

,

395

–

407

.

卢

,

H。

(

1999

)

推导n个-gi/g/1排队系统中的步间时间分布

.

欧洲药典。物件。

,

118

,

194

–

212

.

麦金农

,

J·G·。

和

史密斯

,

A.A。

(

1998

)

计量经济学中的近似偏差修正

.

《计量经济学杂志》。

,

85

,

205

–

230

.

麦克法登

,

D。

(

1989

)

无需数值积分的离散响应模型估计的模拟矩方法

.

计量经济学

,

57

,

995

–

1026

.

Mealli公司

,

F、。

和

兰皮基尼

,

C、。

(

1999

)

通过间接推理估计二元多级模型

.

计算。统计师。数据分析。

,

29

,

313

–

324

.

巴基斯坦

,

A。

和

波拉德

,

D。

(

1989

)

仿真与最优估计量的渐近性

.

计量经济学

,

57

,

1027

–

1057

.

帕斯托雷洛

,

美国。

,

雷诺（Renault）

,

E.公司。

和

头子

,

N。

(

2000

)

随机变量期权定价的统计推断

.

J.总线。经济。统计师。

,

18

,

358

–

367

.

施韦德尔

,

T。

,

斯卡格

,

H·J。

,

兰加斯

,

M。

和

迪马科斯

,

X.K.公司。

(

1999

)

复杂双平台样线调查的模拟似然方法

.

生物计量学

,

55

,

678

–

687

.

瑟伦森

,

H。

(

2001

)

离散观测扩散：连续时间分数函数的近似

.

扫描。J.统计。

,

28

,

113

–

122

.