总结
本文考虑具有特定地层干扰截获和缺失协变量数据的典型链接广义线性模型。这个家族包括条件logistic回归模型。针对该问题的现有方法,每种方法都使用一个条件参数来消除干扰截距,对缺失的协变量数据或缺失过程进行建模。本文在一个常见的似然框架下对这些方法进行了比较,确定了半参数有效估计量,并提出了一种新的估计量,它减少了对缺失协变量模型的依赖性。一项模拟研究比较了这些方法的效率和对模型错误指定的鲁棒性。
1.简介
我们考虑独立数据(Y(Y)我,X(X)我,Z轴我)用于记录我=1,…,n个,其中利益在于(Y(Y)我|X(X)我,Z轴我),其中协变量的部分或全部成分X(X)我可能在某些记录中丢失。在这里,Y(Y)我是一个单变量响应,并且X(X)我和Z轴我可能是多变量协变量向量。当所有记录都完成时,这些数据通常通过具有典型链接函数的广义线性模型进行分析(McCullagh和Nelder,1989年),
哪里η我是协变量的线性函数(X(X)我,Z轴我),φ是一个比例参数一(·),b条(·)和c(c)*(·)是已知函数。示例包括逻辑、泊松和线性回归。当数据分层、聚集或纵向时n个观测属于多个地层中的一个秒= 1,…,J型,线性预测η我通常假定为
有时被称为固定效应模型(格林,2000). 地层效应由地层特定的截距来解释q个秒,这被认为是一个麻烦的参数。因为,对于固定和φ, Σ我 Y(Y)我地层内秒是一个足够的统计数据q个秒,调节∑我 Y(Y)我消除q个秒根据模型(1)得出的可能性(《哥达姆》(1976)和挖掘等。(1994),第9章)。什么时候?Y(Y)我是一个二元疾病变量,方程(1)和(2)构成了匹配病例对照研究条件logistic回归方法的基础模型(布雷斯洛与戴(1980),第248页)。每个匹配集都是它自己的层,∑我 Y(Y)我是匹配集合中的事例数。∑上的调节我 Y(Y)我不仅消除了q个秒也反映了病例对照抽样策略。
推理问题(β,φ)在该模型中,当X(X)我由于最近处理了一些记录而丢失Satten和Kupper(1993),利普希茨等。(1998),萨顿和卡罗尔(2000),Paik和Sacco(2000)和拉图兹等。(2002)虽然所有这些研究人员都为二进制的条件logistic回归模型开发了方法Y(Y)我,他们的方法同样适用于形式(1)和(2)的其他典型链接广义线性模型。这些方法分为两种通用方法。第一个涉及建模缺失协变量的分布X(X)我.Paik和Sacco(2000),Satten和Kupper(1993)和萨顿和卡罗尔(2000)每个提议的条件似然都依赖于X(X)我在对照组中。Satten和Carroll建模(X(X)我|Y(Y)我= 0,Z轴我)非参数化(X(X)我,Z轴我)在有限的支持下,Satten和Kupper采用了类似的方法X(X)我相比之下,Paik和Sacco认为(X(X)我|Y(Y)我,Z轴我)是单变量,分布属于指数族模型。
当模型用于分配X(X)我鉴于Z轴我很难指定,可能是因为X(X)我或Z轴我是高维的,那么另一种方法是对导致数据丢失的过程进行建模。利普希茨等。(1998)提出了这样一种方法,仅在观察到的受试者中建模病例控制状态X(X)我,条件是每个受试者是否都有完整的数据。拉图兹等。(2002)将这种似然方法推广到一类大大提高估计效率的估计量βz(z),但没有太大改进βx个这些方法至多需要对X(X)我.
使用观测数据的地层水平似然作为统一框架,我们将区分这些方法,并提供一些指导,说明用户应选择哪种方法进行数据分析。在下一节中,我们将介绍经典形式的条件似然估计量,以及当有可能对X(X)我。在第3节中,我们比较了以前在以下情况下提出的方法X(X)我可能不见了。我们在第3.1节中表明,当可以对X(X)我,可能性Satten和Kupper(1993)给出了该问题的半参数有效估计。第3.2节介绍了一个与Paik和Sacco(2000)。这些方法使用所有记录上的数据,无论X(X)我是否观察到。当数据分析仅限于观察到的记录时X(X)我根据数据的选择或限制,我们在第3.3节中表明利普希茨等。(1998)给出了该问题的半参数有效估计。方法利普希茨等。(1998)需要了解X(X)我每个记录都会丢失。第4节包含了一项仿真研究,将第3节中的估计值与其他估计值进行了比较,以验证模型的有效性和鲁棒性X(X)我和缺失模型。在第5节中,我们以建议的形式向这些方法的用户提出结论。
在发展我们的结果时,我们在更一般的标准链接广义线性模型族(1)和(2)中重铸了条件logistic回归模型。因此,我们的结果适用于响应数据不是二进制的高度分层问题。自始至终,根据上述研究人员,我们假设X(X)我随机丢失(MAR)(利特尔和鲁宾,1987年)尽管我们在模拟工作中检验了对该假设的稳健性。
2.条件似然估计的半参数效率
考虑来自给定地层的数据秒对于没有缺失数据的设置,即假设我们只有协变量Z轴我在模型(2)中。表示地层上的数据秒,写入Z轴=(Z轴1,…,Z轴我,…,Z轴n个)T型对于矩阵n个协变量行向量Z轴我; 类似地定义响应向量Y(Y)自始至终,我们认为推理是有条件的Z轴根据方程(1)和(2),并设(f)(·)表示Y(Y)我或Y(Y),地层的可能性秒是(f)(Y(Y)|Z轴) =L(左)*(β,φ,q个秒) =L(左)*,其中
以及在哪里结束我在内部秒现在请注意,对于固定βz(z)和φ, Σ我 Y(Y)我是滋扰参数的充分统计q个秒因此ξ*= (βz(z),φ),L(左)*c(c)(ξ*) =(f)(Y(Y)|Σ我 Y(Y)我,Z轴),没有q个秒.
现在,考虑跨层数据秒= 1,…,J型,让表示估计值ξ*通过最大化条件似然获得林赛(1983)表明了这一点是的半参数有效估计量ξ*在公害面前q个秒s、 在以下意义上。假设不是处理q个秒s作为干扰参数,我们将其建模为来自任意未知混合分布的随机变量问Z轴这可能取决于Z轴.分布的混合模型(Y(Y)|Z轴),略微超过q个秒,现在是半参数的(f)(Y(Y)|Z轴;ξ*,q个秒)是常规参数化模型,而问Z轴是非参数的。定理1,在附录A扩展了Lindsay(1983)的结果,建立了在这个更一般的背景下。
定理1。让(f)(Y(Y)|Z轴;ξ*,q个秒),,q个秒和问Z轴如上所述进行定义,以便模型(f)(·;ξ*,q个秒)允许∑我 Y(Y)我作为一个完整的足够的统计数据q个秒然后,在中给出的正则条件下附录A,作为J型→ ∞,达到估计的Cramér–Rao下限ξ*在未知的情况下问Z轴.
为了进一步扩展此结果,以包括X(X)我,定义矩阵X(X)类似于Z轴,并扩展方程(3)以包括该项现在,定义第页0≡第页0(X(X)我|Z轴我;α)为的密度或概率质量函数(X(X)我|Y(Y)我= 0,Z轴我)在地层中秒,由有限维参数控制α.使用Y(Y)我=0是任意的;我们可以定义第页0对于Y(Y)我=年0对于任何年0支持Y(Y)我。我们假设第页0不取决于地层截距q个秒,尽管它可能以其他参数化方式取决于秒最后,让我们ξ= (β,φ,α)T型。我们现在为ξ由数据产生(X(X)我,Y(Y)我|Z轴我).
在不损失通用性的情况下,模型(1)可以用概率重新表示
哪里c(c)(Y(Y)我,φ) =c(c)*(Y(Y)我,φ)−c(c)*(0,φ). 现在,定义几率
略微超过X(X)我然后,遵循以下方法Satten和Kupper(1993)对于logistic回归模型,我们有以下两个结果。首先,可以证明
对于方程(1)和(2)给出的指数族模型,
第二,让第页(X(X)我|Y(Y)我,Z轴我)是的密度或概率质量函数(X(X)我|Y(Y)我,Z轴我)可以看出
它是免费的q个秒并简化为
我们现在可以写出可能性L(左)的(ξ,q个秒)因联合分配(X(X),Y(Y)|Z轴). 这可以通过分解方便地表示
通过表达式(7)的展开和与方程(3)的类比,很容易看出,对于固定的ξ, Σ我 Y(Y)我对于滋扰来说是一个完全足够的统计q个秒在里面L(左)再次,条件似然
没有q个秒.给,𝒴=𝒴(Y(Y))是向量集年=(年1,…,年n个)T型这样∑我 年我= Σ我 Y(Y)我.何时Y(Y)我是连续的,总和∑年∈ 𝒴被一个积分所取代。
现在林赛(1983)定理1再次适用,在类似的正则性条件下J型→ ∞ 条件似然估计通过最大化获得是半参数有效的ξ在存在干扰参数的情况下q个秒此结果的一个推论是在里面是半参数有效的(β,φ)在见证人在场的情况下q个秒s和α.
3.条件似然估计X(X)我可能丢失了
3.1. 高效估计器
考虑以下设置:X(X)我可能缺少并定义R(右)我∈{0,1}是否为指示变量X(X)我完全遵守我第个记录。我们假设,在地层内部秒,X(X)我是MAR,即。R(右)我∐X(X)我∣ (Y(Y)我,Z轴我,秒),还有那个R(右)我∐R(右)我',我≠我’。类似于Y(Y),定义向量R(右)=(R(右)1,…,R(右)n个)T型.进一步定义X(X)光突发事件为观察到的行X(X).让≺(R(右)我=1|Y(Y)我=年,X(X)我,Z轴我) =π(年,Z轴我;γ),其中γ是一个有限维滋扰参数,在随机缺失的情况下确保π(·)不依赖于X(X)我.完全可能L(左)由地层数据产生(X(X)光突发事件,R(右),Y(Y)|Z轴)然后可以写入
请注意第页(X(X)光突发事件|R(右),Y(Y),Z轴)如果没有条件R(右),表示的是X(X)包含在X(X)光突发事件。此因子已明确写入
第二个等式是由随机缺失假设产生的。
现在,比方说没有失踪X(X)我和方程式(3),∑我 Y(Y)我对于q个秒在里面L(左). Theq个秒因此,从L(左)通过调节∑我 Y(Y)我,导致条件似然
参数γ和ξ是完全可分离的L(左)c(c)因此,为了推断ξ忽略γ,
正如方程式(8)所示。
条件似然L(左)c(c)(ξ)由提出Satten和Kupper(1993)和萨顿和卡罗尔(2000)对于logistic回归的情况。定理1和第2节的后续发展直接适用于L(左)c(c)(ξ)即使在X(X)我可能会丢失,因此ξ通过最大化∏获得秒 L(左)c(c)(ξ)是半参数有效的(β,φ)在存在干扰参数的情况下q个秒和α。该结果由提出萨顿和卡罗尔(2000)在他们的讨论中。如果X(X)我永远不会错过,L(左)c(c)仍然成立,由方程(8)给出。它不会降低到标准的条件似然,事实上它更有效,因为它利用了模型第页0提取有关的信息(β,φ)包含在中的(X(X)我|Y(Y)我,Z轴我).
3.2. 次优估计量
在第3.1节中,L(左)c(c)通过考虑(X(X)光突发事件,R(右),Y(Y)|Z轴)产生的可能性取决于滋扰分布第页0第页,共页(X(X)我|Y(Y)我= 0,Z轴我),即使在X(X)我永远不会丢失。为了减少对β-推断第页0,我们可以从条件分布开始
又在哪里R(右)扮演条件统计和选择操作符的双重角色。
如方程式(9)所示,∑我 Y(Y)我足以满足q个秒在方程式(11)中,对其进行条件处理将消除q个秒.产生的条件似然
因此,可以使用L(左)c(c)用于推断β注意到
我们可以写
现在,因为(∑我 Y(Y)我,X(X)光突发事件,R(右))对于q个秒可能性L(左),的最大似然估计量(β,φ)来自将不是半参数有效的。然而是吗,什么时候X(X)我它减少到标准条件似然,反映出相对于L(左)c(c),对假设模型的依赖性较小第页0.
可能性类似于Paik和Sacco(2000)和白(2002)不同的是他们的建议,我们表示,省略因子π(年我,Z轴我)R(右)我和{1−π(年我,Z轴我)}1−R(右)我根据方程式(13)。我们研究通过下一节中的模拟。
使用条件似然,我们现在为(β,φ)构造如下。包含干扰参数α在里面和γ在里面π(·),因此估算(β,φ)需要估计α和γ与估计同时或之前β首先,我们使用可能性≺(R(右)|Y(Y),Z轴;γ)计算最大似然估计量和插头进入之内然后,尽管我们可能会考虑第页(X(X)光突发事件|R(右),Y(Y),Z轴;ξ)用于估算α,注意通过方程式(6)第页(X(X)光突发事件|R(右),Y(Y),Z轴;ξ)不仅取决于α但也在(βx个,φ). 我们建议通过首先进行最大似然估计来处理这个问题(α,βx个,φ)使用第页(X(X)光突发事件|R(右),Y(Y),Z轴;α,βx个,φ),生成估计值.估算然后插入到方程(4)中,以计算x个在里面. Thes、 作为的功能(β,φ),随后插入,然后用于估算(β,φ). 请注意βx个在这个过程中估计了两次,这显然会导致效率损失。然而,通过不合并βx个,当X(X)我永远不会丢失,从而减少估算中的偏差βx个由于错误指定第页0.
类似的程序可用于.不需要估计γ当X(X)我总是被观察到。由提出的估计器Paik和Sacco(2000)用于二进制Y(Y)我也依赖于可能性并涉及对(α,βx个),尽管其方式已插入用于估算β与我们的建议有些不同。
3.3. 使用完整记录数据进行有效估计
假设分析员只能访问观察到的记录中的数据X(X)我例如,在使用两阶段抽样策略的研究中可能会出现这种情况(布雷斯洛和凯恩,1988年;耶茨,1981年)其中公开发布的数据仅包含以下记录:X(X)我已测量。然后,分析以向量为条件R(右)非缺失数据指标,因此适当的可能性为
哪里Y(Y)光突发事件和Z轴光突发事件是的组件Y(Y)和行Z轴对应于中的X(X)光突发事件.仅使用完整记录数据的替代动机Y(Y)光突发事件即使所有记录上的数据都可用,对分布建模是否太困难或不切实际第页0第页,共页(X(X)我|Y(Y)我= 0,Z轴我),因为X(X)我和/或Z轴我具有高维度。调节开启X(X)光突发事件而且只有建模Y(Y)光突发事件避免了第页0.
为了推导方程(14),定义Y(Y)我有条件的X(X)我被观察为
然后
哪里B类(Y(Y)我,Z轴我;γ)=日志{π(Y(Y)我,Z轴我;γ)/π(0,Z轴我;γ)}. 因此θ(Y(Y)我|X(X)我,Z轴我)当没有缺失数据时,可以纠正可能缺失的数据X(X)我通过添加术语一(φ)B类(Y(Y)我,Z轴我,γ)条件开启时的线性预测器X(X)我被观察到(布雷斯洛和凯恩,1988年;利普希茨等。, 1998).
从形式上θ*(Y(Y)我|X(X)我,Z轴我)通过与方程(3)的类比,可以看出妨害参数q个秒允许∑我 Y(Y)我R(右)我作为一个完全充分的似然统计(14)。因此,完整数据条件似然为
并且,根据定理1,最大化得到了β估计量中的条件X(X)光突发事件并且只使用完整的数据记录。
计算θ*(Y(Y)我|X(X)我,Z轴我)需要了解概率π(Y(Y)我,Z轴我). 在只包含记录数据的公共使用数据集中X(X)我,的π(·)s或其中的一些估计值可能会与作为抽样概率的数据一起发布。或者,如果我们使用避免指定第页0,但所有数据都可用γ,≺(R(右)|Y(Y),Z轴;γ),可用于获得最大似然估计量然后可以插入对…进行推断β.拉图兹等。(2002)已经表明,使用在里面生产效率更高β-用真来推断γ.
4.仿真研究
4.1. 设计
比较第3节中给出的估计量在不同假设下的有限样本性能(X(X)我|Y(Y)我,Z轴我)和缺失机制π(·),我们进行了一个模拟,其中模型(1)是二进制的logistic模型Y(Y)我我们从均匀分布在200个阶层中的人群中取样(秒=1,…,200),让q个秒= {(秒−1)/199}2−1.5,因此一些地层将面临更高的风险Y(Y)我=1比大多数。我们考虑模型(1)的两个版本。在两者中,协变量Z轴我是标准正态随机变量。在第一个模型中,X(X)我伯努利和
所以corr(X(X)我,Z轴我) = 0.26. 在第二阶段,,其中遵循指数分布
这将产生corr(X(X)我,Z轴我) = 0.46. 自Z轴我标准正常,。对于这两种型号,βz(z)=对数(1.5)。对于二进制X(X)我,βx个=log(2.0),然而,对于删失指数X(X)我,βx个=对数(1.3)。在这两种情况下,E类(Y(Y)我)=0.3略高于(X(X)我,Z轴我,秒). 对于每个重复数据集,从200个人口阶层中的每个阶层抽取4名受试者,得出800个样本。
的使命X(X)我根据logit{Pr生成(R(右)我= 1|Y(Y)我,Z轴我,X(X)我;γ)} =γ0+γ1Y(Y)我+γ2Z轴我+γ三X(X)我,允许各种缺失机制。对于MAR数据生成,丢失程度仅取决于(Y(Y)我,Z轴我),我们设置γ=(1.6,−1,−1,0)和γ=(1.25,0,−1,0),分别将这些情况称为MAR-YZ和MAR-Z。根据MAR-Z,等于已知的γ,作为包含π(·)取消方程式(12)和(13)。此外,对于根据MAR-Z,术语B类(Y(Y)我,Z轴我;γ)=0英寸θ*,所以相当于通过简单地删除缺失的记录而获得的天真的条件可能性X(X)我从分析来看。为了研究估计量的稳健性,我们还考虑了两种数据不随机丢失的数据生成机制(NMAR)。对于缺失,仅取决于(X(X)我,Z轴我)(NMAR-XZ),我们设置γ=(1.65,0,-1,-1),对于二进制X(X)我和γ=(1.6,0,−1,−0.3),对于删失指数X(X)我与MAR-Z案件一样,当π(·)取决于(X(X)我,Z轴我)但不在Y(Y)我,已知的π(·)减少至,并且仅基于完整记录的天真可能性相当于已知的π(·). 最后,我们让思念取决于(Y(Y)我,X(X)我,Z轴我)(NMAR-YXZ),设置γ=(2.0,-1,-1,−1)(二进制)X(X)我和γ=(1.95,-1,-1,-0.3),针对删失指数X(X)我。所有四种缺失数据机制都产生了26%的缺失。
九个估计值β对每个复制进行了计算,其中一些复制涉及对分布的错误指定第页0(X(X)我|Z轴我;α)和/或模型π(Y(Y)我,Z轴我;γ). 首先,通过最大化得到有效的条件似然估计共同完成ξ= (β,α). 假设模型第页0是
对于二进制X(X)我和
对于删失指数X(X)我第二,我们最大化对于β,如第3.2节所述,使用相同的模型第页0和缺失模型
的(R(右)我|Y(Y)我,Z轴我). 第三,我们最大化,再次插入如第3.2节所述。接下来的三个估计值也使用了L(左)c(c),和但错误地认为X(X)我∐Z轴我,设置α1=α2在模型中=0第页0最后,我们仅使用完整记录数据计算了三个估计量。通过删除丢失的所有记录来获得原始估计值X(X)我和最大化具有B类(·) = 0. 完全记录估计器类似地使用,其中γ已知或被替换,估计与.对于MAR-Z和NMAR-XZ机制,已知的π(·)等价于具有B类(·) = 0. 对于每个数据生成机制和估计器,我们报告了以及相对于有效条件似然估计量的均方误差效率。可能性是在Fortran中编程的,最大化是通过在S-PLUS 6.0版中使用nlminb()实现的(MathSoft,2000年); 如有要求,作者可提供软件。
4.2。结果
在MAR数据生成机制下(表1),当分配第页0都是正确建模的L(左)c(c)和在偏见方面表现良好。使用中有一些效率损失,大概是因为L(左)c(c)以最佳方式使用信息βx个在里面第页(X(X)光突发事件|R(右),Y(Y),Z轴). 相比之下,在MAR-YZ下表现出偏差,似乎仅限于用于二进制X(X)我,证实了Paik和Sacco(2000),表2.根据MAR-Z,和表现类似,因为这两种可能性对于已知的π(·)和渐近等价,当π(·)是估计的。当分配第页0通过假设错误指定X(X)我∐Z轴我,的L(左)c(c)-估计值显示出偏差,在某些情况下,对于每个MAR数据机制来说,偏差非常严重。使用时,偏差更容易控制估计,可能是因为对假设模型的依赖性降低第页0。对于基于。结果仅针对实现收敛的重复。
使命机制. | 方法. | 二进制结果 X(X)我. | 截尾指数的结果 X(X)我. |
---|
%偏差. | %相对效率. | %偏差. | %相对效率. |
---|
βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. |
---|
3月-YZ | L(左)c(c),X(X)∐/Z轴 | 1.2 | −1.7 | 100 | 100 | 0.3 | −3.2 | 100 | 100 |
| 1.1 | −0.2 | 95 | 69 | −2.1 | −4.8 | 82 | 76 |
| −2.6 | 19.1 | 88 | 37 | −21.1‡ | 29.2‡ | 46† | 34‡ |
L(左)c(c),X(X)∐Z轴 | 20.5 | 12.4 | 66 | 92 | 33 | 67.3 | 50 | 25 |
| 9.7 | −1.5 | 91 | 69 | 17.4 | −9.4 | 83 | 69 |
| 10.2 | −0.2 | 88 | 40 | 21.1节 | −33.9§ | 57§ | 第16条 |
| −37.9 | 0.7 | 23 | 60 | −39.9 | 0.8 | 28 | 51 |
,已知π(·) | 2.5 | 0.9 | 48 | 60 | 0.1 | 2.5 | 56 | 51 |
,估计π(·) | 2.5 | 0.9 | 51 | 60 | 0.1 | 2.5 | 59 | 51 |
MAR-Z公司 | L(左)c(c),X(X)∐/Z轴 | 1.2 | −1.9 | 100 | 100 | 0.5 | −3.3 | 100 | 100 |
| 0.9 | −0.4 | 96 | 71 | −2.4 | −2.4 | 81 | 73 |
| 0.9 | −0.2 | 96 | 70 | −2.6 | −2.0 | 80 | 71 |
L(左)c(c),X(X)∐Z轴 | 20.5 | 22.6 | 65 | 68 | 33 | 99.1 | 47 | 13 |
| 9.5 | −1.5 | 92 | 70 | 16.9 | −8.5 | 80 | 70 |
| 9.4 | −1.5 | 92 | 69 | 17 | −8.7 | 80 | 68 |
| 1.9 | 0.3 | 54 | 60 | 0 | 3.2 | 56 | 55 |
,估计π(·) | 1.9 | 0.3 | 57 | 60 | 0 | 3.1 | 59 | 55 |
导弹发射机制. | 方法. | 二进制结果 X(X)我. | 截尾指数的结果 X(X)我. |
---|
%偏差. | %相对效率. | %偏差. | %相对效率. |
---|
βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. |
---|
3月-YZ | L(左)c(c),X(X)∐/Z轴 | 1.2 | −1.7 | 100 | 100 | 0.3 | −3.2 | 100 | 100 |
| 1.1 | −0.2 | 95 | 69 | −2.1 | −4.8 | 82 | 76 |
| −2.6 | 19.1 | 88 | 37 | −21.1‡ | 29.2‡ | 46‡ | 34‡ |
L(左)c(c),X(X)∐Z轴 | 20.5 | 12.4 | 66 | 92 | 33 | 67.3 | 50 | 25 |
| 9.7 | −1.5 | 91 | 69 | 17.4 | −9.4 | 83 | 69 |
| 10.2 | −0.2 | 88 | 40 | 21.1§ | −33.9§ | 57§ | 16§ |
| −37.9 | 0.7 | 23 | 60 | −39.9 | 0.8 | 28 | 51 |
,已知π(·) | 2.5 | 0.9 | 48 | 60 | 0.1 | 2.5 | 56 | 51 |
,估计π(·) | 2.5 | 0.9 | 51 | 60 | 0.1 | 2.5 | 59 | 51 |
MAR-Z公司 | L(左)c(c),X(X)∐/Z轴 | 1.2 | −1.9 | 100 | 100 | 0.5 | −3.3 | 100 | 100 |
| 0.9 | −0.4 | 96 | 71 | −2.4 | −2.4 | 81 | 73 |
| 0.9 | −0.2 | 96 | 70 | −2.6 | −2.0 | 80 | 71 |
L(左)c(c),X(X)∐Z轴 | 20.5 | 22.6 | 65 | 68 | 33 | 99.1 | 47 | 13 |
| 9.5 | −1.5 | 92 | 70 | 16.9 | −8.5 | 80 | 70 |
| 9.4 | −1.5 | 92 | 69 | 17 | −8.7 | 80 | 68 |
| 1.9 | 0.3 | 54 | 60 | 0 | 3.2 | 56 | 55 |
,估计π(·) | 1.9 | 0.3 | 57 | 60 | 0 | 3.1 | 59 | 55 |
使命机制. | 方法. | 二进制结果 X(X)我. | 截尾指数的结果 X(X)我. |
---|
%偏差. | %相对效率. | %偏差. | %相对效率. |
---|
βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. |
---|
3月-YZ | L(左)c(c),X(X)∐/Z轴 | 1.2 | −1.7 | 100 | 100 | 0.3 | −3.2 | 100 | 100 |
| 1.1 | −0.2 | 95 | 69 | −2.1 | −4.8 | 82 | 76 |
| −2.6 | 19.1 | 88 | 37 | −21.1† | 29.2‡ | 46‡ | 34† |
L(左)c(c),X(X)∐Z轴 | 20.5 | 12.4 | 66 | 92 | 33 | 67.3 | 50 | 25 |
| 9.7 | −1.5 | 91 | 69 | 17.4 | −9.4 | 83 | 69 |
| 10.2 | −0.2 | 88 | 40 | 21.1§ | −33.9§ | 57§ | 16§ |
| −37.9 | 0.7 | 23 | 60 | −39.9 | 0.8 | 28 | 51 |
,已知π(·) | 2.5 | 0.9 | 48 | 60 | 0.1 | 2.5 | 56 | 51 |
,估计π(·) | 2.5 | 0.9 | 51 | 60 | 0.1 | 2.5 | 59 | 51 |
MAR-Z公司 | L(左)c(c),X(X)∐/Z轴 | 1.2 | −1.9 | 100 | 100 | 0.5 | −3.3 | 100 | 100 |
| 0.9 | −0.4 | 96 | 71 | −2.4 | −2.4 | 81 | 73 |
| 0.9 | −0.2 | 96 | 70 | −2.6 | −2.0 | 80 | 71 |
L(左)c(c),X(X)∐Z轴 | 20.5 | 22.6 | 65 | 68 | 33 | 99.1 | 47 | 13 |
| 9.5 | −1.5 | 92 | 70 | 16.9 | −8.5 | 80 | 70 |
| 9.4 | −1.5 | 92 | 69 | 17 | −8.7 | 80 | 68 |
| 1.9 | 0.3 | 54 | 60 | 0 | 3.2 | 56 | 55 |
,估计π(·) | 1.9 | 0.3 | 57 | 60 | 0 | 3.1 | 59 | 55 |
使命机制. | 方法. | 二进制的结果 X(X)我. | 截尾指数的结果 X(X)我. |
---|
%偏差. | %相对效率. | %偏差. | %相对效率. |
---|
βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. |
---|
3月-YZ | L(左)c(c),X(X)∐/Z轴 | 1.2 | −1.7 | 100 | 100 | 0.3 | −3.2 | 100 | 100 |
| 1.1 | −0.2 | 95 | 69 | −2.1 | −4.8 | 82 | 76 |
| −2.6 | 19.1 | 88 | 37 | −21.1‡ | 29.2‡ | 46‡ | 34‡ |
L(左)c(c),X(X)∐Z轴 | 20.5 | 12.4 | 66 | 92 | 33 | 67.3 | 50 | 25 |
| 9.7 | −1.5 | 91 | 69 | 17.4 | −9.4 | 83 | 69 |
| 10.2 | −0.2 | 88 | 40 | 21.1§ | −33.9§ | 57§ | 16§ |
| −37.9 | 0.7 | 23 | 60 | −39.9 | 0.8 | 28 | 51 |
,已知π(·) | 2.5 | 0.9 | 48 | 60 | 0.1 | 2.5 | 56 | 51 |
,估计π(·) | 2.5 | 0.9 | 51 | 60 | 0.1 | 2.5 | 59 | 51 |
MAR-Z公司 | L(左)c(c),X(X)∐/Z轴 | 1.2 | −1.9 | 100 | 100 | 0.5 | −3.3 | 100 | 100 |
| 0.9 | −0.4 | 96 | 71 | −2.4 | −2.4 | 81 | 73 |
| 0.9 | −0.2 | 96 | 70 | −2.6 | −2.0 | 80 | 71 |
L(左)c(c),X(X)∐Z轴 | 20.5 | 22.6 | 65 | 68 | 33 | 99.1 | 47 | 13 |
| 9.5 | −1.5 | 92 | 70 | 16.9 | −8.5 | 80 | 70 |
| 9.4 | −1.5 | 92 | 69 | 17 | −8.7 | 80 | 68 |
| 1.9 | 0.3 | 54 | 60 | 0 | 3.2 | 56 | 55 |
,估计π(·) | 1.9 | 0.3 | 57 | 60 | 0 | 3.1 | 59 | 55 |
使命机制. | 方法. | 二进制结果 X(X)我. | 截尾指数的结果 X(X)我. |
---|
%偏差. | %相对效率. | %偏差. | %相对效率. |
---|
βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. |
---|
NMAR-XZ公司 | L(左)c(c),X(X)∐/Z轴 | 8.9 | −1.6 | 100 | 100 | 9.3 | −4.1 | 100 | 100 |
| 8.7 | −0.6 | 99 | 68 | 6.2 | 2.4 | 87 | 67 |
| 8.5 | 1.8 | 99 | 63 | 4.7 | 6.3 | 83 | 59 |
L(左)c(c),X(X)∐Z轴 | 20.5 | 15.2 | 70 | 83 | 33 | 87.2 | 50 | 20 |
| 13.6 | −0.9 | 89 | 67 | 21.2 | −7.5 | 75 | 69 |
| 13.6 | −0.2 | 89 | 62 | 21.7 | −10.2 | 73 | 64 |
| 1.9 | 1 | 59 | 56 | −0.4 | 3.8 | 63 | 53 |
,估计π(·) | 8.3 | 1 | 60 | 56 | 3.7 | 3.9 | 65 | 53 |
NMAR-YXZ公司 | L(左)c(c),X(X)∐/Z轴 | 11.9 | −28.2 | 100 | 100 | 14.7 | −26.3 | 100 | 100 |
| 12 | −26.5 | 97 | 83 | 11.9 | −21.8 | 88 | 78 |
| 9.8 | −8.0 | 100 | 64 | −11.6‡ | 31.6‡ | 45‡ | 28‡ |
L(左)c(c),X(X)∐Z轴 | 20.5 | −17.4 | 77 | 140 | 33 | 32.4 | 58 | 71 |
| 15.8 | −26.7 | 89 | 84 | 24.1 | −30.6 | 77 | 72 |
| 15.9 | −24.1 | 89 | 55 | 28.4§ | −64.9§ | 第59条 | 23§ |
| −34.1 | −25.0 | 30 | 76 | −36.9 | −20.8 | 35 | 61 |
,估计π(·) | 13.4 | −25.0 | 53 | 76 | 9.8 | −19.7 | 66 | 62 |
使命机制. | 方法. | 二进制结果 X(X)我. | 截尾指数的结果 X(X)我. |
---|
%偏差. | %相对效率. | %偏差. | %相对效率. |
---|
βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. |
---|
NMAR-XZ公司 | L(左)c(c),X(X)∐/Z轴 | 8.9 | −1.6 | 100 | 100 | 9.3 | −4.1 | 100 | 100 |
| 8.7 | −0.6 | 99 | 68 | 6.2 | 2.4 | 87 | 67 |
| 8.5 | 1.8 | 99 | 63 | 4.7 | 6.3 | 83 | 59 |
L(左)c(c),X(X)∐Z轴 | 20.5 | 15.2 | 70 | 83 | 33 | 87.2 | 50 | 20 |
| 13.6 | −0.9 | 89 | 67 | 21.2 | −7.5 | 75 | 69 |
| 13.6 | −0.2 | 89 | 62 | 21.7 | −10.2 | 73 | 64 |
| 1.9 | 1 | 59 | 56 | −0.4 | 3.8 | 63 | 53 |
,估计π(·) | 8.3 | 1 | 60 | 56 | 3.7 | 3.9 | 65 | 53 |
NMAR-YXZ型 | L(左)c(c),X(X)∐/Z轴 | 11.9 | −28.2 | 100 | 100 | 14.7 | −26.3 | 100 | 100 |
| 12 | −26.5 | 97 | 83 | 11.9 | −21.8 | 88 | 78 |
| 9.8 | −8.0 | 100 | 64 | −11.6‡ | 31.6‡ | 45† | 28‡ |
L(左)c(c),X(X)∐Z轴 | 20.5 | −17.4 | 77 | 140 | 33 | 32.4 | 58 | 71 |
| 15.8 | −26.7 | 89 | 84 | 24.1 | −30.6 | 77 | 72 |
| 15.9 | −24.1 | 89 | 55 | 28.4§ | −64.9§ | 59§ | 23§ |
| −34.1 | −25.0 | 30 | 76 | −36.9 | −20.8 | 35 | 61 |
,估计π(·) | 13.4 | −25.0 | 53 | 76 | 9.8 | −19.7 | 66 | 62 |
使命机制. | 方法. | 二进制的结果 X(X)我. | 截尾指数的结果 X(X)我. |
---|
%偏差. | %相对效率. | %偏差. | %相对效率. |
---|
βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. |
---|
NMAR-XZ公司 | L(左)c(c),X(X)∐/Z轴 | 8.9 | −1.6 | 100 | 100 | 9.3 | −4.1 | 100 | 100 |
| 8.7 | −0.6 | 99 | 68 | 6.2 | 2.4 | 87 | 67 |
| 8.5 | 1.8 | 99 | 63 | 4.7 | 6.3 | 83 | 59 |
L(左)c(c),X(X)∐Z轴 | 20.5 | 15.2 | 70 | 83 | 33 | 87.2 | 50 | 20 |
| 13.6 | −0.9 | 89 | 67 | 21.2 | −7.5 | 75 | 69 |
| 13.6 | −0.2 | 89 | 62 | 21.7 | −10.2 | 73 | 64 |
| 1.9 | 1 | 59 | 56 | −0.4 | 3.8 | 63 | 53 |
,估计π(·) | 8.3 | 1 | 60 | 56 | 3.7 | 3.9 | 65 | 53 |
NMAR-YXZ公司 | L(左)c(c),X(X)∐/Z轴 | 11.9 | −28.2 | 100 | 100 | 14.7 | −26.3 | 100 | 100 |
| 12 | −26.5 | 97 | 83 | 11.9 | −21.8 | 88 | 78 |
| 9.8 | −8.0 | 100 | 64 | −11.6‡ | 31.6‡ | 45‡ | 28‡ |
L(左)c(c),X(X)∐Z轴 | 20.5 | −17.4 | 77 | 140 | 33 | 32.4 | 58 | 71 |
| 15.8 | −26.7 | 89 | 84 | 24.1 | −30.6 | 77 | 72 |
| 15.9 | −24.1 | 89 | 55 | 28.4§ | −64.9§ | 59§ | 23§ |
| −34.1 | −25.0 | 30 | 76 | −36.9 | −20.8 | 35 | 61 |
,估计π(·) | 13.4 | −25.0 | 53 | 76 | 9.8 | −19.7 | 66 | 62 |
使命机制. | 方法. | 二进制结果 X(X)我. | 截尾指数的结果 X(X)我. |
---|
%偏差. | %相对效率. | %偏差. | %相对效率. |
---|
βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. | βz(z). | βx个. |
---|
NMAR-XZ公司 | L(左)c(c),X(X)∐/Z轴 | 8.9 | −1.6 | 100 | 100 | 9.3 | −4.1 | 100 | 100 |
| 8.7 | −0.6 | 99 | 68 | 6.2 | 2.4 | 87 | 67 |
| 8.5 | 1.8 | 99 | 63 | 4.7 | 6.3 | 83 | 59 |
L(左)c(c),X(X)∐Z轴 | 20.5 | 15.2 | 70 | 83 | 33 | 87.2 | 50 | 20 |
| 13.6 | −0.9 | 89 | 67 | 21.2 | −7.5 | 75 | 69 |
| 13.6 | −0.2 | 89 | 62 | 21.7 | −10.2 | 73 | 64 |
| 1.9 | 1 | 59 | 56 | −0.4 | 3.8 | 63 | 53 |
,估计π(·) | 8.3 | 1 | 60 | 56 | 3.7 | 3.9 | 65 | 53 |
NMAR-YXZ公司 | L(左)c(c),X(X)∐/Z轴 | 11.9 | −28.2 | 100 | 100 | 14.7 | −26.3 | 100 | 100 |
| 12 | −26.5 | 97 | 83 | 11.9 | −21.8 | 88 | 78 |
| 9.8 | −8.0 | 100 | 64 | −11.6‡ | 31.6‡ | 45‡ | 28‡ |
L(左)c(c),X(X)∐Z轴 | 20.5 | −17.4 | 77 | 140 | 33 | 32.4 | 58 | 71 |
| 15.8 | −26.7 | 89 | 84 | 24.1 | −30.6 | 77 | 72 |
| 15.9 | −24.1 | 89 | 55 | 28.4§ | −64.9§ | 59§ | 23§ |
| −34.1 | −25.0 | 30 | 76 | −36.9 | −20.8 | 35 | 61 |
,估计π(·) | 13.4 | −25.0 | 53 | 76 | 9.8 | −19.7 | 66 | 62 |
在NMAR数据机制下(表2),所有估算基于L(左)c(c),和有偏见。正如预期的那样,估算员使用正确的模型第页0比那些认为X(X)我∐Z轴我,以及一般情况和跑赢大市L(左)c(c)就偏见而言。同样,这很可能是因为L(左)c(c)-估计器严重依赖估计器对于第页0,NMAR机制导致对α。在这两种设置中,估计器均基于显然比基于,两者在估计α有趣的是,在NMAR-XZ下,和彼此等价,并且这两种可能性都有效。因此,所得估计值之间的唯一差异是π(·)插入然而,由于对第页0当随机缺失不成立时。同样,算法并不总是收敛于.
对于基于的方法(表1和表2),在MAR-YZ下,带有B类(·)=0严重偏向于βz(z)但在βx个。在任一MAR机制下,使用已知或估计的π(·)纠正了这种偏差,但效率远低于L(左)c(c)或.根据MAR-YZ,估计π(·)略微提高了相对于时间π(·)已知。正如预期的那样,就MAR-Z和NMAR-XZ的偏差而言,天真方法表现良好。
5.结论
在本文中,我们比较了文献中出现的几种方法的条件似然,这些方法用于具有缺失协变量的条件logistic回归模型的推断。我们的方法使用了更一般的标准指数族公式,因此所提出的方法超越了条件logistic回归,扩展到了其他具有干扰截获的固定效应模型。以下以建议的形式向这些模型的用户介绍了我们的结论。
首先,如果可以对分布进行建模第页0缺失的协变量X(X)我,可能性L(左)c(c)属于Satten和Kupper(1993)或萨顿和卡罗尔(2000)将得到以下项的半参数有效估计(β,φ)在存在干扰参数的情况下α和q个秒。如果可用,分析员对假设模型有信心第页0,这是选择的方法。另一种方法是使用一个新的估计量,使次优条件似然最大化该方法依赖于缺失模型π(·)以及第页0效率有所下降,尤其是在然而,它的优点是对错误指定的第页0当X(X)我永远不会丢失。可能性由于Paik和Sacco(2000)形式类似于但由于遗漏了涉及以下内容的条款,可能会出现偏差π(·). 除非无法建模π(·),我们不建议使用,因为它的表现优于.
当只记录观察到的X(X)我可用,完整的记录方法利普希茨等。(1998)使用似然在以观测值为条件的估计量中,半参数有效X(X)光突发事件。此方法要求概率π观察到的(·)X(X)我已知。什么时候?X(X)我有时会丢失,但(Y(Y)我,Z轴我)在所有记录中都可以使用与其他方法相比,它的效率要低得多,尽管它不需要对X(X)我。我们的模拟表明,通过对概率建模,可以略微提高效率π(Y(Y)我,Z轴我;γ)并使用估计值γ这是特定于所分析的数据的,即使γ已知。理论上的原因如下拉图兹等。(2002)然而,当分析师希望避免对X(X)我,推荐的方法是拉图兹等。(2002),他使用投影论证,在估算βz(z)与…相比,没有进一步的关键建模假设。最后,通过设置B类(·)=0英寸当损失取决于(X(X)我,Z轴我),但不在Y(Y)我虽然这种情况无法用数据进行测试,但如果研究人员能够通过外部数据或科学考虑来证明其合理性,则该估计器可能会引起人们的兴趣。
我们在第2节中指出第页0可能取决于地层变量秒。在某些应用程序中,可以使用层级信息,如果担心X(X)我不独立于q个秒那么重要的是要包括秒在模型中第页0.似然函数L(左)c(c),和易于扩展以允许第页0依靠秒以一些参数化的方式,不需要额外的开发。本着类似的精神π(·)可以包含的参数效应秒关于丢失概率。
我们在第1节中指出X(X)我可能是向量值,但我们一直假设X(X)我要么完全被观察到,要么完全缺失。这里介绍的一些方法扩展到更一般的情况,其中X(X)我部分观察到。如果L(左)c(c)则表达式(10)的右侧因子将保持不变。如前所述,表达式(10)中的左侧因子包含(X(X)我|Y(Y)我,Z轴我)对于其中的记录R(右)我= 1. 因此,在记录中X(X)我仅部分观察到,第页(X(X)我|Y(Y)我,Z轴我)R(右)我将替换为X(X)我,条件是(Y(Y)我,Z轴我),但在未观察到的部分边缘X(X)我。同样,对于,方程式(13)可以扩展为包含不同版本的对于每个我取决于为记录而观察到的缺失模式我.只要第页0(x个|Z轴我;α)为全矢量估计X(X)我,然后是任何缺失子向量的分布,给定X(X)我和Z轴我,也可用。对于、因素π和1−π方程(12)中的概率将被观测到的丢失模式的相应概率所代替。类似的方法也适用于与这些方法相比,完全记录估计器不容易扩展到能够利用部分观测到的记录X(X)我.
鸣谢
作者感谢副主编和两位审稿人提出的有益建议,这些建议大大改进了论文。本材料基于国家科学基金会(National Science Foundation)拨款0096412支持的工作。
工具书类
布雷斯洛
,东北。
和凯恩
,英国。
(
1988
)两阶段病例对照数据的Logistic回归
.生物特征
,75
,11
–20
.布雷斯洛
,东北。
和天
,东北。
(
1980
)癌症研究中的统计方法
,第1卷,病例分析-对照研究。里昂:国际癌症研究机构
.挖掘
,P.J.公司。
,梁
,K.-Y.公司。
和Zeger公司
,S.L.公司。
(
1994
)纵向数据分析
牛津大学:牛津大学出版社
.哥达姆布
,副总裁。
(
1976
)条件似然和无条件最优估计方程
.生物特征
,63
,277
–284
.格林
,W.H.公司。
(
2000
)经济计量分析
,第4版。上鞍座河:普伦蒂斯·霍尔
.林赛
,B.G.公司。
(
1983
)混合设置中条件分数的效率
.Ann.Statist公司。
,11
,486
–497
.利普希茨
,S.R.公司。
,帕尔逊
,M。
和Ewell公司
,M。
(
1998
)使用缺失协变量的条件logistic回归进行推断
.生物计量学
,54
,295
–303
.小
,R·J·A。
和鲁宾
,D.B.博士。
(
1987
)缺失数据的统计分析
纽约:威利
.MathSoft软件
(
2000
)S-Plus 6.0软件
西雅图:MathSoft软件
.麦库拉
,第页。
和内尔德
,J.A。
(
1989
)广义线性模型
,第2版。伦敦:查普曼和霍尔
.派克
,M.C.公司。
(
2002
)通信
.申请。统计师。
,51
,507
–508
.派克
,M.C.公司。
和萨科
,右侧。
(
2000
)缺失协变量的匹配病例对照数据分析
.申请。统计师。
,49
,145
–156
.拉图兹
,P.J.公司。
,周六
,总会计师。
和卡罗尔
,R·J。
(
2002
)缺失协变量数据的配对病例对照研究中的半参数推断
.生物特征
,89
,905
–916
.萨顿
,总会计师。
和卡罗尔
,R·J。
(
2000
)缺失协变量的条件和非条件分类回归模型
.生物计量学
,56
,384
–388
.萨顿
,总会计师。
和屈佩尔
,法律。
(
1993
)利用暴露信息概率推断暴露-疾病关联
.《美国统计杂志》。助理。
,88
,200
–208
.耶茨
,F、。
(
1981
)人口普查和调查的抽样方法
,第4版。伦敦:格里芬
. 附录A:技术细节
A.1、。前期工作
让Z轴(秒)表示矩阵Z轴用于地层秒对于每个J型,假设所有推断都是以序列为条件的{Z轴(秒)}秒=Z轴(1),…,Z轴(J型). 在使用中L(左)*c(c)(ξ*)用于推断ξ*,最大条件似然估计量是解决,其中U型*c(c)=(∏{log(L(左)*c(c))}/∂ξ*). 遵循标准渐近理论,如J型→ ∞,依法收敛到高斯随机变量,其方差等于极限信息的倒数,
哪里.确保定期ξ*-推论,假设是这样{Z轴(秒)}秒极限(15)是正定的。
为了便于演示,我们假设样本大小n个在地层中是恒定的秒,尽管可以放宽这一假设。假设每个z(z)∈支持(Z轴)分布问z(z)第页,共页(q个秒|Z轴=z(z))在实线上是绝对连续的,并且q个秒s在秒给定{Z轴(秒)}秒.林赛(1983)研究了有效估计的问题ξ*在存在有害混合分布的情况下问z(z); 然而,对于指数族模型(1)和(2),他的结果仅限于以下情况Z轴(秒)在中为常数秒在下文中,我们概述了他的发展,并将他的结果概括为Z轴(秒)在中变化秒虽然我们假设为了便于演示ξ*是一维的,Lindsay还表明(ξ*)>1很简单。
第2节和第3节林赛(1983)处理存在非参数妨害函数时一维参数估计的一般问题。他定义了“修改后的最小费希尔信息”𝒥 (Lindsay表示该数量我**)并显示了𝒥 一致估计的Cramér–Rao方差下限是ξ*所以,什么时候ℐ*c(c)========================================================𝒥,是半参数有效的。这些结果直接应用于我们的设置,其中干扰函数将是映射𝒬 定义见下文第A.2节。
第4节林赛(1983)处理了妨害函数为混合分布的情况问z(z),但在哪里Z轴(秒) =z(z)固定在秒,提供条件ℐ*c(c)========================================================𝒥. 假设,对于固定ξ*,完全充分统计量∑我 Y(Y)我具有标准参数的指数族密度q个秒,如方程式(3)所示。假设真实混合分布问z(z),0在实线的区间上是绝对连续的,那么ℐ*c(c)========================================================𝒥(林赛(1983),推论4.4)。要了解该结果发展的关键步骤,请定义混合物模型
参数化者ξ*和问z(z)现在,定义中心似然比得分的类别
索引者c(c)z(z)⩾0和P(P)z(z),其中和问z(z),0是真正的参数值。在方程式(16)中,P(P)z(z)是任何混合分布q个秒在真实线路上V(V)(c(c)z(z),P(P)z(z))具有有限方差(). 得分(16)出现在右手τ-单参数导数(inτ)混合物模型评估时间:τ=0+对于给定c(c)z(z)和P(P)z(z).定义𝒞z(z)成为ℒ2-所有可能中心似然比得分集的闭包V(V)(c(c)z(z),P(P)z(z))超过c(c)z(z)和P(P)z(z)最后,让我们U型*=(∏{log(L(左)*)}/∂ξ*),其中L(左)*如方程式(3)所示。然后,ℐ*c(c)========================================================𝒥根据事实推断U型*c(c)=U型*−E类(U型*|Σ我Y(Y)我,Z轴)还有那个E类(U型*|Σ我 Y(Y)我,Z轴) ∈ 𝒞z(z).
A.2、。定理1的证明
将此结果扩展到Z轴(秒)各不相同秒,定义顺序{Y(Y)(秒)}秒=Y(Y)(1) ,…,Y(Y)(J型). 定义𝒬 成为支持的映射Z轴到实线上绝对连续分布的空间𝒬(z(z)) =问z(z)类似地,让𝒫 是来自supp的任何映射(Z轴)到实线上混合分布的空间,这样,对于每个z(z)和𝒫(z(z)) =P(P)z(z),方程(16)具有有限方差。让c(c)(z(z)) =c(c)z(z)是来自supp的任何映射(Z轴)到非负实线。现在,对于任何给定的𝒫 和c(c)(·),定义单参数产品混合模型
然后τ-得分为τ=0+来自模型(17)是
让𝒞 成为ℒ2-所有可能得分集的闭包V(V){c(c)(·),𝒫} 结束c(c)(·)和𝒫.
现在,对地层进行总结秒,条件得分是
所以,为了证明这一点是半参数有效的,当Z轴(秒)各不相同秒,这足以表明
在中𝒞. 但这显然是真的,因为
- (a)
𝒞是一组正系数的线性组合𝒞Z轴(秒)第页,
- (b)
为所有人秒和
- (c)
是数量的正系数线性组合.
©2003皇家统计学会