摘要

选择变量后,回归参数的标准推断程序可能不会一致有效; 没有有限的样本大小可以保证标准测试大致达到其标称大小。在高维设置中,变量选择变得不可避免,这一问题更加严重。这引发了一系列针对低维回归参数(例如,暴露的因果效应)开发一致有效假设测试的活动A类关于结果Y(Y))在高维模型中。迄今为止,对模型错误规范的关注有限,尽管这在高维设置中是不可避免的。假设暴露和结果的工作模型都得到了正确规定,我们提出了在稀疏条件下一致有效的零值测试,这种稀疏条件弱于文献中通常引用的条件。当其中一个模型指定错误时,通过修改估算干扰参数的程序,我们的测试继续有效;因此,它们是双重鲁棒我们的建议是直接使用现有软件进行惩罚最大似然估计,不需要样本分割。我们在根特大学重症监护室获得的模拟和数据分析中对其进行了说明。

1引言

我们将考虑一项研究设计,该设计收集独立且相同分布的结果数据Y(Y),感兴趣的风险敞口A类和协变量向量L(左)其中一些可能混淆了A类Y(Y).评估A类Y(Y)是为了拟合回归模型A类以及协变量;A类然后用于推断曝光效果。在实践中,对于给定数据集中哪些变量是混淆变量,以及如何建模这些混淆变量与结果之间的关联,通常很少有先验知识。因此,通常采用数据自适应程序来选择变量以进行调整和/或选择模型以确定其依赖性Y(Y)尤其是,当L(左)接近或大于观察次数。

然而,在模型选择后,获得近似于其标称规模/覆盖范围的假设检验和置信区间是一项挑战。A类例如,直接通过正则化技术获得,使用惩罚最大似然估计量(PMLE)-将继承所谓的正则化偏差。此外,该估计量的适度样本分布通常是非正态的(Leeb和Pötscher,2005年). 这是因为渐近正态分布的收敛性不是制服关于索引模型的参数Y(Y)因此,不存在有限n个这样,基于正常值的测试和间隔就可以保证表现良好。这一问题更普遍地适用于正则化后估值器(通过正则化选择的模型使用所选的协变量进行重新调整)和常规使用的逐步变量选择策略。标准推理程序也忽略了模型选择过程中产生的额外不确定性。

在数理统计文献中,这促使了获得一致有效高维模型中低维回归参数的推断。最初的重点是使用拉索拟合回归模型中系数的测试和置信区间(贝略尼., 2014;范德格尔., 2014;张和张,2014)之后,注意力转向更通用的数据自适应方法(Ning和Liu,2017年;切尔诺茹科夫., 2018). 关键的见解是,应该根据附加的工作模型进行选择,以便在A类L(左)(除了Y(Y)具有A类L(左)). 最近的大多数建议都依赖于对稀疏性的强烈假设,例如L(左),需要比样本量的平方根小得多n个在生物统计学中,有针对性最大似然估计(TMLE)的早期发展,其中数据自适应方法被纳入因果效应的估计中(van der Laan和Rose,2011). TMLE的大部分理论都是在Donsker条件下根据经验过程文献发展起来的(但并非全部,例如Zheng和van der Laan,2011). 在允许协变量的维数随样本大小增长的情况下,这些条件通常过于严格。

在这项工作中,我们描述了如何获得高维广义线性模型(GLM)中回归参数因果零假设的一致有效检验。我们的测试要求假设暴露的条件平均值和给定协变量的结果的工作模型。我们将在参数模型下工作,因为这是实践中通常要做的事情。首先,我们描述了一种估算妨害参数的程序,只要所有工作模型都正确,该程序就会产生有效的测试。然而,由于我们不知道要开始的真正模型,因此需要进行正则化/模型选择,因此可能会出现某种程度的错误。当数据集中的协变量数量相对于观察数量非常大时,这种感觉最为强烈。然后,我们展示了如何修正先前的妨害参数估计过程,以便在任一工作模型正确的情况下,测试统计量将一致收敛到极限正态分布。因此,可以进行测试一致双重鲁棒这与一些现有的建议形成了对比,这些建议给出了双重稳健的估计,但没有推论(范德拉恩和罗斯,2011年;Farrell,2015年;切尔诺茹科夫2018年;Shah和Peters,2019年). 此外,我们将表明,当两个工作模型都正确时,在某些情况下,测试将在比文献中引用的稀疏条件弱的情况下继续达到其标称尺寸。我们的测试统计量很容易构建,所有估算干扰参数的程序都可以使用现有的惩罚回归软件来执行。不需要进行样本分割,这使得我们的建议更易于实现,并且在中等样本大小下受正则化偏差的影响更小。

论文组织如下:第2节,我们陈述了我们感兴趣测试的零假设,并描述了在高维环境中获得有效推理的问题。第3节显示分数测试统计。在节中45,我们描述了估算妨害参数的具体步骤,首先是在所有工作模型都正确的情况下,然后是在指定错误的情况下。我们还讨论了各种方法的渐近性质。我们通过仿真研究说明了这些方法第6节以及根特大学重症监护室(ICU)的数据分析第7节其中,我们考虑了血糖水平变化对危重患者死亡率的影响。

2动机

我们考虑对无效假设的检验小时0那个Y(Y)独立于A类在由定义的地层内L(左),或

(1)

我们会让曝光A类为二进制,例如,如果个人接受特定医疗,则编码为1,否则编码为0;本文稍后将讨论对更一般风险敞口的扩展。然后给出因果推理文献中的标准结构条件,特别是L(左)这足以调整混杂因素,虚假设也表示缺乏A类Y(Y),条件是L(左).

通过回归框架可以使用简单的方法来测试条件独立性的零假设小时0需要估计论坛,因为在null下,论坛(完全条件独立意味着平均条件独立)。在现实环境中L(左)具有多个连续分量,该函数的非参数估计可能表现不佳。一个常见的策略是假设一个参数回归模型论坛平均值为Y(Y)以协变量为条件:

哪里论坛是未知有限维参数β中的已知光滑函数。然后,通过GLM的最大似然估计,在预先指定的模型下论坛可以获得一致且一致渐近正态(UAN)的分数统计量用于测试小时0(其中均匀性与β有关)。这意味着存在一个有限的样本量,对于参数空间内的任何β值,测试统计量将近似正态分布。我们注意到,尽管这是对小时0,只有在遵循某种形式的平均条件独立性的备选方案方向上才是一致的Y(Y)A类; 本文中描述的后续测试也是如此。

不幸的是,这种标准方法并没有直接扩展到高维环境中。在低维设置中,可以对因果零度进行分数测试小时0基于无偏(非标度)分数检验统计量的渐近分布论坛; 对于典型GLM的似然估计,论坛.然后让论坛表示直接通过某种正则化方法或在模型选择后获得的β估计。根据泰勒展开式,

(2)

哪里论坛表示欧几里德范数。对于固定β,通过调用论坛可以说(2)是渐近正常的。事实上,假设论坛收敛得足够快,余项论坛收敛到零。但一般来说,这并不妨碍收敛序列的存在论坛对于其中论坛因此,测试统计量具有复杂的非正态分布。这其中的一个根本原因是许多数据自适应方法的离散性,例如,逐步选择;在一些样本中,论坛将被强制为零,而在其他情况下,它将被允许采用其估计值。在某些序列下,随着样本量的增加,这种离散行为持续存在论坛。因此,所得分数测试统计值收敛到极限标准正态分布在参数空间上是不一致的(Leeb和Pötscher,2005年;Dukes和Vansteelandt,2019年). 这很麻烦,因为人们希望有一个有限的n个在这种情况下,无论干扰参数的(未知)真值如何,为了保证程序在有限样本中能够很好地工作,保证正常近似都能很好地保持。

3因果零假设的一致有效检验

我们在本节中介绍我们将用于测试的统计数据小时0在高维环境中。现在让我们正式定义γ为索引参数模型的讨厌参数论坛对于的条件平均值A类鉴于L(左):

哪里论坛是未知有限维参数γ中的已知光滑函数;条件平均数论坛被称为倾向得分用于二进制A类。我们的分析基于分数函数

哪里论坛这需要在工作模型下对γ和β进行初步估计论坛论坛分别是。很自然地会对A类L(左)例如,使用逻辑回归,论坛; 如果A类如果是连续的,可以假设一个线性或对数线性模型,然后可以很容易地调整该建议。模型的形式论坛取舍将取决于结果的性质。如果Y(Y)是连续且无约束的,例如,可以假设一个线性模型,论坛.

然后可以构建测试统计

我们将与标准正态分布进行比较。在这里,论坛论坛是η的估计值;在下文中,我们将重点讨论该参数的正则化估计。请注意,在评估函数时论坛论坛在其极限值下,可以得出论坛null下等于

如果任何一种模型都为零论坛论坛在联合模型下是正确的a.k.a论坛因此,我们参考分数论坛具有双重鲁棒性。

4所有模型正确时η的估计

4.1建议书

我们首先考虑数据生成过程,其中两个模型论坛或型号论坛例如,我们将在交叉口子模型下工作论坛在高维设置中,在模型下论坛,可以估计γ和βas论坛论坛分别使用任何足够快速收敛的稀疏估计器。例如,使用二进制A类和连续Y(Y)使用标准PMLE和拉索惩罚,论坛论坛可以通过以下方式获得

(Tibshirani,1996年),其中论坛论坛是惩罚参数。为了保持符号简单,我们省略了论坛论坛论坛论坛分别为(以及上n个). 将结果估算插入论坛将生成一个在null下遵循标准正态分布的测试统计。我们注意到,我们的定理1相当一般,并涵盖了其他缺陷-估计方法(包括Lasso上的变体)。

给出一些关于为什么可以插入的直觉论坛论坛进入之内论坛然后通过在(2)为了得分论坛,我们观察一阶项

(3)

我们可以在模型下控制这个术语论坛,自论坛则在η的极限值处的期望值为零。例如,当论坛论坛,然后使用迭代期望定律

在null下。此属性有助于确保该术语()无论论坛。当L(左)是低维的(Vermeulen和Vansteelandt,2015年). 令人惊讶的是,即使对η使用非常规估计,它在高维环境中仍然保持不变(贝略尼., 2016).

我们建议通过交叉验证在实践中选择惩罚参数,尽管在这方面关于其有效性的理论结果有限(切特韦里科夫., 2016 2016),我们的推断假设这些参数是固定的。标准条件是论坛论坛(其中论坛表示最大值b条),这是我们的理论结果所必需的(参见Web附录A)。在实践中,我们还建议改装这两种工作模式;为了提高有限样本的性能,文献中通常会进行模型修正(贝略尼., 2016;Ning和Liu,2017年). 我们的理论可以通过引用后Lasso估计的结果来实现这一点(贝略尼2014年,2016). 对于任何矢量论坛,让我们将其支持定义为论坛; 然后我们重新安装每个模型论坛论坛使用论坛论坛分别是。

4.2渐近性质

论坛是服从交集子模型的一类定律论坛; 那么我们对一系列规律下的收敛感兴趣论坛。我们将考虑第页增加n个参数γ和β的值取决于n个,因此也是模型论坛论坛(尽管关于模型的注释将被抑制)。这样做是为了更好地了解测试统计的有限样本行为L(左)是高维的。论坛论坛是参数索引模型的总体值论坛论坛分别是。最后,让我们论坛表示与本地数据生成过程相关的概率论坛.

定理1。让我们将活动变量集定义为论坛论坛此外,让论坛表示基数论坛同样地论坛、和第页表示向量的长度论坛论坛。假设除Web附录A中的假设1和假设2外,以下稀疏条件成立:

  • (i)

    论坛,

  • (ii)

    论坛,

然后在下面小时0以及交集子模型,对于满足Web附录A中假设2的所有估值器,我们有论坛:

(4)

备注1。Web附录A中给出了保持该结果所需的关键假设。其中,假设1包含温和的力矩条件,而假设2需要对论坛论坛在经验中2-规范。条件(i)要求论坛论坛; 为了保证稀疏估计的一致性,这些条件是非常标准的。条件(ii)意味着我们可以考虑论坛如果论坛很小,反之亦然。我们认为这很有用,因为在许多医疗环境中,医生在决定患者的治疗时可能会依赖有限的因素。因此,曝光模型可能是“超稀疏”的,例如,论坛相反,临床结果(如疾病发生)的模型似乎不太可能由少量协变量很好地近似。这些条件基本上等同于切尔诺茹科夫. (2018)以及在的补充附录中贝略尼. (2014),其中使用了样本分割/交叉拟合;实际上,我们得到的结果比贝略尼. (2014)(谁要求这样论坛对一些人来说论坛用于一致有效的推断)。

备注2。法雷尔(2015),在更强的假设下,获得了对边际治疗效果的一致有效推断论坛(忽略对数因子)。基于权衡假设获得一致有效的估计值和检验论坛论坛,事实证明,至关重要的是()期望值为零,仅条件为论坛; 在许多估算问题中,这是不可能的,因为为Y(Y)需要对暴露进行调整/调节,因此估计系数取决于论坛。解决此问题的一种方法是使用样本分割(切尔诺茹科夫., 2018). 然而,在null下,我们的分数测试统计将分解为一个涉及A类L(左),以及一个涉及Y(Y)L(左)。该因子分解与通常通过样本分割实现的结果非常相似,因此我们可以避免这样做。事实上,在较弱的零假设下,检验统计量也收敛到标准正态论坛,尽管此结果需要更强的稀疏性条件(即定理2的条件)。如果使用所选协变量的并集改装工作模型,则上述程序还需要更强大的条件论坛(贝略尼., 2014),因为在模型中为论坛另外取决于数据论坛(Farrell,2015年).

备注3。虽然我们关注的是稀疏估计,但定理1应该适用于更通用的机器学习估计方法论坛论坛所需的关键条件是预测误差的一致性以及产品的收缩2误差标准为论坛; 参见Web附录A和切尔诺茹科夫. (2018)了解更多详细信息。

5模型未指定情况下η的估计

5.1提案

在联合模式下论坛,插入任意高质量稀疏估计器论坛η的论坛通常不会导致测试统计量均匀收敛到标准正态分布。因此,尽管分数加倍稳健论坛不会屈服一致有效的双稳健推理这可以通过复制泰勒展开式看出(2)为了得分论坛; 坡度论坛不再保证是平均零,通常需要近似论坛评估联合模型下得分函数的可变性。然而,如前所述,在高维环境中通常不可能很好地近似这个术语。

我们将处理有问题的术语()通过使用渐变论坛为了估算η,以确保论坛在妨害参数的估计值处近似等于零。这样就只剩下了score函数(其余的函数除外)论坛,我们将展示UAN。具体来说,可以通过求解以下次梯度估计方程来估计η:

(5)
(6)

在这里,论坛表示元素向量论坛,其中论坛对于论坛如果论坛论坛否则。罚款期限(5)对应于▽的次梯度1规范论坛关于γ和同样的处罚(6); 因此,我们的程序相当于1-受到惩罚的-估计。虽然我们的程序要求初始工作模型论坛论坛具有相同的维数,使用拉索惩罚将倾向于返回具有不同数量非零分量的干扰参数估计值。我们再次建议使用通过惩罚选择的协变量重新调整每个工作模型。上述程序扩展了以下的偏差减少双稳健估计方法Vermeulen和Vansteelandt(2015)纳入处罚;因此,我们使用论坛论坛分别参考γ和β的估算结果。

5.1.1示例1:持续结果

返回到的示例第3节我们可以假设结果为线性模型,暴露为logistic模型。在这种情况下,方程的解(5)和(6)指定以下凸优化问题的最优值:

(7)
(8)

因此,可以通过用拉索罚函数拟合逻辑回归模型来估计γ,然后用拉索惩罚函数和使用估计值构造的权重再次拟合线性回归模型来估算β论坛.

5.1.2示例2:二进制结果

二进制条件平均值的一个更合适的工作模型Y(Y)可能是论坛因此,我们现在有两个最小化问题

另一个复杂的问题是,求解每组方程需要对其他干扰参数进行初始估计。然后有两种可能的方法;一种是通过最大化联合惩罚似然来估计γ和β。或者,可以使用Web附录B中算法1中描述的迭代过程,该迭代过程可以很容易地适用于其他类型的结果。

Avagyan和Vansteelandt(2017 2017)和谭(2019)在估计平均治疗效果的背景下提出密切相关的建议;然而,专注于假设检验和条件治疗效果可以使一些简化。我们的妨害参数估计方法是基于加权У1-惩罚最大似然估计,因此使用现有软件更容易实现,并且在高维设置中可能不太需要计算。我们还将能够在测试统计量的理论性质上获得更清晰的结果(就稀疏性条件而言);看见第5.2节当暴露模型为线性时,我们对未标度检验统计量的估计论坛简化为“去相关分数”方法Ning和Liu(2017)因此,这项工作将分数函数的稳健性扩展到模型下UAN测试的构造论坛具体来说,通过允许任意暴露和结果模型,并通过方差的“三明治估计器”缩放统计论坛,我们的测试比Ning和Liu(2017),在等效假设下论坛论坛(请参见第5.2节).

5.2渐近性质

我们现在将研究论坛根据一系列法律论坛,其中论坛表示遵循联合模型的一类法律论坛; 因此,这个类比第4.2节.

定理2。假设除Web附录A中的假设1、3和4外,还存在以下稀疏条件:

  • (iii)

    论坛.

然后在下面小时0和联合模型论坛,使用估计器论坛论坛,我们有任何论坛,

(9)

备注4。该定理表明,在关键超稀疏条件(iii)下,我们提出的测试在参数空间上一致双重鲁棒。该条件要求模型中非零系数的数量论坛论坛相对于总样本量的平方根而言较小;这比条件(i)和(ii)强得多。然而,在越来越多的关于高维推理的文献中,这种假设很常见(贝略尼., 2016;Ning和Liu,2017年),其中通常不允许出现型号错误。假设3和4要求对系数γ和β进行足够快速的估计(尤其是在1-规范)以及功能论坛论坛.

我们提案的一个优点是先验的有关暴露分布的知识可以很容易地纳入测试统计。的确,请注意,当论坛已知,那么根据我们的建议,可以使用标准色估算β1-无权重惩罚回归;因此,建议简化为第4节这是因为模型中的参数没有梯度论坛并保证了曝光模型的正确性。

推论1。假设A类是随机化的,具有随机化概率论坛已知的论坛.如果论坛已插入论坛,可以使用较弱的稀疏条件获得一致有效的测试论坛无论型号论坛已正确指定。

备注5。定理1和定理2的推论表明,当我们知道随机化概率时,我们可以仅依赖这种较弱的稀疏性条件来获得有效的测试,即使模型论坛指定错误。

定理3。如果正确指定了两个工作模型,并且结果回归模型是线性的,那么我们对违反稀疏性有一些额外的鲁棒性,如下定理所示:

什么时候?论坛在β中是线性的,我们将自己限制在论坛遵守交叉口子模型论坛,然后(使用估值器论坛论坛)分数测试统计一致收敛,如(9)低于小时0,假设1-7,以及条件(i)论坛

  • (iv)

    论坛

哪里论坛.

备注6。在线性模型的背景下Y(Y)因此,我们的建议是“稀疏自适应”的,即当两个模型都正确时,我们的提议在类似于定理1所要求的条件下是有效的。如中的示例第5.1.1节显示,估计重量取决于论坛只有在拟合结果模型时才需要;定理3的证明取决于证明估计权重比在固定权重下估计β的影响更小。对于非线性结果模型,由于拟合暴露模型还需要依赖于以下因素的权重,因此很难获得等效结果论坛; 然而,使用样本分割可以显示一般结果(通过估计与构建测试统计量所用样本分离的样本中的权重)。尽管如此,这说明了建模和稀疏性条件之间的权衡;如果我们希望在并集模型下获得推理,那么我们通常需要更强的条件论坛论坛.

备注7。定理3所需的稀疏性条件精确地简化为定理1所需的条件(因此Chernozhukov.,2018)何时论坛然而,相反的说法不成立;即使论坛,强烈假设论坛仍然需要。这表明,权重估计质量差可能会影响β的估计。我们不认为这种不对称性是一个严重的缺点,因为在许多情况下,我们希望该模型论坛更可能是稀疏的。

6模拟研究

在本节中,我们进行了模拟分析,以比较所提出的假设检验与因果零假设的不同检验的性能。在我们的研究中,我们考虑对零假设(1)进行以下测试:

  • 1

    一种幼稚的后选方法t吨-在标准后选择β后,使用线性回归法对无效值进行检验1-惩罚线性回归。我们研究了这种方法在强制暴露(即处理效果ψ不受惩罚)和不强制包含在模型中时的性能。

  • 2

    基于计量经济学文献中提出的“双重选择后”(PDS)和“部分淘汰”(PO)方法的测试贝略尼. (2014),其中Y(Y)回归于L(左)A类L(左)同样(都使用带有拉索惩罚的线性模型)。然后,PDS使用第二阶段回归,其中线性模型用于Y(Y)使用普通最小二乘法拟合,调整为A类以及在第一阶段选择的协变量的并集,而PO模拟了罗宾逊(1988)对于部分线性模型,也使用改装。这两种方法都是使用包hdm在R中实现的。

  • 三。

    中描述的步骤第4节,在模型下有效论坛,其中考虑使用标准logistic回归和线性回归进行分数测试,然后根据У对参数γ和β进行后选1-惩罚logistic回归与▽1-惩罚线性回归(以下简称PMLE-DR)。

  • 4

    中描述的步骤第5节,在模型错误指定的情况下有效,其中,在基于У的参数γ和β后选后,使用标准logistic回归和加权线性回归对零进行分数测试1-惩罚logistic回归(7)和▽1-惩罚加权线性回归(8),(以下简称BR-DR)。

注意,所有考虑的方法都需要选择惩罚参数。在我们的仿真研究中,我们使用10倍交叉验证技术来选择初始方法以及PMLE-DR和BR-DR的调谐参数论坛论坛通过参数lambda.min使用R包glmnet;这将选择最小化平均交叉验证误差的值。在hdm包中,PDS和PO是使用预先指定的惩罚参数值实现的(切尔诺茹科夫., 2016); 为了研究使用不同惩罚的影响,我们还执行了PDS,如中所述贝略尼. (2014)使用交叉验证而不是预先指定的值。

在仿真分析中,我们生成n个相互独立的向量论坛,论坛.给,论坛是具有协方差矩阵∑的均值为零的多元正态协变量;任何一个论坛(不相关协变量)或论坛,其中论坛(相关协变量)。为了简单起见,我们考虑了二元暴露模型和线性结果模型。我们为每个人论坛,二分曝光论坛采用值0或1论坛,结果论坛以平均值正态分布论坛和单位方差,条件是论坛论坛此外,使用以下参数化工作模型分析模拟数据:论坛论坛,其中论坛,论坛.干扰参数论坛论坛定义为论坛,论坛,论坛,论坛,其中下标表示0在向量中的索引(即位置)。考虑的有害参数设置具有挑战性,因为存在强预测暴露和弱预测结果的混杂因素。此外,还有一些协变量可以适度预测结果,但与暴露无关。为了评估模型错误指定的影响,我们接下来使用以下结果模型生成数据:论坛最后,对于上述数据生成机制,我们对论坛论坛,论坛论坛,论坛论坛、和论坛论坛.

桌子12显示基于1000个复制的类型I错误。仿真结果表明,只要正确指定结果模型,PMLE-DR和BR-DR方法的拒绝率接近5%的标称水平。另一方面,我们观察到,即使正确指定了这两个模型,天真的方法也会提供较高的拒绝率。此外,这些比率不会随着样本量的增大而减小。这种糟糕的表现与Leeb和Pötscher(2005)我们还观察到PDS和PO的拒绝率相对较高。这种糟糕的性能部分似乎是由于选择惩罚参数的特定数据驱动程序,这导致选择的协变量数量不足。然而,即使在对PDS进行交叉验证时,两种方法之间仍然存在差异。当协变量相关且结果模型不正确时,PMLE-DR试验相对于BR-DR试验是轻度反保守的;事实上,PDS(通常不是双重稳健的)在此设置中表现得相对较好,这表明所考虑的错误规范类型可能不会造成特别大的破坏。在Web附录C中,我们还考虑了倾向得分模型中修改的稀疏性下的附加设置,以及异方差;与中的结果类似12跨设置查看。

表1

基于1000次重复,5%显著性水平的I类错误:论坛

正确的型号
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(强制)0.5480.8090.2910.600
标准天真(非强制)0.2750.5550.1680.316
PDS(预先指定)0.5170.7610.5360.498
采购订单(预先指定)0.5080.7480.5190.482
PDS(CV)0.0740.0740.0680.072
PMLE-DR公司0.0550.0540.0700.075
巴西存托凭证0.0530.0690.0780.073
正确的型号
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(强制)0.5480.8090.2910.600
标准天真(非强制)0.2750.5550.1680.316
PDS(预先指定)0.5170.7610.5360.498
采购订单(预先指定)0.5080.7480.5190.482
偏微分方程0.0740.0740.0680.072
PMLE-DR公司0.0550.0540.0700.075
巴西存托凭证0.0530.0690.0780.073
结果模型不正确
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(强制)0.3680.5860.2100.425
标准天真(非强制)0.1750.3130.1150.197
PDS(预先指定)0.3190.6340.3450.327
采购订单(预先指定)0.3170.6150.3450.309
PDS(CV)0.0730.0720.0600.070
PMLE-DR公司0.0560.0530.0700.059
巴西存托凭证0.0460.0590.0810.050
结果模型不正确
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(被迫)0.3680.5860.2100.425
标准天真(非强制)0.1750.3130.1150.197
PDS(预先指定)0.3190.6340.3450.327
采购订单(预先指定)0.3170.6150.3450.309
偏微分方程0.0730.0720.0600.070
PMLE-DR公司0.0560.0530.0700.059
巴西存托凭证0.0460.0590.0810.050
表1

基于1000次重复,5%显著性水平的I类错误:论坛

正确的型号
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(强制)0.5480.8090.2910.600
标准天真(非强制)0.2750.5550.1680.316
PDS(预先指定)0.5170.7610.5360.498
采购订单(预先指定)0.5080.7480.5190.482
PDS(CV)0.0740.0740.0680.072
PMLE-DR公司0.0550.0540.0700.075
巴西存托凭证0.0530.0690.0780.073
正确的型号
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(被迫)0.5480.8090.2910.600
标准天真(非强制)0.2750.5550.1680.316
PDS(预先指定)0.5170.7610.5360.498
采购订单(预先指定)0.5080.7480.5190.482
偏微分方程0.0740.0740.0680.072
PMLE-DR公司0.0550.0540.0700.075
巴西存托凭证0.0530.0690.0780.073
结果模型不正确
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(强制)0.3680.5860.2100.425
标准天真(非强制)0.1750.3130.1150.197
PDS(预先指定)0.3190.6340.3450.327
采购订单(预先指定)0.3170.6150.3450.309
PDS(CV)0.0730.0720.0600.070
PMLE-DR公司0.0560.0530.0700.059
巴西存托凭证0.0460.0590.0810.050
结果模型不正确
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(强制)0.3680.5860.2100.425
标准天真(非强迫)0.1750.3130.1150.197
PDS(预先指定)0.3190.6340.3450.327
采购订单(预先指定)0.3170.6150.3450.309
偏微分方程0.0730.0720.0600.070
PMLE-DR公司0.0560.0530.0700.059
巴西存托凭证0.0460.0590.0810.050
表2

基于1000次重复,5%显著性水平的I类错误:论坛

正确的型号
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(强制)0.4480.3870.1900.522
标准天真(非强制)0.1780.1640.1000.193
PDS(预先指定)0.1430.0640.1030.131
采购订单(预先指定)0.1150.0640.0850.108
PDS(CV)0.0660.0550.0590.075
PMLE-DR公司0.0570.0630.0630.047
巴西存托凭证0.0430.0490.0510.046
正确的型号
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(强制)0.4480.3870.1900.522
标准天真(非强制)0.1780.1640.1000.193
PDS(预先指定)0.1430.0640.1030.131
采购订单(预先指定)0.1150.0640.0850.108
PDS(CV)0.0660.0550.0590.075
PMLE-DR公司0.0570.0630.0630.047
巴西存托凭证0.0430.0490.0510.046
结果模型不正确
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(被迫)0.3120.2770.1440.363
标准天真(非强制)0.1390.1130.0700.140
PDS(预先指定)0.0940.0570.0790.091
采购订单(预先指定)0.0770.0500.0600.077
PDS(CV)0.0710.0610.0570.073
PMLE-DR公司0.0630.0570.0600.056
巴西存托凭证0.0300.0510.0440.041
结果模型不正确
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(强制)0.3120.2770.1440.363
标准天真(非强制)0.1390.1130.0700.140
PDS(预先指定)0.0940.0570.0790.091
采购订单(预先指定)0.0770.0500.0600.077
偏微分方程0.0710.0610.0570.073
PMLE-DR公司0.0630.0570.0600.056
巴西存托凭证0.0300.0510.0440.041
表2

基于1000次重复,5%显著性水平的I类错误:论坛

正确的型号
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(强制)0.4480.3870.1900.522
标准天真(非强制)0.1780.1640.1000.193
PDS(预先指定)0.1430.0640.1030.131
采购订单(预先指定)0.1150.0640.0850.108
PDS(CV)0.0660.0550.0590.075
PMLE-DR公司0.0570.0630.0630.047
巴西存托凭证0.0430.0490.0510.046
正确的型号
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(强制)0.4480.3870.1900.522
标准天真(非强制)0.1780.1640.1000.193
PDS(预先指定)0.1430.0640.1030.131
采购订单(预先指定)0.1150.0640.0850.108
PDS(CV)0.0660.0550.0590.075
PMLE-DR公司0.0570.0630.0630.047
巴西存托凭证0.0430.0490.0510.046
结果模型不正确
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(被迫)0.3120.2770.1440.363
标准天真(非强制)0.1390.1130.0700.140
PDS(预先指定)0.0940.0570.0790.091
采购订单(预先指定)0.0770.0500.0600.077
PDS(CV)0.0710.0610.0570.073
PMLE-DR公司0.0630.0570.0600.056
巴西存托凭证0.0300.0510.0440.041
结果模型不正确
方法论坛论坛论坛论坛
论坛论坛论坛论坛
标准天真(强制)0.3120.2770.1440.363
标准天真(非强制)0.1390.1130.0700.140
PDS(预先指定)0.0940.0570.0790.091
采购订单(预先指定)0.0770.0500.0600.077
PDS(CV)0.0710.0610.0570.073
PMLE-DR公司0.0630.0570.0600.056
巴西存托凭证0.0300.0510.0440.041

7数据分析

危重病人的血糖控制仍然是有争议的话题,就血糖水平保持最佳的最佳限度而言。在Leuven II随机试验中(范登贝尔赫., 2001)严格的血糖控制(将血糖维持在80至110毫克每分升(mg/dL)之间)可降低死亡率。后来的多中心研究无法复制这些发现,包括NICE-SUGAR试验(芬菲尔., 2009). 目前的指南通常建议将血糖控制在140到180 mg/dL之间。根特大学ICU(UZ Ghent ICU)采用血糖方案,目标值为80至150 mg/dL。在实践中,患者的血糖经常超出这一范围,部分原因是缺乏遵循方案的依从性。我们利用UZ Ghent ICU对一组具有代表性的重症监护患者的常规收集数据,研究血糖控制与30天死亡率之间的关系。具体而言,我们的目的是检验在ICU入住后30天内死亡随访的任何一天血糖水平(从<110到≥110 mg/dL,然后从⩽150到>150 mg/dL)变化无影响的无效假设。我们将分析范围限定为在ICU中存活至少48小时的患者,从而排除了到达ICU后立即死亡的患者。

数据来自UZ Ghent ICU的电子患者数据管理系统。潜在的混杂因素被分为入院时评估的变量和随时间收集数据的变量。对于重复测量的协变量,对于连续协变量,我们取在ICU考虑的随访日前48小时内测量的平均值,对于分类协变量,取最大值。血糖测量通常每天记录多次;所以为了创造曝光,我们在一天的前6个小时内取了测量值的平均值。在这个例子中,所有缺少暴露、结果或混杂因素数据的患者都被从数据集中删除。为了进行我们的测试,我们每天假设(在仍活着的个体中)血糖水平≥110 mg/dL(或>150 mg/dL)的概率为逻辑回归模型,以及入院后30天内死亡的逻辑模型。为了避免与时变混淆相关的问题,例如罗宾斯(1997)在每个回归模型中,我们仅对某一天血糖测量之前收集的协变量数据以及之前的暴露进行了调整。然后,我们使用了一个修订版的测试,用于第5.1.2节(使用Web附录C中描述的算法1实现),允许暴露或结果模型中的潜在错误指定。鉴于数据由每个人的多个观察结果组成t吨表示特定的一天,我们替换了论坛具有论坛在统计中论坛(用于论坛). 在我们的建模中,我们包括了临床专家选择的所有混杂因素,以及连续变量的二次项和主要效应之间的所有双向交互作用。

我们获得了12105名患者进入ICU的数据;仅限于第3天仍存活的患者后,仍有10885人存活。进一步删除2013年之前进入的患者,剩下4682人,删除缺失数据后的最终数据集为4120人。考虑到患者接受了多天的评估,数据集中有24 863个观察结果;贡献观测值的中位数为3(最小值为1,最大值为28)。在最后一个队列中,768人(18.6%)在进入ICU后30天内死于医院。考虑到第3天前6小时内患者的平均血糖值,所有患者的平均值为131.6(最小值:45,最大值:492)。请注意,927(23.3%)名患者在第3天的平均血糖水平<110 mg/dL,2208(55.5%)名患者的血糖水平≥110 mg/dL~150 mg/dL和841(21.2%)名患者血糖水平>150 mg/dL。在产生相互作用后,分析中有148个协变量需要调整。观察每天从<110到≥110 mg/dL的变化,测试统计论坛为−1.42,带有P(P)-值为.156,而从⩽150变化到>150 mg/dL,得到的测试统计数据为6.98(论坛.001)。因此,在5%的水平上,我们看到了30天死亡率差异的证据,这是基于给定一天血糖水平从中度(150 mg/dL)到高(>150 mg/dL.)的变化。另一方面,在比较低血糖水平(<110 mg/dL)和高血糖水平(≥110 mg/dL)的患者时,我们没有观察到5%水平的统计学差异。

8讨论

我们提出了一个在高维环境中构造GLM参数一致有效测试的通用框架。我们希望能够澄清为什么局部双稳健方法(在本例中,在null下是双稳健方法)在文献中具有特权地位(Farrell,2015年); 如果所有的工作模型都是正确的,那么可以通过插入任何收敛速度足够快的冗余参数稀疏估计器来获得一致有效的检验。如果其中一个工作模型指定错误,那么只要对干扰参数使用特定的估计程序,仍然可以获得一致有效的推断。我们还指出了为什么分数测试在高维环境中可能更可取,因为结果模型可以在零假设下进行拟合,从而削弱稀疏性条件。

在未来的工作中,我们将把我们的程序扩展到回归参数的估计和置信区间的构造。考虑模型论坛由限制定义

哪里论坛是已知的链接函数。比分论坛表示ψ的估计量,即A类Y(Y).让论坛什么时候()是身份链接论坛什么时候()是日志链接;那么ψ的估计可以基于函数

(10)

(罗宾斯., 1992). ψ的估计基于(10)在模型下一致论坛.构建一致有效置信区间的目标可能需要修改第节中给出的条件4.25.2,因为我们不再在null下工作。对于哪些设置可以构造双稳健估计量,这仍然是一个悬而未决的问题。例如,目前不存在Cox比例风险模型或概率模型的双重稳健估计。在实践中,构造局部双稳健的估计量和置信区间可能更为可行,例如,在零条件下,并且在这种情况下具有本文所述测试的特性。

当ψ为多元时,方程(5)和(6)提供比未知干扰参数更多的估算方程。为了确保标准误差有效,还需要确保ψ的每个分量的估计函数与其余分量的估计功能正交。这样的发展不仅有利于测试和估计交互作用项,而且有利于在含有介质和/或时间依赖性混杂因素的高维数据中获得一致有效的推断。事实上,上述估值器是g-估计量(罗宾斯., 1992),为配合而开发结构嵌套模型在复杂的纵向研究中。由于事实证明,为结果正确指定序列回归模型基本上是不可能的,因此现有的高维推断建议不太可能用于测试任何治疗都没有因果效应的假设政体Y(Y)也就是说g-null假设(罗宾斯,1997). 相反,尽管我们对结果和风险模型进行了选择(为了将相关梯度设置为零)第5节为了获得g-null的有效测试,只需要正确指定后者。

致谢

奥利弗·杜克斯(Oliver Dukes)获得了法兰德斯研究基金会(FWO)战略基础研究博士学位1S05916N的资助。Vahe Avagyan和Stijn Vansteelandt得到了FWO研究项目G016116N和特别研究基金(BOF)研究项目BOF.244.2017.0004.01的支持。作者感谢Johan Decruyenaere教授和Kirsten Colpaert教授允许使用根特大学重症监护室数据集,并感谢Bram Gadeyne和Martijn Busselen协助管理数据。

工具书类

阿瓦吉安
,
五、。
Vansteelandt公司
,
美国。
(
2017
)
基于惩罚偏差减少双稳健估计的模型错误指定下平均治疗效果的诚实数据自适应推断
预打印,
2017
,
arXiv公司:1708.03787
.

贝略尼
,
答:。
,
切尔诺茹科夫
,
五、。
汉森
,
C、。
(
2014
)
在高维对照中进行选择后对治疗效果的推断
.
经济研究综述
,
81
(
2
),
608
650
.

贝略尼
,
答:。
,
切尔诺茹科夫
,
五、。
世界环境学会
,
年。
(
2016
)
多控制广义线性模型的选择后推理
.
商业与经济统计杂志
,
34
(
4
),
606
619
.

切尔诺茹科夫
,
五、。
,
切特韦里科夫
,
D。
,
德米雷尔
,
M。
,
迪弗洛
,
E.公司。
,
汉森
,
C、。
,
纽伊
,
西。
罗宾斯
,
J。
(
2018
)
治疗和结构参数的双/脱苦机器学习
.
计量经济学杂志
,
21
(
1
),
C1类
第68页
.

切尔诺茹科夫
,
五、。
,
汉森
,
C、。
纺纱机
,
M。
(
2016
)
hdm:高维度量
.
R杂志
,
8
(
2
),
185
199
.

切特韦里科夫
,
D。
,
,
Z.公司。
切尔诺茹科夫
,
五、。
(
2016
)
关于交叉验证的拉索
.预打印,
2016
,
arXiv:1605.02214
.

公爵
,
O。
Vansteelandt公司
,
美国。
(
2019
)
如何在倾向得分变量选择后获得有效测试和置信区间?
医学研究中的统计学方法
.https://doi.org/10.1177/0962280219862005

法雷尔
,
英里/小时。
(
2015
)
使用可能比观察值更多的协变量对平均治疗效果进行稳健推断
.
计量经济学杂志
,
189
(
1
),
1
23
.

芬菲尔
,
美国。
,
奇托克
,
D.R.公司。
,
,
S.Y.-S.公司。
,
布莱尔
,
D。
培养
,
D。
(
2009
)
重症患者强化与常规血糖控制
.
新英格兰医学杂志
,
360
(
13
),
1283
1297
.

范德格尔
,
美国。
,
布尔曼
,
第页。
,
里托夫
,
年。
Dezeure公司
,
R。
(
2014
)
高维模型的渐近最优置信域及其检验
.
统计年鉴
,
42
(
),
1166
1202
.

范德拉恩
,
医学博士。
玫瑰色
,
美国。
(
2011
)
有针对性的学习
.
纽约州纽约市
:
施普林格
.

里布
,
H。
普契尔
,
B.M.公司。
(
2005
)
模型选择与推理:事实与虚构
.
计量经济学理论
,
21
(
1
),
21
59
.

,
年。
线路接口单元
,
H。
(
2017
)
稀疏高维模型的假设检验和置信域的一般理论
.
统计年鉴
,
45
(
1
),
158
195
.

罗宾斯
,
J.M.公司。
(
1997
)复杂纵向数据的因果推断。在:
贝尔坎
,
M。
(编辑),
潜在变量建模及其在因果关系中的应用
.
纽约州纽约市
:
施普林格
,第页。
69
117
.

罗宾斯
,
J.M.公司。
,
作记号
,
S.D.公司。
纽伊
,
W.K.公司。
(
1992
)
通过在混杂因素上模拟暴露条件的期望来估计暴露影响
.
生物计量学
,
48
(
2
),
479
495
.

罗宾逊
,
下午
(
1988
)
根N一致半参数回归
.
计量经济学
,
56
(
4
),
931
954
.

沙阿
,
钢筋混凝土。
彼得斯
,
J。
(
2019
)
条件独立性检验的困难与广义协方差测度
.
统计年鉴
.
预印本,2018,arXiv:1804.07203
.

棕褐色
,
Z.公司。
(
2019
)
利用高维数据正则化校正估计进行治疗效果的模型辅助推断
.
统计年刊
 
预印本,2018,arXiv:1801.09817
.

提比什拉尼
,
R。
(
1996
)
通过Lasso回归收缩和选择
.
英国皇家统计学会期刊。B系列(方法学)
,
58
(
1
),
267
288
.

范登贝尔赫
,
G.公司。
,
武泰
,
第页。
,
周末
,
F、。
,
Verwaest公司
,
C、。
,
Bruyninckx公司
,
F、。
,
Schetz公司
,
M。
,
弗拉塞拉尔斯
,
D。
,
费迪南德
,
第页。
,
劳尔斯
,
第页。
布伊隆
,
R。
(
2001
)
危重病人的强化胰岛素治疗
.
新英格兰医学杂志
,
345
(
19
),
1359
1367
.

弗默伦
,
英国。
Vansteelandt公司
,
美国。
(
2015
)
偏减双稳健估计
.
美国统计协会杂志
,
110
(
511
),
1024
1036
.

,
中心-中心。
,
S.S.公司。
(
2014
)
高维线性模型中低维参数的置信区间
.
英国皇家统计学会杂志:B辑(统计方法)
,
76
(
1
),
217
242
.

,
西。
范德兰
,
医学博士。
(
2011
)基于交叉验证的目标最小损失估计。
有针对性的学习
.
纽约州纽约市
:
施普林格
,第页。
459
474
.

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)

补充数据