马克·范德拉恩研究小组

计算生物学与因果关系

带有潜在变量的未测量混杂因果推断

这篇文章是我们问答系列的一部分。在加州大学伯克利分校2021年春季开设的新课程“实践中的目标学习”中,研究生提出了一个问题:问题:你好,马克,由于存在未测量的技术和生物变异来源,高通量测序数据的统计分析往往很困难。潜在未测量技术因素的示例包括准备单个样本进行测序的时间和日期,以及实验室人员进行实验的时间和时间。

暴露混合物的因果调解分析

这篇文章是我们问答系列的一部分。在加州大学伯克利分校2021年春季开设的新课程“实践中的定向学习”中,研究生提出了一个问题:问题:你好,马克,在关于tmle3shift和tmle3mediate的讲座之后,我们想知道是否可以使用不同的中介分析程序。考虑一个$O=(W,a,Z,Y)$的数据生成系统,其中$W$表示三个二进制协变量,$a$表示感兴趣的二进制暴露,$Z$是三个二进制中介,$Y$是一个连续结果。

数据自适应学习特定于阶层的因果效应

这篇文章是我们问答系列的一部分。在加州大学伯克利分校2021年春季开设的新课程“实践中的目标学习”中,研究生提出了一个问题:问题:你好,马克,我有一个关于将CV-TMLE应用于当前研究项目的问题。我有一个来自孟加拉国的横截面数据集,其中感兴趣的结果是产前护理的使用(二进制),感兴趣的暴露是赋予妇女权力(连续),基线协变量包括母亲的年龄、孩子的年龄、母亲和父亲的教育程度、家庭成员的数量、15岁以下的孩子的数量、,家庭财富和母亲抑郁症。

调整高度自适应lasso估计器

这篇文章是我们问答系列的一部分。在加州大学伯克利分校2021年春季开设的新课程“实践中的目标学习”中,研究生提出了一个问题:问题:你好,马克,在您2018年与Sherri Rose合著的《数据科学中的目标学习》一书的第6章中,您讨论了当协变量数量增加时,减少纳入高度自适应套索(HAL)估计器的基函数数量的实际必要性。

应用目标学习提高全球卫生公平性

这篇文章是我们问答系列的一部分。在加州大学伯克利分校2021年春季开设的新课程“实践中的目标学习”中,研究生提出了一个问题:问题:你好,马克,全球公共卫生领域的一个紧迫问题是数据和结果在作者和代表性方面的公平所有权。在某些方面,有针对性的学习提高了我们从全球健康数据中有效得出因果推断的能力,从而提高了公平性。

条件密度估计的机器学习

这篇文章是我们问答系列的一部分。在加州大学伯克利分校2021年春季开设的新课程“实践中的目标学习”中,研究生提出了一个问题:问题:你好,马克,总的来说,我对处理涉及基于机器学习的密度估计而非标量估计(即回归)的问题感到好奇,尤其是对于连续变量。作为一个基础示例,对于TMLE框架中的连续治疗,需要估计$P(a\mid W)$,其中$a$是一个连续随机变量。

治疗特异性多变量生存曲线的TMLE

这篇文章是我们问答系列的一部分。在加州大学伯克利分校2021年春季开设的新课程“实践中的目标学习”中,研究生提出了一个问题:问题:你好,马克,我有一个生存分析问题。我使用的数据集是左截和右截的。我对评估时间-事件变量的治疗特异性多变量生存函数感兴趣。例如,在一项研究中,受试者被随机分为两个不同的治疗组,基线协变量为$W$,但我们只观察左、右两个窗口的结果——死亡时间。

TMLE渐近有效的条件

这篇文章是我们问答系列的一部分。在加州大学伯克利分校2021年春季开设的新课程“实践中的目标学习”中,研究生提出了一个问题:问题:你好,马克,我有一个关于TMLE渐近效率要求的问题。TMLE的渐近效率依赖于二阶余量可以忽略不计。这纯粹是一个有限样本问题吗,还是有潜在的参数值得关注,而构造却不是这样?

具有左旋和左旋的因果推理

这篇文章是我们问答系列的一部分。在加州大学伯克利分校2021年春季开设的新课程“实践中的定向学习”中,研究生提出了一个问题:问题:你好,马克,作为流行病学家,我们希望研究随时间变化的暴露与疾病进展之间的关系。研究设计的自然选择是纵向队列研究。在前瞻性队列中,参与者不是从现有数据中选择的,而是在某个登记期内登记的。

实践中的随机处理制度

这篇文章是我们问答系列的一部分。在加州大学伯克利分校2021年春季开设的新课程“实践中的定向学习”中,研究生提出了一个问题:问题:你好,马克,我们讨论了随机治疗方案的实际实施,并提出了以下问题,希望听听您的想法。问题1(实际积极性):在随机治疗方案的框架内,是否有一个确定截断阈值的推荐程序?