模型
定义
除非另有规定,希腊字母表示模型估计的参数,罗马字母表示用户预先设置的固定超参数和其他常量。
- “研究”:一项临床试验。可能是从过去借用的临床试验,也可能是正在分析的当前临床试验。
- “组”:研究组,如治疗组或安慰剂组。
- “Rep”:重复测量/纵向建模背景下的重复测量。可以是一个时间点,例如考察访问。
- \(k\):研究指数。
- \(K\):当前研究的索引。
- \(y_k\):连续结果变量的患者-代表临床反应向量\(k\).
- \((X){k}\):矩阵行\(X)与研究相对应\(k\).
- \(\字母\):控制组平均参数的矢量,一个用于混合模型的每个代表,一个针对分层和独立模型中的每个研究和代表。第一个要素用于历史研究,最后一个要素用于当前研究。
- \(\增量\):研究特异性治疗平均参数向量。研究、非对照治疗组和代表的每一个组合都有一个约束条件。可以添加一个可选约束条件,以汇集每个研究中基线时的所有手臂,从而减少\(\增量\).
- \(d\):元素的整数索引\(\增量\).
- \(b):的元素的整数索引\(测试版).
- \(t\):代表指数(例如重复测量的时间点,如临床试验中的患者就诊。)
- \(测试版):研究特定基线协变量参数向量。
- \(X_\alpha\):控制组平均参数的模型矩阵\(\字母\)。它有用于选择适当元素的指示符列\(\字母\)对于的每个元素\(y_k\).
- \(X_\增量\):治疗平均参数的模型矩阵\(\增量\)。它有用于选择适当元素的指示符列\(\增量\)对于的每个元素\(y_k\).
- \(X_\β\):基线协变量固定效应参数的模型矩阵\(β)。它有用于选择适当元素的指示符列\(测试版)对于的每个元素\(y_k\).
- \(\sigma_k\):用于研究的代表性残留标准偏差向量\(k\).
- \(\Lambda_k\):用于研究的by-rep残差相关矩阵的低三角Cholesky因子\(k\).
- \(N_k\):研究中的患者数量\(k\).
- \(\Sigma_k\):研究的by-rep残差协方差矩阵\(k\).
- \(T\):每个受试者重复测量的次数。
- \(I_T\):单位矩阵,行和列等于每个主题的重复测量次数。
- \(I(\cdot)\):指示器功能
- \(AR(1)(n,\rho)):AR(1)相关矩阵\(n\)行和相关参数\(\rho\).
- \(m_k\)指示研究剩余协方差类型的指数\(k\):1表示非结构化/完全参数化,2表示AR(1),3表示对角线。
基线协变量
基线协变量模型矩阵\(X_\测试版\)调整基线协变量。它可以包含用于基线的连续列和用于用户定义协变量级别的二进制指示符列。如果可能的话,所有这些列都包括在内,但该方法会自动删除基线协变量列,以确保组合模型矩阵\(X_k^*=\left[{X_\alpha}^*\quad{X_\ delta}^*\ quad{X_\beta}^**\right]_k\)是全等级,其中\(X_k^*\)表示矩阵行\(X)与研究相对应\(k\),如果相应的元素\(年\)缺少。要从中删除的列的选择\({X_\beta}_k^*\)由QR分解的秩和枢轴策略决定\(X_k\)使用带枢轴的Householder算法(基数::qr()
,LINPACK例程DQRDC)。
在每个研究中\(X_\测试版\)居中表示平均值为0,如果可能,缩放表示方差为1。缩放可确保参数的优先级\(测试版)相对于输入数据保持相对分散。研究级定心确保\(\字母\)参数真正起作用无条件的研究特定的对照组平均值(与以参考水平的患者子集为条件相对\(X_\测试版\)),并确保跨部门借款\(\字母\)组件完全表现为控制组借用。
模型矩阵
每个主要模型都是参数化的,因此:
\[\开始{对齐}E(y)=\left(X_\alpha\right)_k\alpha+\left(X_\delta\right)_k\delta+\left(X_\beta\right)_k\beta\结束{对齐}\]
以上,\(\left(X_\alpha\right)_k\),\(\左(X_\增量\右)_k\)、和\(\left(X_\beta\right)_k\)是用于研究的固定矩阵\(k\).\(\左(X_\beta\右)_k\)是基线协变量的传统模型矩阵\(测试版),详见下文“基线协变量”一节。\(\左(X_\alpha\右)_k\)是由零和一组成的矩阵。它的构造是这样的:\(\字母\)是控制组在特定研究中在给定时间点的平均反应。同样,\(\左(X_\增量\右)_k\)是一个由零和一组成的矩阵,使得\(\增量\)是非对照治疗组在特定研究中在给定时间点的平均反应。
为了说明,让我们\(y{ijkt}\)有耐心\(i)治疗组\(j)(其中\(j=1)为对照组)\(k\)在时间点\(t\),并让\(\左(X_\beta\beta\右)_{ijkt}\)是向量的相应标量元素\(\左(X_\beta\右)\ beta\).然后,
\[\开始{对齐}E(y_{ijkt})=I(j=1)\alpha_{kt}+I(j>1)\delta_{jkt}+\左(X_\beta\beta\右)_{ij kt}\结束{对齐}\]
此外,如果参数化中的约束被激活(即hbl_mcmc_hierarchical(约束=真)
)然后在时间点将对照组和治疗组患者合并\(t=1)在每个研究中\(k\):
\[\开始{对齐}E(y_{ijk1})=\alpha_{k1}+\左(X_\beta\beta\右)_{ij k1}\结束{对齐}\]
此参数化用更紧凑的表达式表示\(\left(X_\alpha\right)_k\alpha+\left在本小品中的模型定义中。
后处理
这个hbl_summary()
函数对模型的结果进行后处理。它接受MCMC参数样本,并返回反应和治疗效果的估计边际均值。为了估计响应的边际平均值,hbl_summary()
取拟合值后验样本的组水平平均值,同时删除模型中的协变量调整项(即\(X_\α\α+X_\δ\δ)). 因为\(X_\测试版\)以他们的平均值为中心,这个选择在数学上等价于emmeans::emmeans()
使用权重=“比例”
(长度(2016)).
层次模型
功能:
hbl_sim_hierarchical()
hbl_mcmc_hierarchical()
层次模型分析所有研究的数据,并逐一缩小对照研究的范围\(\字母{kt}\)(每个研究和rep的唯一组合对应一个标量参数)朝向具有平均值的共同正态分布\(\mu_t\)和方差\(\tau_t^2)对于数据中的每个研究(当前和历史),协方差是用户定义的。选项包括:
- 在残差之间具有主题内相关性的模型之前,使用LKJ分离策略进行完全参数化(“非结构化”)。
- AR(1)方差\(\西格玛_k\)和相关性\(\rho_k\).
- 带方差的对角线\(\西格玛_k\).
\[\开始{对齐}&y_k\sim\text{MVN}((X_\alpha)_k\cdot\alpha+\\&\qquad\alpha_{kt}\stackrel{\text{ind}}{\sim}\text{Normal}(\mu_t,\tau_t^2)\\&\qquad\qquad\\mu_t\stackrel{\text{ind}}{\sim}\text{Normal}(0,s_\mu^2)\\&\tquad\qquad\tau_t\stackrel{\text{ind}}{\sim}f\tau\\&\qquad\delta_{dt}\stackrel{\text{ind}}{\sim}\text{Normal}(0,s_delta^2)\\&\qquad\beta_{b}\stackrel{\text{ind}}{\sim}\text{Normal}(0,s_\beta^2)\\&\qquad\Sigma_k=\left(I_T\Sigma_k\right)\Lambda_k\Lambda _k'\left\\&\squad\qquad\sigma_{k1},\ldots,\sigma_{kT}\stackrel{text{ind}}{\sim}\text{Uniform}(0,s_sigma)\\&\qquad\qquad\\Lambda_k\Lambda _k'\sim\begin{cases}\text{LKJ}(\text{shape}=s_\lambda,\\text{order}=T)&m_k=1\\\文本{AR(1)}(T,\rho_k)&m_k=2\\I_T和m_k=3\\\结束{cases}\\&\qquad\qquad\\rho_k\stackrel{\text{ind}}{\sim}\text{Uniform}(-1,1)\qquad(\text{仅用于}m_k=2)\结束{对齐}\]
之前的\(f _τ\)在\(\套\)至关重要,因为:
- 它控制先前的借款金额,以及
- 如果数据中很少有历史研究,则优先权具有很大的影响。
\(f _τ\)可以是一个灵活的半学生t分布\(d\tau)自由度和比例参数\(s_tau):
\[f_tau=\text{学生-t}(0,s_tau,d\tau)^+\]或下界为0上界的均匀分布\(s_\tau\):
\[f_tau=\text{均匀}(0,s_tau)\]
根据的建议盖尔曼(2006),如果历史研究的数量较少,请使用半Student-t,对于大量的历史研究,请考虑统一。
对于半学生t分布\(s_tau)参数等效于\(\西格玛\)参数Stan用户手册中的Student-t参数化.
独立模型
功能:
hbl_sim_independent()
hbl_mcmc_依赖项()
独立模型与分层模型相同,但具有独立的控制组参数\(\字母\)我们将其作为无借款基准来量化层次模型的借款强度。
\[\开始{对齐}&y_k\sim\text{MVN}((X_\alpha)_k\cdot\alpha+\\&\qquad\alpha_{kt}\stackrel{text{ind}}{\sim}\text{Normal}(0,s_alpha^2)\\&\qquad\delta_{dt}\stackrel{\text{ind}}{\sim}\text{Normal}(0,s_delta^2)\\&\qquad\beta_{b}\stackrel{\text{ind}}{\sim}\text{Normal}(0,s_\beta^2)\\&\qquad\Sigma_k=\left(I_T\Sigma_k\right)\Lambda_k\Lambda _k'\left\\&\squad\qquad\sigma_{k1},\ldots,\sigma_{kT}\stackrel{text{ind}}{\sim}\text{Uniform}(0,s_sigma)\\&\qquad\qquad\\Lambda_k\Lambda _k'\sim\begin{cases}\text{LKJ}(\text{shape}=s_\lambda,\\text{order}=T)&m_k=1\\\文本{AR(1)}(T,\rho_k)&m_k=2\\I_T和m_k=3\\\结束{cases}\\&\qquad\qquad\\rho_k\stackrel{\text{ind}}{\sim}\text{Uniform}(-1,1)\qquad(\text{仅用于}m_k=2)\结束{对齐}\]
联营模型
功能:
hbl_sim_pool()
hbl_mcmc_pool()
混合模型与独立模型相同,但具有代表性的控制手段,在研究中进行混合。换句话说\(\字母{kt}\)失去\(k\)下标,我们使用一个较小的矩阵\(\左(X_\alpha^{\text{pool}}\右)_k\)而不是\((X_\alpha)_k\).\(\左(X_\alpha^{\text{pool}}\右)_k\)具有较少的列(特定于代表,而不是特定于代表的研究)。与独立模型一样,我们将其用作无借款基准,以量化层次模型的借款强度。
\[\开始{对齐}&y_k\sim\text{MVN}((X_\alpha^{\text{pool}})_k\cdot\alpha+(X_\ delta)_k\ cdot\delta+(X_ \beta)_k \cdot\ beta,\I_{N_k}\otimes\Sigma_k)\\&\qquad\alpha_{t}\stackrel{\text{ind}}{\sim}\text{Normal}(0,s_\alpha^2)\\&\qquad\delta_{dt}\stackrel{\text{ind}}{\sim}\text{Normal}(0,s_delta^2)\\&\qquad\beta_{b}\stackrel{\text{ind}}{\sim}\text{Normal}(0,s_\beta^2)\\&\qquad\Sigma_k=\left(I_T\Sigma_k\right)\Lambda_k\Lambda _k'\left\\&\squad\qquad\sigma_{k1},\ldots,\sigma_{kT}\stackrel{text{ind}}{\sim}\text{Uniform}(0,s_sigma)\\&\qquad\qquad\\Lambda_k\Lambda _k'\sim\begin{cases}\text{LKJ}(\text{shape}=s_\lambda,\\text{order}=T)&m_k=1\\\文本{AR(1)}(T,\rho_k)&m_k=2\\I_T和m_k=3\\\结束{cases}\\&\qquad\qquad\\rho_k\stackrel{\text{ind}}{\sim}\text{Uniform}(-1,1)\qquad(\text{仅用于}m_k=2)\结束{对齐}\]
借用指标
该软件包支持以下量化借款的指标。中的各种功能历史性借款
为每个离散时间点(“rep”)独立计算以下每个度量。
有效样本量(ESS)
请参阅hbl_ess()
实现的函数。
Neuenschwander等人(2006年)为荟萃分析预测(MAP)先验值设定一个有效的样本量指标。在最初的论文中,底层的层次模型仅使用历史控制,而假设的新研究是当前的兴趣研究。在历史借用
,我们将该指标应用于一个层次模型,该模型还包括来自当前研究的控制和治疗数据。我们仍在定义\(否)以下是(未缺失的)历史对照患者的数量,因此我们仍然可以按照与本文相同的量表来解释ESS。
对于池模型,定义\(V_0\)作为对照平均值的后验预测方差\(\字母^*\)一项假设的新的未观察到的研究。根据Neuenschwander等人(2006年),它可以作为研究特定方差的平均值导出。实际上,我们估计\(V_0\)使用MCMC样本的平均值\(\frac{1}{\sum\sigma_i^{-2}}\).
\[V_0:=\text{Var}(\alpha^*|y,\tau=0)=\frac{1}{\sum\sigma_i^{-2}}\]
对于层次模型,我们定义了类似的后验预测方差\(V_\tau)使用先验分布
\[V_\tau:=\text{Var}(\alpha^*|y)=\int E[(\alha^*-E(\alpha^*| y))^2|y]\cdot p(\alfa^*|\mu,\tau)\cdot p(\mu、\tau|y)d\mu d\tau\]
上述积分意味着一种简单的估算方法\(V_\tau)使用MCMC样品:
- 对于每个MCMC样品\(m=1,\ldots,m\)从层次模型中识别样本\(\mu^{(m)}\)和\(\套^{(m)}\)属于\(\mu\)和\(\套\)分别是。
- 绘制\((\字母^*)^{m}\)从法线(\(\mu^{(m)}\),\((\套^{(m)})^2\))分配。
- 估算\(V_\tau)作为集合的方差\((alpha^*)^{1},(alpha ^*)|^{2},\ldots,(\alpha^*^{M}\)来自(2)。
接下来,定义\(否)作为仅来自历史研究的非缺失对照患者的数量。鉴于\(否),\(V_0\)、和\(V_\tau),将有效样本量定义为:
\[\文本{ESS}:=N\frac{V_0}{V_\tau}\]
\(压裂{V_0}{V_\tau}\)是一个权重,用于量化分层模型借入的历史信息的比例。值得注意的是,如果层次模型和集合模型表现出相同的借贷强度,则权重应为1。乘以\(否)数量成为分层模型借用强度的启发式指标,以历史患者数量衡量。
精度比(仅限层次模型)
精度比是一种实验性的特殊指标,应谨慎使用。它在hbl_summary()
用于层次模型的函数。
精度比比较控制平均响应(\(\字母\)分量、分子)到完全条件分布的类似精度(分母)。前者是\(压裂{1}{\tau^2}\),后者是\(压裂{1}{\tau^2}+压裂{n}{\sigma^2}\).给,\(n\)是当前研究中未缺失患者的数量,\(西格玛^2)是剩余方差,以及\(\套^2 \)是研究特定控制方法的方差(组分\(\字母\)). 全精度比为:
\[\开始{对齐}\压裂{\frac{1}{\tau^2}}{\frac{1}}{\tau^2}+\压裂{n}{\sigma^2}{\结束{对齐}\]
精度比来自以下条件分布\(\alpha_k\)在层次模型中给出了其他参数和数据。更准确地说,在这种条件分布中,平均值是先验平均值和数据平均值之间的加权平均值,精度比是先验均值的权重。这可以在具有正态数据模型、均值的正态先验和已知常数方差的贝叶斯模型的更简单的情况下看到。有关详细信息,请参阅的第2章Gelman等人(2020年).
差异换档比
方差偏移率是一种实验性的特殊度量,应谨慎使用。它在遗留系统中实现hbl_度量()
功能。
让\(V_m\)是估计的后验方差\(\字母_I\)(当前研究对照组反应平均值)通过模型估算\(米\).方差移位率为:
\[\开始{对齐}\裂缝{V{m*}-V{text{independent}}{V{text{pool}}-V{ext{indepndent}}}\结束{对齐}\]
哪里\(m*\)是一种历史借用模型,类似于混合模型或层次模型。
平均换档率(传统)
不建议使用平均移位比率来衡量借贷强度。相反,它是对当前数据源和历史数据源之间缺乏可比性的非正式临时度量。它在遗留系统中实现hbl_metrics()
功能。
要定义平均换档比,让\(\theta_m\)是模型估计的后验平均对照组反应\(米\).平均换档比为:
\[\开始{对齐}\压裂{theta{m*}-\theta{text{independent}}}{theta_{text{pool}}-\ttheta{text}independent}}}\结束{对齐}\]
哪里\(m*\)是一种历史借用模型,类似于混合模型或层次模型。