总结

我们考虑基于简单序数模型的概率效应度量来比较两组的分布,并对解释变量进行了调整。“序数优势”度量总结了一个分布的观察值低于另一个分布独立观察值的概率,并根据模型中的解释变量进行了调整。该度量直接适用于正态线性模型和有序响应变量的正态潜在变量模型。它等于论坛对于将probit链接函数应用于累积多项式概率的相应序数模型,对于标准正态cdf论坛和效果论坛这是组指标变量的系数。对于序数响应的更一般的潜在变量模型,该模型对应于具有其他可能误差分布的线性模型以及累积多项式概率的相应链接函数,序数优势度量等于论坛使用log–log链接,大约等于论坛使用logit链接,其中论坛是群体效应。另一个顺序优势度量泛化了二进制响应与顺序响应之间的比例差异。我们还直接为观察到的响应的序数模型提供了相关度量,这些序数模型不需要假定相应的潜在响应模型。我们给出了度量的置信区间,并用示例进行了说明。

1.简介

本文考虑了简单的顺序效应总结,用于基于模型的两组对顺序分类反应变量的比较,同时调整其他解释变量。与使用非线性度量(如概率和比值比)的标准摘要不同,这些非线性度量可能难以由从业者解释,建议的度量仅基于概率及其差异。

总结性测量概括了两种“顺序优势”测量,它们在没有补充解释变量的情况下对两组进行比较。论坛论坛表示由A和B表示的组中的独立随机变量,用于定量或有序分类量表。措施

(1)

总结了它们的相对大小。对于结果为(0,1)的二进制响应,这简化为比例差异,论坛.如果论坛论坛分布相同,那么论坛。对于离散响应变量,如有序分类响应,空值等于0.50而非0的相关度量为

(2)

(Klotz,1966年). 调整领带的校正系数以生成0.50的空值。这些措施在功能上是相关的,

具有论坛论坛范围[0,1]和[论坛]分别是。当这些组是随机排序的,例如当它们在某种程度上因位置变化而存在差异时,它们最有意义。有关有序分类反应量表的详细信息,请参阅阿格雷斯蒂(2010年,第2章)。这些指标直接与Mann-Whitney统计中使用的信息相关。例如,第25卷第4期医学统计学2006年,该杂志专门讨论了这一统计数据及其使用和扩展,其中有几篇文章使用了这种方法。

本文中讨论的顺序效应度量在对顺序响应变量建模的背景下使用这些概率,同时调整解释变量。第2节由于线性模型是顺序反应数据的潜在变量模型,因此引入了包含群体指标项的正常线性模型的度量。第3节介绍了序数响应变量标准模型的相关度量,该模型将链接函数(如probit或logit)应用于累积概率,利用其与各种误差分布的潜在变量模型的联系。第4节给出了一个示例,还展示了如何使用R软件轻松构建度量的置信区间。第5节根据观察到的反应,而不是潜在的反应,提出了累积链接模型的相关顺序效应测度。第6节讨论了这些措施的适用性,并建议对其他模型进行扩展。

2.正态线性模型的顺序优势度量

我们首先考虑除了二进制组指示符变量之外还有解释变量的正常线性模型。解释变量值论坛,让论坛表示A组观察的响应变量,并让论坛表示B组中观察的独立响应。使用基于模型的条件分布对于两组论坛,让

除了组指示符之外,没有其他解释变量,这简化为(1).顺序优势度量的模拟(2)

这仅仅是论坛当响应连续时。当群体变量和解释变量之间没有实质性交互作用时,这些度量是有用的总结。

z(z)是观察的分组指示符,其中论坛对于A组和论坛对于B组,这些序数测度对于普通正态线性模型具有简单形式

具有论坛论坛对于此模型论坛论坛论坛论坛、和

此公式适用于任何值论坛解释变量。同样,论坛.两组取数值的正常条件标准化平均值之间的差异论坛等于论坛,对应于论坛等于论坛分别是。当分组指标与解释变量之间发生相互作用时,或当方差允许为非恒定时,则适用类似度量,但度量值取决于该解释变量的值。标准化差异论坛长期以来,文献中一直使用这一方法来比较两组人(例如。,莱曼,1975年第71页)。相应的顺序优势度量也用于一般回归环境中(例如。,Brumback等人,2006年,Thas等人,2012年).

实际上,使用最小二乘估计论坛线性模型中的剩余标准差,我们可以通过论坛论坛.置信区间论坛标准化差异论坛在正常线性模型中,会产生相应的置信区间论坛对于论坛,然后也会产生一个论坛对于模型矩阵论坛对于线性模型,让v(v)表示的行和列中的元素论坛对应于效果参数论坛用于比较两组。用于测试论坛:论坛使用通常的t吨统计的,论坛,考虑非中心参数

论坛表示的标准置信区间论坛用于此测试(莱曼,1986年第352页)。然后,因为论坛,其结果是置信区间论坛对于论坛论坛.应用论坛到这些端点的置信区间为论坛.海特(2012))给出了更一般的置信区间,以及田(2008))当各组有不同的方差时,给出了组比较的置信区间。

3.序数潜在变量模型的序数优势度量

什么时候?是一个c(c)-类别顺序响应变量,最流行的模型是累积链接模型

(3)

对于logit、probit或log–log和互补log–log等链接功能(麦库拉,1980年). 将有序分类变量视为连续潜在变量的必要粗略测量通常是明智的论坛如果我们能观察到,这将是一个普通线性模型中的响应变量。累积链接模型由一个模型隐含,其中潜在响应具有条件分布,cdf由链接函数的逆函数给出,平均值为论坛(安德森和菲利普斯,1981年).

正态潜变量模型论坛表示累积概率模型

具有论坛成为潜在规模的切入点论坛是标准的正常cdf。序数优势测度直接适用于该潜在变量模型。论坛论坛表示独立潜在变量论坛什么时候论坛以及何时论坛分别是。对于此模型,

不管论坛值,以及论坛.

logit链接和相应的累积logit模型与潜在的逻辑分布有关,对于这些逻辑分布,不会出现这样的简单表达式。然而,由于logit和probit模型拟合非常相似,该logistic潜在变量模型的相应测度估计与正常潜在变量模型非常相似。具有比例优势结构和最大似然估计的累积logit模型论坛对于群体效应,我们可以使用数值积分或模拟来自相关logistic分布的成对观测值,来近似估计潜在logistic随机变量差异概率的最大似然估计。然而,在实践中,只需近似计算论坛通过带参数的logistic分布论坛和比例参数论坛,其中

或拟合相应的累积概率模型,并使用闭合形式的结果。

对于有序响应,当我们期望潜在变量具有极值分布时,对数和互补对数链接是合适的。如果在潜在变量模型中,误差是独立的极值随机变量(即标准Gumbel cdf论坛=论坛)则其差异具有标准的物流分布(麦克法登,1974年). 对于具有对数-对数链接和系数的模型论坛对于组指示符,如下所示

当潜在极值分布的尺度参数为1时。

对于论坛论坛对于具有有序响应变量的潜变量模型,简单的置信区间直接来自于论坛对应的顺序累积链接模型。例如,如果论坛是的轮廓似然或Wald置信区间论坛在基于多项式似然的累积概率模型中论坛是[论坛,论坛].

4.累积链接模型示例

我们用下面的一个例子来说明序数优势测度阿格雷斯蒂(2015),第6.3.3节)。它涉及一个衡量精神障碍的四类反应变量(1 = 嗯,2 = 轻度症状形成,3 = 中度症状形成,4 = 受损)到社会经济地位的二元指标(SES:1 = 高,0 = 低)和定量生命事件(LE)指数,取0到9之间非负整数的值,平均值4.3,标准偏差2.7。这个论坛观察结果可在网址:www.stat.uf.edu/aa/glm/data.

对于对应于正态潜在变量模型的累积概率模型,最大似然拟合为

要比较SES的两个级别,请使用论坛,我们可以使用论坛论坛.顺序优势度量论坛有一种解释是,在对生活事件有任何特定价值的情况下,低社会经济地位比高社会经济地位有大约1/3的机会出现较低的精神障碍。的95%剖面似然置信区间论坛产生的置信区间(0.161,0.507)论坛和(论坛对于论坛.表1显示了使用软件(如R)获取的置信区间是多么简单论坛SES效应。这里,我们使用cml公司R包序号的函数(克里斯滕森,2011年).

表1

求序数优势测度置信区间的R代码和输出(已编辑)论坛在具有精神损伤数据的累积概率模型中的SES效应

表1

求序数优势测度置信区间的R代码和输出(已编辑)论坛基于心理损伤数据的累积probit模型中的SES效应

类似地,我们可以使用这些度量来比较生命事件度量的两个级别。对于最高和最低级别(0和9),论坛,95%的剖面似然置信区间(0.653,0.983),显示出非常强的影响。

在实践中,一些方法论者使用普通的正态线性模型来表示顺序反应数据,认为它们比累积链接模型更容易解释,并认为反应只是对某种内在连续性的粗略测量。为了进行比较,我们估计了序数优势测度论坛使用这种粗略的建模方法,在表2使用R软件。对于SES效应,论坛=论坛=论坛.非中心参数的置信区间论坛可在R软件中使用conf.limits.nct公司MBESS包中的函数(凯利,2007). 因此,很容易获得论坛,使用论坛,其中东南方是估计群体效应的报告标准误差。表2表明论坛为(0.18,0.51),与通过累积概率模型对数据进行真正有序处理得到的(0.16,0.51。

表2

求序数优势测度置信区间的R代码和输出(已编辑)论坛基于精神障碍数据的正态线性模型中的SES效应

表2

求序数优势测度置信区间的R代码和输出(已编辑)论坛具有精神损伤数据的正态线性模型中的SES效应

接下来,我们考虑累积链接模型的两个可选链接函数。累积logit模型有论坛对于SES效应论坛.值论坛它具有大约95%的剖面似然置信区间(0.160,0.511),与我们通过累积概率模型获得的结果几乎相同。使用log–log链接作为潜在的极值分布,这对于精神障碍来说是合理的,与logit或probit链接有很大不同,我们得到论坛论坛95%剖面似然置信区间(0.152,0.487)。log-likelihood或AIC值的比较并不表明probit、logit和log-log链接之间存在明显的偏好,部分反映了适度的样本量。

在这些数据的另一种方法中,Thas等人(2012年))logit的半参数模型拟合(论坛),使用一组估计方程估计模型参数,并使用三明治协方差矩阵估计估计量的协方差矩阵。在固定寿命事件下,他们获得论坛和95%置信区间论坛(0.20,0.48)。这比参数模型得到的结果略窄,但与我们在不假设潜在变量模型的情况下得到的结果非常相似,并且具有类似的实质性影响。我们将在下一节中进一步考虑这个精神障碍的例子。

5.不假设潜在结构的序数模型的度量

对于顺序分类反应的任何模型,顺序优势度量的类比直接应用于模型,而不涉及任何潜在变量模型。对于c(c)-类别顺序响应变量以及解释向量的特定值论坛,说吧论坛,让

我们定义

(4)

(5)

对应的样本值论坛论坛替换中的概率(4)(5)通过相应的拟合值论坛论坛用于模型。

与潜在变量模型的度量不同,这些度量的值取决于论坛。实际上,我们可以向代表报告它们及其置信区间论坛值,例如总平均值论坛或者,如果样品论坛值代表感兴趣的人群,汇总方法估计论坛每个观察值的值,然后求平均值。论坛表示观察的解释性分量向量,并让论坛,用于论坛,论坛、和论坛.总结优先措施为

(6)

带组件论坛论坛,由提供(4)(5)分别是。的表达式论坛论坛根据累积链接模型的参数(3)在中给出web附录A。我们获得了基于模型的估计论坛论坛通过用相应的估计值替换参数值。

为了构造这些度量的置信区间,我们可以基于ML模型参数估计值的估计协方差矩阵,使用delta方法获得大样本标准误差,这些估计值是由通常的多项式抽样方案生成的。从没有解释变量的简单情况的结果来看,将delta方法应用于诸如度量的logit之类的转换更为明智(Ryu和Agresti,2008年)而不是措施本身。Web附录A包含技术细节。构造估计和置信区间的R函数论坛论坛基于累积logit或probit模型,可在web附录B.

我们举例说明了精神障碍数据第4节用于说明序数潜在变量模型的度量。为了将两个SES水平与累积probit和累积logit模型进行比较,表3显示论坛论坛生命事件指数值论坛,以及样本平均值论坛虽然估计值因生活事件值而异,但它们相当稳定。正如我们所料,由于logit和probit模型的相似性,两个累积链接的汇总结果相似。

表3

基于累积probit和累积logit模型,在生命事件指数及其样本平均值的不同水平上比较精神损害数据的两个SES水平的序数优势测度估计

累计
探测器逻辑探测器逻辑
生活事件论坛论坛
00.3550.357−0.291−0.286
10.3450.348−0.310−0.305
20.3380.341−0.325−0.318
0.3330.337−0.334−0.326
40.3300.335−0.340−0.330
50.3290.334−0.342−0.333
60.3300.334−0.339−0.332
70.3340.336−0.333−0.327
80.3390.341−0.321−0.317
90.3480.350−0.305−0.301
论坛0.3300.334−0.341−0.331
累计
探测器逻辑探测器逻辑
生活事件论坛论坛
00.3550.357−0.291−0.286
10.3450.348−0.310−0.305
20.3380.341−0.325−0.318
0.3330.337−0.334−0.326
40.3300.335−0.340−0.330
50.3290.334−0.342−0.333
60.3300.334−0.339−0.332
70.3340.336−0.333−0.327
80.3390.341−0.321−0.317
90.3480.350−0.305−0.301
论坛0.3300.334−0.341−0.331
表3

基于累积probit和累积logit模型,在生命事件指数及其样本平均值的不同水平上比较精神损害数据的两个SES水平的序数优势测度估计

累计
探测器逻辑探测器逻辑
生活事件论坛论坛
00.3550.357−0.291−0.286
10.3450.348−0.310−0.305
20.3380.341−0.325−0.318
0.3330.337−0.334−0.326
40.3300.335−0.340−0.330
50.3290.334−0.342−0.333
60.3300.334−0.339−0.332
70.3340.336−0.333−0.327
80.3390.341−0.321−0.317
90.3480.350−0.305−0.301
论坛0.3300.334−0.341−0.331
累计
探测器逻辑探测器逻辑
生活事件论坛论坛
00.3550.357−0.291−0.286
10.3450.348−0.310−0.305
20.3380.341−0.325−0.318
0.3330.337−0.334−0.326
40.3300.335−0.340−0.330
50.3290.334−0.342−0.333
60.3300.334−0.339−0.332
70.3340.336−0.333−0.327
80.3390.341−0.321−0.317
90.3480.350−0.305−0.301
论坛0.3300.334−0.341−0.331

对于40次观测的平均汇总测量,我们获得论坛论坛对于probit模型,我们得到论坛论坛对于logit模型。表4使用观察到的信息矩阵,显示了人口值的95%置信区间。所有这些分析都表明,在低社会经济地位水平下,从基本上没有影响到相对较大的影响,从而导致心理健康较差。

表4

基于累积概率和累积logit模型,在生命事件指数的样本平均值下比较精神障碍数据的两个SES水平,并总结生命事件值的顺序优势度量的95%置信区间

累计
探测器逻辑探测器逻辑
生活事件论坛论坛
论坛(0.19, 0.51)(0.20, 0.51)(−0.63, 0.03)(−0.61, 0.02)
总结(0.21, 0.49)(0.21, 0.50)(−0.57, −0.02)(−0.57, −0.01)
累计
探测器逻辑探测器逻辑
生活事件论坛论坛
论坛(0.19, 0.51)(0.20, 0.51)(−0.63, 0.03)(−0.61, 0.02)
总结(0.21, 0.49)(0.21, 0.50)(−0.57,−0.02)(−0.57, −0.01)
表4

基于累积概率和累积logit模型,在生命事件指数的样本平均值下比较精神障碍数据的两个SES水平,并总结生命事件值的顺序优势度量的95%置信区间

累计
探测器逻辑探测器逻辑
生活事件论坛论坛
论坛(0.19, 0.51)(0.20, 0.51)(−0.63, 0.03)(−0.61,0.02)
总结(0.21, 0.49)(0.21, 0.50)(−0.57, −0.02)(−0.57, −0.01)
累计
探测器逻辑探测器逻辑
生活事件论坛论坛
论坛(0.19, 0.51)(0.20, 0.51)(−0.63, 0.03)(−0.61, 0.02)
总结(0.21, 0.49)(0.21, 0.50)(−0.57, −0.02)(−0.57, −0.01)

6.讨论和扩展

这里介绍的措施补充了先前提出的措施,以总结有序分类反应模型中的影响,例如Ryu和Agresti(2008年)和Thas等人(2012年)). 有关其他序数效应度量,请参见,程(2009))Lu等人(2014)),Lu等人(2015))、和Volfovsky等人(2015年).

序数优势度量的一个优点是对序数分类模型的解释简单,在这些模型中,研究人员经常发现问题和优势比难以解释。对于具有非线性链接函数的模型,例如累积链接模型,基于自然模型的效果度量不容易理解。例如,对于典型的医学研究人员或医生来说,在任何解释变量值下,药物反应的估计概率(论坛)比对安慰剂的反应要好(论坛)是论坛比阅读以下内容更有意义:(i)药物的估计累积概率为论坛乘以安慰剂的估计累积概率(即(3)使用logit链接),或(ii)估计的累积概率不同于论坛或药物的潜在平均值是论坛标准偏差优于安慰剂(即(3)或(iii)药物反应比特定结果类别差的估计概率是权力论坛安慰剂反应比该类别差的估计概率(即(3)具有互补的日志-日志链接)。

顺序优势度量直接扩展到多组的汇总比较,基于具有多个组指标变量的更通用模型。例如,假设累积概率模型包含术语论坛组的线性预测b条,其中论坛用于小组观察j个论坛否则。然后,模拟论坛用于比较这些组的论坛。推断可以使用Bonferroni调整。数量很大对于组,对论坛根据较少的参数进行比较,例如使用Bradley–Terry模型进行比较,并在更简单的上下文中讨论Bergsma等人(2009年,第11页)。

建议的措施第5节与线性潜在变量模型无关的模型直接适用于其他序数模型,例如具有比例优势结构的连续比率logit模型和邻接类别logit模型(阿格雷斯蒂,2010年,第4章)。当解释变量是完全分类的时,数据形成列联表,并且(3)对于logit链接,是累积比值比关联模型的响应模型模拟,而其他顺序响应模型对应于其他类型顺序比值比的关联模型(见第8.3.2–8.3.4节Kateri,2014年). 其中一些模型,例如以局部优势比表示的模型,与潜在的正态模型有近似的联系。与那些具有线性预测因子的模型相比,这些度量还扩展到更一般的顺序响应模型,例如顺序响应的广义加性模型(例如。,Yee and Wild,1996年),尽管获取置信区间更具挑战性。

7.补充资料

Web附录AB类,在中引用第5节,可在生物计量学威利在线图书馆网站。Web附录A包含推导大样本置信区间的技术细节论坛论坛,同时web附录B提供计算的R函数论坛论坛以及相关的置信区间。

致谢

作者们很欣赏威彻·伯格斯玛、莱昂纳多·格里利、卡拉·兰皮奇尼和尤尤恩·吕对早期草案的有益评论。

参考文献

阿格雷斯蒂
,
答:。
(
2010
).
有序分类数据分析
,第2版。
新泽西州霍博肯
:
威利
.

阿格雷斯蒂
,
答:。
(
2015
).
线性和广义线性模型的基础
.
新泽西州霍博肯
:
威利
.

安德森
,
J.A.公司。
飞利浦
,
中华人民共和国。
(
1981
).
有序分类变量的回归、判别和测量模型
.
应用统计学
30
,
22
——
31
.

伯格斯玛
,
W。
,
克罗地亚
,
文学硕士。
、和
哈格纳斯
,
J.A.公司。
(
2009
).
相依、聚类和纵向分类数据的边缘模型
.
纽约州纽约市
:
施普林格
.

布伦巴克
,
拉丁美洲。
,
佩佩
,
米·秒。
、和
阿隆佐
,
T.A.公司。
(
2006
).
使用ROC曲线评估临床试验中的治疗效果
.
医学统计学
25
,
575
——
590
.

,
J。
(
2009
).
接受治疗对多项式结果因果影响的估计和推断
.
生物计量学
65
,
96
——
103
.

克里斯滕森
,
R·H·B。
(
2011
).
序数数据分析与序数包累积链接模型估计
.R(右)–2011版软件包。
09
——
13
.

海特
,
A.J.公司。
(
2012
).
回归模型的获胜概率
.
统计方法
9
,
520
——
527
.

卡蒂丽
,
M。
(
2014
).
列联表分析:R的方法与实现
.
纽约
:
伯卡用户/施普林格
.

凯利
,
英国。
(
2007
).
标准化效应大小的置信区间:理论、应用和实施
.
统计软件杂志
20
,
1
——
24
.

科洛茨
J.H。
(
1966
).
威尔科森、领带和电脑
.
美国统计协会杂志
61
,
772
——
787
.

莱曼
,
大肠杆菌。
(
1975
).
非参数:基于秩的统计方法
.
加利福尼亚州旧金山
:
Holden日
.

莱曼
,
大肠杆菌。
(
1986
).
测试统计假设
,第2版。
纽约州纽约市
:
Springer-Verlag公司
.

,
J。
,
,
第页。
、和
达斯古普塔
,
T。
(
2015
).
顺序结果因果效应的明确界限
.http://arxiv.org/abs/1507.01542v1

,
T.-Y.公司。
,
Poon(水池)
,
W.-Y.公司。
、和
张(音译)
,
S.H.公司。
(
2014
).
将治疗与顺序反应进行比较的统一框架
.
普西霍姆特里卡
79
,
605
——
620
.

麦库拉
,
第页。
(
1980
).
有序数据的回归模型
.
英国皇家统计学会杂志B辑
42
,
109
——
142
.

麦克法登
,
D。
(
1974
).
定性选择行为的条件logit分析
.英寸
计量经济学的前沿
,
第页。
扎雷姆布卡
(d),
105
——
142
.
纽约
:
学术出版社
.

,
E.公司。
阿格雷斯蒂
,
答:。
(
2008
).
有序效应大小度量的建模与推理
.
医学统计学
27
,
1703
——
1717
.

,
O。
,
德内夫
,
J。
,
克莱门特
,
L。
、和
奥托伊
,
J.-P.公司。
(
2012
).
概率指数模型
.
英国皇家统计学会杂志B辑
74
,
623
——
671
.

,
L。
(
2008
).
的置信区间论坛线性模型中的正常结果
.
医学统计学
27
,
4221
——
4237
.

沃尔福夫斯基
,
答:。
,
Airoldi公司
,
电子显微镜。
、和
鲁宾
,
D、B。
(
2015
).
顺序结果的因果推理
.http://arxiv:1501.01234v1

Yee是的
,
总重量。
野生
,
C.J.公司。
(
1996
).
向量广义可加模型
.
英国皇家统计学会期刊,B辑
58
,
481
——
493
.

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)