Ordinal Probability Effect Measures for Group Comparisons in Multinomial Cumulative Link Models

Agresti, Alan; Kateri, Maria

doi:10.1111/biom.12565

总结

我们考虑基于简单序数模型的概率效应度量来比较两组的分布，并对解释变量进行了调整。“序数优势”度量总结了一个分布的观察值低于另一个分布独立观察值的概率，并根据模型中的解释变量进行了调整。该度量直接适用于正态线性模型和有序响应变量的正态潜在变量模型。它等于对于将probit链接函数应用于累积多项式概率的相应序数模型，对于标准正态cdf和效果这是组指标变量的系数。对于序数响应的更一般的潜在变量模型，该模型对应于具有其他可能误差分布的线性模型以及累积多项式概率的相应链接函数，序数优势度量等于使用log–log链接，大约等于使用logit链接，其中是群体效应。另一个顺序优势度量泛化了二进制响应与顺序响应之间的比例差异。我们还直接为观察到的响应的序数模型提供了相关度量，这些序数模型不需要假定相应的潜在响应模型。我们给出了度量的置信区间，并用示例进行了说明。

累积logit模型,累积概率模型,Mann–Whitney统计,序数多项式模型,比例赔率,随机排序

1.简介

本文考虑了简单的顺序效应总结，用于基于模型的两组对顺序分类反应变量的比较，同时调整其他解释变量。与使用非线性度量（如概率和比值比）的标准摘要不同，这些非线性度量可能难以由从业者解释，建议的度量仅基于概率及其差异。

总结性测量概括了两种“顺序优势”测量，它们在没有补充解释变量的情况下对两组进行比较。让和表示由A和B表示的组中的独立随机变量，用于定量或有序分类量表。措施

(1)

总结了它们的相对大小。对于结果为（0，1）的二进制响应，这简化为比例差异，⁠.如果和分布相同，那么⁠。对于离散响应变量，如有序分类响应，空值等于0.50而非0的相关度量为

(2)

(Klotz，1966年). 调整领带的校正系数以生成0.50的空值。这些措施在功能上是相关的，

具有和范围[0,1]和[]分别是。当这些组是随机排序的，例如当它们在某种程度上因位置变化而存在差异时，它们最有意义。有关有序分类反应量表的详细信息，请参阅阿格雷斯蒂（2010年，第2章）。这些指标直接与Mann-Whitney统计中使用的信息相关。例如，第25卷第4期医学统计学2006年，该杂志专门讨论了这一统计数据及其使用和扩展，其中有几篇文章使用了这种方法。

本文中讨论的顺序效应度量在对顺序响应变量建模的背景下使用这些概率，同时调整解释变量。第2节由于线性模型是顺序反应数据的潜在变量模型，因此引入了包含群体指标项的正常线性模型的度量。第3节介绍了序数响应变量标准模型的相关度量，该模型将链接函数（如probit或logit）应用于累积概率，利用其与各种误差分布的潜在变量模型的联系。第4节给出了一个示例，还展示了如何使用R软件轻松构建度量的置信区间。第5节根据观察到的反应，而不是潜在的反应，提出了累积链接模型的相关顺序效应测度。第6节讨论了这些措施的适用性，并建议对其他模型进行扩展。

2.正态线性模型的顺序优势度量

我们首先考虑除了二进制组指示符变量之外还有解释变量的正常线性模型。解释变量值⁠，让表示A组观察的响应变量，并让表示B组中观察的独立响应。使用基于模型的条件分布年对于两组⁠，让

除了组指示符之外，没有其他解释变量，这简化为(1).顺序优势度量的模拟(2)是

这仅仅是当响应连续时。当群体变量和解释变量之间没有实质性交互作用时，这些度量是有用的总结。

让z（z）是观察的分组指示符，其中对于A组和对于B组，这些序数测度对于普通正态线性模型具有简单形式

具有和⁠对于此模型和在是⁠、和

此公式适用于任何值解释变量。同样，⁠.两组取数值的正常条件标准化平均值之间的差异等于⁠，对应于等于⁠分别是。当分组指标与解释变量之间发生相互作用时，或当方差允许为非恒定时，则适用类似度量，但度量值取决于该解释变量的值。标准化差异长期以来，文献中一直使用这一方法来比较两组人（例如。，莱曼，1975年第71页）。相应的顺序优势度量也用于一般回归环境中（例如。，Brumback等人，2006年,Thas等人，2012年).

实际上，使用最小二乘估计线性模型中的剩余标准差秒，我们可以通过和⁠.置信区间标准化差异在正常线性模型中，会产生相应的置信区间对于⁠，然后也会产生一个⁠对于模型矩阵对于线性模型，让v（v）表示的行和列中的元素对应于效果参数用于比较两组。用于测试⁠:使用通常的t吨统计的，⁠，考虑非中心参数

让表示的标准置信区间用于此测试(莱曼，1986年第352页）。然后，因为⁠，其结果是置信区间对于是⁠.应用到这些端点的置信区间为⁠.海特（2012）)给出了更一般的置信区间，以及田（2008）)当各组有不同的方差时，给出了组比较的置信区间。

3.序数潜在变量模型的序数优势度量

什么时候？年是一个c（c）-类别顺序响应变量，最流行的模型是累积链接模型

（3）

对于logit、probit或log–log和互补log–log等链接功能(麦库拉，1980年). 将有序分类变量视为连续潜在变量的必要粗略测量通常是明智的如果我们能观察到，这将是一个普通线性模型中的响应变量。累积链接模型由一个模型隐含，其中潜在响应具有条件分布，cdf由链接函数的逆函数给出，平均值为(安德森和菲利普斯，1981年).

正态潜变量模型表示累积概率模型

具有成为潜在规模的切入点是标准的正常cdf。序数优势测度直接适用于该潜在变量模型。让和表示独立潜在变量什么时候以及何时⁠分别是。对于此模型，

不管值，以及⁠.

logit链接和相应的累积logit模型与潜在的逻辑分布有关，对于这些逻辑分布，不会出现这样的简单表达式。然而，由于logit和probit模型拟合非常相似，该logistic潜在变量模型的相应测度估计与正常潜在变量模型非常相似。具有比例优势结构和最大似然估计的累积logit模型对于群体效应，我们可以使用数值积分或模拟来自相关logistic分布的成对观测值，来近似估计潜在logistic随机变量差异概率的最大似然估计。然而，在实践中，只需近似计算通过带参数的logistic分布和比例参数⁠，其中

或拟合相应的累积概率模型，并使用闭合形式的结果。

对于有序响应，当我们期望潜在变量具有极值分布时，对数和互补对数链接是合适的。如果在潜在变量模型中，误差是独立的极值随机变量（即标准Gumbel cdf=⁠)则其差异具有标准的物流分布(麦克法登，1974年). 对于具有对数-对数链接和系数的模型对于组指示符，如下所示

当潜在极值分布的尺度参数为1时。

对于和对于具有有序响应变量的潜变量模型，简单的置信区间直接来自于对应的顺序累积链接模型。例如，如果是的轮廓似然或Wald置信区间在基于多项式似然的累积概率模型中是[⁠,].

4.累积链接模型示例

我们用下面的一个例子来说明序数优势测度阿格雷斯蒂（2015），第6.3.3节）。它涉及一个衡量精神障碍的四类反应变量（1 = 嗯，2 = 轻度症状形成，3 = 中度症状形成，4 = 受损）到社会经济地位的二元指标（SES:1 = 高，0 = 低）和定量生命事件（LE）指数，取0到9之间非负整数的值，平均值4.3，标准偏差2.7。这个观察结果可在网址：www.stat.uf.edu/aa/glm/data.

对于对应于正态潜在变量模型的累积概率模型，最大似然拟合为

要比较SES的两个级别，请使用⁠，我们可以使用和⁠.顺序优势度量有一种解释是，在对生活事件有任何特定价值的情况下，低社会经济地位比高社会经济地位有大约1/3的机会出现较低的精神障碍。的95%剖面似然置信区间产生的置信区间（0.161，0.507）和(⁠对于⁠.表1显示了使用软件（如R）获取的置信区间是多么简单SES效应。这里，我们使用cml公司R包序号的函数(克里斯滕森，2011年).

表1

求序数优势测度置信区间的R代码和输出（已编辑）基于心理损伤数据的累积probit模型中的SES效应

R代码和输出（编辑），用于在具有精神损伤数据的累积概率模型中寻找SES效应的顺序优势测度的置信区间

新标签中打开

类似地，我们可以使用这些度量来比较生命事件度量的两个级别。对于最高和最低级别（0和9），⁠，95%的剖面似然置信区间（0.653,0.983），显示出非常强的影响。

在实践中，一些方法论者使用普通的正态线性模型来表示顺序反应数据，认为它们比累积链接模型更容易解释，并认为反应只是对某种内在连续性的粗略测量。为了进行比较，我们估计了序数优势测度使用这种粗略的建模方法，在表2使用R软件。对于SES效应，==⁠.非中心参数的置信区间可在R软件中使用conf.limits.nct公司MBESS包中的函数(凯利，2007). 因此，很容易获得⁠，使用⁠，其中东南方是估计群体效应的报告标准误差。表2表明为（0.18，0.51），与通过累积概率模型对数据进行真正有序处理得到的（0.16，0.51。

表2

求序数优势测度置信区间的R代码和输出（已编辑）具有精神损伤数据的正态线性模型中的SES效应

用R代码和输出（编辑过的）求具有精神障碍数据的正态线性模型中SES效应序数优势测度的置信区间

新标签中打开

接下来，我们考虑累积链接模型的两个可选链接函数。累积logit模型有对于SES效应⁠.值它具有大约95%的剖面似然置信区间（0.160，0.511），与我们通过累积概率模型获得的结果几乎相同。使用log–log链接作为潜在的极值分布，这对于精神障碍来说是合理的，与logit或probit链接有很大不同，我们得到和95%剖面似然置信区间（0.152，0.487）。log-likelihood或AIC值的比较并不表明probit、logit和log-log链接之间存在明显的偏好，部分反映了适度的样本量。

在这些数据的另一种方法中，Thas等人（2012年）)logit的半参数模型拟合(⁠⁠)，使用一组估计方程估计模型参数，并使用三明治协方差矩阵估计估计量的协方差矩阵。在固定寿命事件下，他们获得和95%置信区间（0.20，0.48）。这比参数模型得到的结果略窄，但与我们在不假设潜在变量模型的情况下得到的结果非常相似，并且具有类似的实质性影响。我们将在下一节中进一步考虑这个精神障碍的例子。

5.不假设潜在结构的序数模型的度量

对于顺序分类反应的任何模型，顺序优势度量的类比直接应用于模型，而不涉及任何潜在变量模型。对于c（c）-类别顺序响应变量年以及解释向量的特定值⁠，说吧⁠，让

我们定义

(4)

和

（5）

对应的样本值和替换中的概率(4)和（5）通过相应的拟合值和用于模型。

与潜在变量模型的度量不同，这些度量的值取决于⁠。实际上，我们可以向代表报告它们及其置信区间值，例如总平均值⁠或者，如果样品值代表感兴趣的人群，汇总方法估计每个观察值的值，然后求平均值。让表示观察的解释性分量向量我，并让⁠，用于⁠,⁠、和⁠.总结优先措施为

（6）

带组件和⁠，由提供(4)和（5）分别是。的表达式和根据累积链接模型的参数（3）在中给出web附录A。我们获得了基于模型的估计和通过用相应的估计值替换参数值。

为了构造这些度量的置信区间，我们可以基于ML模型参数估计值的估计协方差矩阵，使用delta方法获得大样本标准误差，这些估计值是由通常的多项式抽样方案生成的。从没有解释变量的简单情况的结果来看，将delta方法应用于诸如度量的logit之类的转换更为明智(Ryu和Agresti，2008年)而不是措施本身。Web附录A包含技术细节。构造估计和置信区间的R函数和⁠基于累积logit或probit模型，可在web附录B.

我们举例说明了精神障碍数据第4节用于说明序数潜在变量模型的度量。为了将两个SES水平与累积probit和累积logit模型进行比较，表3显示和生命事件指数值⁠，以及样本平均值⁠虽然估计值因生活事件值而异，但它们相当稳定。正如我们所料，由于logit和probit模型的相似性，两个累积链接的汇总结果相似。

表3

基于累积probit和累积logit模型，在生命事件指数及其样本平均值的不同水平上比较精神损害数据的两个SES水平的序数优势测度估计

	累计
	探测器	逻辑	探测器	逻辑
生活事件
0	0.355	0.357	−0.291	−0.286
1	0.345	0.348	−0.310	−0.305
2	0.338	0.341	−0.325	−0.318
三	0.333	0.337	−0.334	−0.326
4	0.330	0.335	−0.340	−0.330
5	0.329	0.334	−0.342	−0.333
6	0.330	0.334	−0.339	−0.332
7	0.334	0.336	−0.333	−0.327
8	0.339	0.341	−0.321	−0.317
9	0.348	0.350	−0.305	−0.301
	0.330	0.334	−0.341	−0.331

	累计
	探测器	逻辑	探测器	逻辑
生活事件
0	0.355	0.357	−0.291	−0.286
1	0.345	0.348	−0.310	−0.305
2	0.338	0.341	−0.325	−0.318
三	0.333	0.337	−0.334	−0.326
4	0.330	0.335	−0.340	−0.330
5	0.329	0.334	−0.342	−0.333
6	0.330	0.334	−0.339	−0.332
7	0.334	0.336	−0.333	−0.327
8	0.339	0.341	−0.321	−0.317
9	0.348	0.350	−0.305	−0.301
	0.330	0.334	−0.341	−0.331

新标签中打开

表3

基于累积probit和累积logit模型，在生命事件指数及其样本平均值的不同水平上比较精神损害数据的两个SES水平的序数优势测度估计

	累计
	探测器	逻辑	探测器	逻辑
生活事件
0	0.355	0.357	−0.291	−0.286
1	0.345	0.348	−0.310	−0.305
2	0.338	0.341	−0.325	−0.318
三	0.333	0.337	−0.334	−0.326
4	0.330	0.335	−0.340	−0.330
5	0.329	0.334	−0.342	−0.333
6	0.330	0.334	−0.339	−0.332
7	0.334	0.336	−0.333	−0.327
8	0.339	0.341	−0.321	−0.317
9	0.348	0.350	−0.305	−0.301
	0.330	0.334	−0.341	−0.331

	累计
	探测器	逻辑	探测器	逻辑
生活事件
0	0.355	0.357	−0.291	−0.286
1	0.345	0.348	−0.310	−0.305
2	0.338	0.341	−0.325	−0.318
三	0.333	0.337	−0.334	−0.326
4	0.330	0.335	−0.340	−0.330
5	0.329	0.334	−0.342	−0.333
6	0.330	0.334	−0.339	−0.332
7	0.334	0.336	−0.333	−0.327
8	0.339	0.341	−0.321	−0.317
9	0.348	0.350	−0.305	−0.301
	0.330	0.334	−0.341	−0.331

新标签中打开

对于40次观测的平均汇总测量，我们获得和对于probit模型，我们得到和对于logit模型。表4使用观察到的信息矩阵，显示了人口值的95%置信区间。所有这些分析都表明，在低社会经济地位水平下，从基本上没有影响到相对较大的影响，从而导致心理健康较差。

表4

基于累积概率和累积logit模型，在生命事件指数的样本平均值下比较精神障碍数据的两个SES水平，并总结生命事件值的顺序优势度量的95%置信区间

	累计
	探测器	逻辑	探测器	逻辑
生活事件
	(0.19, 0.51)	(0.20, 0.51)	(−0.63, 0.03)	(−0.61, 0.02)
总结	(0.21, 0.49)	(0.21, 0.50)	(−0.57, −0.02)	(−0.57, −0.01)

	累计
	探测器	逻辑	探测器	逻辑
生活事件
	(0.19, 0.51)	(0.20, 0.51)	(−0.63, 0.03)	(−0.61, 0.02)
总结	(0.21, 0.49)	(0.21, 0.50)	（−0.57，−0.02）	(−0.57, −0.01)

新标签中打开

表4

基于累积概率和累积logit模型，在生命事件指数的样本平均值下比较精神障碍数据的两个SES水平，并总结生命事件值的顺序优势度量的95%置信区间

	累计
	探测器	逻辑	探测器	逻辑
生活事件
	(0.19, 0.51)	(0.20, 0.51)	(−0.63, 0.03)	（−0.61，0.02）
总结	(0.21, 0.49)	(0.21, 0.50)	(−0.57, −0.02)	(−0.57, −0.01)

新标签中打开

6.讨论和扩展

这里介绍的措施补充了先前提出的措施，以总结有序分类反应模型中的影响，例如Ryu和Agresti（2008年)和Thas等人（2012年）). 有关其他序数效应度量，请参见，程（2009）)Lu等人（2014）),Lu等人（2015）)、和Volfovsky等人（2015年).

序数优势度量的一个优点是对序数分类模型的解释简单，在这些模型中，研究人员经常发现问题和优势比难以解释。对于具有非线性链接函数的模型，例如累积链接模型，基于自然模型的效果度量不容易理解。例如，对于典型的医学研究人员或医生来说，在任何解释变量值下，药物反应的估计概率(⁠⁠)比对安慰剂的反应要好(⁠⁠)是比阅读以下内容更有意义：（i）药物的估计累积概率为乘以安慰剂的估计累积概率（即（3）使用logit链接），或（ii）估计的累积概率不同于或药物的潜在平均值是标准偏差优于安慰剂（即（3）或（iii）药物反应比特定结果类别差的估计概率是权力安慰剂反应比该类别差的估计概率（即（3）具有互补的日志-日志链接）。

顺序优势度量直接扩展到多组的汇总比较，基于具有多个组指标变量的更通用模型。例如，假设累积概率模型包含术语组的线性预测一和b条，其中用于小组观察j个和否则。然后，模拟用于比较这些组的⁠。推断可以使用Bonferroni调整。数量很大克对于组，对根据较少的参数进行比较，例如使用Bradley–Terry模型进行比较，并在更简单的上下文中讨论Bergsma等人（2009年，第11页）。

建议的措施第5节与线性潜在变量模型无关的模型直接适用于其他序数模型，例如具有比例优势结构的连续比率logit模型和邻接类别logit模型(阿格雷斯蒂，2010年，第4章）。当解释变量是完全分类的时，数据形成列联表，并且（3）对于logit链接，是累积比值比关联模型的响应模型模拟，而其他顺序响应模型对应于其他类型顺序比值比的关联模型（见第8.3.2–8.3.4节Kateri，2014年). 其中一些模型，例如以局部优势比表示的模型，与潜在的正态模型有近似的联系。与那些具有线性预测因子的模型相比，这些度量还扩展到更一般的顺序响应模型，例如顺序响应的广义加性模型（例如。，Yee and Wild，1996年)，尽管获取置信区间更具挑战性。

7.补充资料

Web附录A和B类，在中引用第5节，可在生物计量学威利在线图书馆网站。Web附录A包含推导大样本置信区间的技术细节和⁠，同时web附录B提供计算的R函数和⁠以及相关的置信区间。

致谢

作者们很欣赏威彻·伯格斯玛、莱昂纳多·格里利、卡拉·兰皮奇尼和尤尤恩·吕对早期草案的有益评论。

参考文献

阿格雷斯蒂

,

答：。

(

2010

).

有序分类数据分析

，第2版。

新泽西州霍博肯

:

威利

.

阿格雷斯蒂

,

答：。

(

2015

).

线性和广义线性模型的基础

.

新泽西州霍博肯

:

威利

.

安德森

,

J.A.公司。

和

飞利浦

,

中华人民共和国。

(

1981

).

有序分类变量的回归、判别和测量模型

.

应用统计学

30

,

22

——

31

.

谷歌学者

交叉参考

书目数据库

伯格斯玛

,

W。

,

克罗地亚

,

文学硕士。

、和

哈格纳斯

,

J.A.公司。

(

2009

).

相依、聚类和纵向分类数据的边缘模型

.

纽约州纽约市

:

施普林格

.

布伦巴克

,

拉丁美洲。

,

佩佩

,

米·秒。

、和

阿隆佐

,

T.A.公司。

(

2006

).

使用ROC曲线评估临床试验中的治疗效果

.

医学统计学

25

,

575

——

590

.

程

,

J。

(

2009

).

接受治疗对多项式结果因果影响的估计和推断

.

生物计量学

65

,

96

——

103

.

克里斯滕森

,

R·H·B。

(

2011

).

序数数据分析与序数包累积链接模型估计

.R（右）–2011版软件包。

09

——

13

.

海特

,

A.J.公司。

(

2012

).

回归模型的获胜概率

.

统计方法

9

,

520

——

527

.

谷歌学者

交叉参考

书目数据库

卡蒂丽

,

M。

(

2014

).

列联表分析：R的方法与实现

.

纽约

:

伯卡用户/施普林格

.

凯利

,

英国。

(

2007

).

标准化效应大小的置信区间：理论、应用和实施

.

统计软件杂志

20

,

1

——

24

.

谷歌学者

交叉参考

书目数据库

科洛茨

J.H。

(

1966

).

威尔科森、领带和电脑

.

美国统计协会杂志

61

,

772

——

787

.

谷歌学者

交叉参考

书目数据库

莱曼

,

大肠杆菌。

(

1975

).

非参数：基于秩的统计方法

.

加利福尼亚州旧金山

:

Holden日

.

莱曼

,

大肠杆菌。

(

1986

).

测试统计假设

，第2版。

纽约州纽约市

:

Springer-Verlag公司

.

卢

,

J。

,

丁

,

第页。

、和

达斯古普塔

,

T。

(

2015

).

顺序结果因果效应的明确界限

.http://arxiv.org/abs/1507.01542v1

卢

,

T.-Y.公司。

,

Poon（水池）

,

W.-Y.公司。

、和

张（音译）

,

S.H.公司。

(

2014

).

将治疗与顺序反应进行比较的统一框架

.

普西霍姆特里卡

79

,

605

——

620

.

谷歌学者

交叉参考

书目数据库

麦库拉

,

第页。

(

1980

).

有序数据的回归模型

.

英国皇家统计学会杂志B辑

42

,

109

——

142

.

谷歌学者

OpenURL占位符文本

书目数据库

麦克法登

,

D。

(

1974

).

定性选择行为的条件logit分析

.英寸

计量经济学的前沿

,

第页。

扎雷姆布卡

（d），

105

——

142

.

纽约

:

学术出版社

.

柳

,

E.公司。

和

阿格雷斯蒂

,

答：。

(

2008

).

有序效应大小度量的建模与推理

.

医学统计学

27

,

1703

——

1717

.

塔

,

O。

,

德内夫

,

J。

,

克莱门特

,

L。

、和

奥托伊

,

J.-P.公司。

(

2012

).

概率指数模型

.

英国皇家统计学会杂志B辑

74

,

623

——

671

.

谷歌学者

交叉参考

书目数据库

田

,

L。

(

2008

).

的置信区间

线性模型中的正常结果

.

医学统计学

27

,

4221

——

4237

.

沃尔福夫斯基

,

答：。

,

Airoldi公司

,

电子显微镜。

、和

鲁宾

,

D、B。

(

2015

).

顺序结果的因果推理

.http://arxiv:1501.01234v1

Yee是的

,

总重量。

和

野生

,

C.J.公司。

(

1996

).

向量广义可加模型

.

英国皇家统计学会期刊，B辑

58

,

481

——

493

.

谷歌学者

OpenURL占位符文本

书目数据库

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)

下载所有幻灯片

月份：	总浏览次数：
2024年1月	22
2024年2月	12
2024年3月	7
2024年4月	8
2024年5月	14

文章内容

多项式累积链路模型中群比较的有序概率效应测度

总结

1.简介

2.正态线性模型的顺序优势度量

3.序数潜在变量模型的序数优势度量

4.累积链接模型示例

5.不假设潜在结构的序数模型的度量

6.讨论和扩展

7.补充资料

致谢

参考文献

补充数据

引文

视图

海拔高度

电子邮件警报

电子邮件警报

中的相关文章

通过引用文章

最新的

阅读次数最多

引用次数最多

文章内容

多项式累积链路模型中群比较的有序概率效应测度

总结

1.简介

2.正态线性模型的顺序优势度量

3.序数潜在变量模型的序数优势度量

4.累积链接模型示例

5.不假设潜在结构的序数模型的度量

6.讨论和扩展

7.补充资料

致谢

参考文献

补充数据

引文

视图

海拔高度

电子邮件警报

电子邮件警报

中的相关文章

通过引用文章

最新的

阅读次数最多

引用次数最多

此功能仅对订阅服务器可用