有序Logistic回归|R数据分析示例

介绍

下一页讨论了如何使用R波尔包执行有序logistic回归。
有关结果解释的数学处理方法，请参阅：如何解释R中有序逻辑回归的系数？

准备

在尝试运行此页面上的示例之前，请确保可以加载以下包。如果你没有安装了程序包，请运行：install.packages（“packagename”），或者如果看到版本过期，请运行：update.packages（）.

要求（国外）
要求（ggplot2）
要求（质量）
要求（哈米斯）
要求（重塑2）

版本信息：此页面的代码在R版本3.1.1（2014-07-10）中进行了测试日期：2014-08-21其中：重塑21.4；Hmisc 3.14-4；公式1.1-2；存活率2.37-7；点阵0.20-29；质量7.3-33；ggplot2 1.0.0；国外0.8-61；针织1.6

请注意：本页的目的是展示如何使用各种数据分析命令。它并没有涵盖研究过程的所有方面研究人员应该这样做。特别是，它不包括数据清洁和检查、假设验证、模型诊断或潜在的后续分析。

序数逻辑回归示例

例1：一家营销研究公司想调查影响苏打水大小的因素（小、中、大或超大），人们在快餐连锁店订购。这些因素可能包括点什么类型的三明治（汉堡或鸡肉），是否也点薯条，以及消费者的年龄。虽然结果变量苏打水的大小显然是有序的，但不同大小之间的差异并不一致。小号和中号的区别是10盎司，中号和大号的区别为8盎司，大号和超大的区别为12盎司。

例2：一位研究人员对影响奥运会游泳奖牌的因素感兴趣。相关预测因素包括训练时间、饮食、年龄和运动员所在国游泳的受欢迎程度。研究人员认为，金与银的距离大于银与铜的距离。

例3：一项研究考察了影响是否申请研究生院的因素。大学三年级学生被问及是否是不太可能，有点可能，或者很可能申请研究生院。因此，我们的结果变量有三类。父母教育状况数据，本科生机构是否公共或私人，并收集当前的GPA。研究人员有理由相信这三者之间的“距离”分数不相等。例如，“不太可能”和“有可能”之间的“距离”可能比“有可能的”和“很可能的”之间的距离短。

数据的描述

对于下面的数据分析，我们将扩展关于申请研究生院的示例3。我们为此模拟了一些数据示例，可从我们的网站获得：

日期 <- 阅读.dta("https://stats.idre.ucla.edu/stat/data/ologit.dta")
头（日期）

##应用pared公共gpa##1很可能0 0 3.26##2有可能1 0 3.21##3不太可能1 1 3.94##4有可能0 0 2.81##5有可能0 0 2.53##6不太可能0 1 2.59

这个假设数据集有一个三级变量，名为应用，“不太可能”、“有点可能”和“非常可能”级别分别编码为1、2和3，我们将其用作结果变量。我们还将使用三个变量作为预测因素：削过的,这是一个0/1变量，表示父母中是否至少有一人拥有研究生学位；公众的，这是一个0/1变量，其中1表示本科院校为公立，0为私立普通合伙人，这是学生的平均成绩。让我们从这些变量的描述性统计开始。

##一次一个，表格应用、整理和公开
重叠地（日期[， c（c）(“应用”, “精简”, “公共”)]，表）

##$适用## ##不太可能，有点可能，很可能##             220             140              40 ## ##$帕雷德## ##   0   1 ## 337  63 ## ##$公共## ##   0   1 ## 343  57

##三向交叉标签（xtabs）并展平表格
自由贸易区(xtabs公司(~ 公众的 + 应用 + 削皮， 数据 =日期）

##已对0 1进行pared##公共申请##0不太可能175 14##有点可能98 26##很可能20 10##1不太可能25 6##有点可能12 4##很可能7 3

总结（日期$gpa）

##最小第1季度中位数平均第3季度最大。##    1.90    2.72    2.99    3.00    3.27    4.00

标准偏差（日期$gpa）

## [1] 0.3979

我们还可以检查gpa公司在各个级别应用并被分解公众的和削好的。这将创建一个2 x 2网格每个应用级别的gpa箱线图，针对特定值削好的和公众的。为了更好地查看数据，我们还将原始数据点添加到箱线图的顶部，带有少量噪声（通常称为“抖动”）和50%的透明度，以便它们不会淹没箱线图。最后，除了单元格之外，我们还绘制了所有的边缘关系。边距使最终绘图成为3 x 3的网格右下角，是应用和普通合伙人这似乎有点积极。为此，我们使用ggplot2包裹。

ggplot图（日期：， 原子发射光谱(x个 =适用， 年 =gpa）） +
  地理箱线图(大小 = .75) +
  地理抖动(阿尔法 = .5) +
  面_网格（已修剪 ~ 公众， 利润 = 真的) +
  主题(轴.text。x个 = 元素_文本(角 = 45, 刚刚 = 1, vjust（vjust） = 1))

您可能会考虑的分析方法

下面是您可能遇到的一些分析方法的列表。列出的一些方法非常合理，而其他方法则有失宠或有局限性。

有序逻辑回归：本页的重点。
OLS回归：此分析存在问题，因为当OLS与非中断使用时，违反了OLS的假设结果变量。
方差分析：如果你只使用一个连续预测值，你可以“翻转”模型，比如说，gpa公司是结果变量和应用是预测变量。然后可以运行单向方差分析。如果你只有一个预测变量（来自逻辑模型），并且它是连续的，那么这不是一件坏事。
多项式逻辑回归：这与有序逻辑回归类似，只是假设结果变量的类别没有顺序（即类别是标称的）。这种方法的缺点是，订单中包含的信息会丢失。
有序概率回归：这与运行有序逻辑回归非常类似。主要区别在于系数的解释。

有序逻辑回归

下面我们使用波尔命令MASS（质量）包来估计有序logistic回归模型。命令名来自比例优势逻辑回归，强调了我们模型中的比例优势假设。波尔在中使用标准公式界面R（右）用于指定回归模型，结果后跟预测因子。我们还指定Hess=真使模型从优化中返回观测信息矩阵（称为Hessian），用于获得标准误差。

定义

为了理解如何解释系数，首先让我们建立一些符号并复习序数逻辑回归中涉及的概念。让$Y$是$J$类别的序数结果。那么$P（Y\le j）$是$Y$小于或等于特定类别$j=1，\cdots，j-1$的累积概率。小于或等于特定类别的概率可以定义为

$$\压裂{P（Y\le j）}{P（Y>j）}$$

对于$j=1，\cdots，j-1$，因为$P（Y>j）=0$并且除以零是未定义的。这个对数几率也称为罗吉特，所以

$$log\frac{P（Y\lej）}{P（Y>j）}=logit（P（Y\ lej））$$

在R中波尔有序logistic回归模型参数化为

$$logit（P（Y\lej））=\beta_{j0}–\eta_{1} x_1–\cdots–\eta{p}x_p$$

然后我们可以拟合以下有序logistic回归模型：

##拟合有序logit模型并存储结果“m”
米 <- 波尔（适用 ~ 削好的 + 公众的 + 平均绩点， 数据 =日期， 赫斯=真的)

##查看模型摘要
总结（米）

##致电：##polr（公式=apply~pared+public+gpa，数据=dat，Hess=TRUE）## ##系数：##值标准误差t值##对1.0477 0.266 3.942##公开-0.0588 0.298-0.197##gpa 0.6159 0.261 2.363## ##拦截次数：##值标准误差t值##不太可能|有点可能2.204 0.780 2.827##有可能|很可能4.299 0.804 5.345## ##剩余偏差：717.02##AIC:727.02

估算模型可以写成：

$$\开始{eqnarray}logit（\hat｛P｝（Y \le 1））&=&2.20–1.05*部分-（-0.06）*公共-0.616*平均绩点\\logit（\hat{P}（Y\le 2））&=&4.30–1.05*PARED–（-0.06）*PUBLIC–0.616*GPA\结束{eqnarray}$$

在上面的输出中，我们看到

打电话，我是R（右）提醒我们运行的模型类型、指定的选项等。
接下来，我们看到了常见的回归输出系数表，其中包括每个系数的值、标准误差和t值，它只是系数与其标准误差的比值。默认情况下没有显著性测试。
接下来，我们将看到两个截距的估计值，它们有时被称为切点。截取显示了潜在变量被切割的位置，以形成我们在数据中观察到的三个组。请注意，此潜在变量是连续的。一般来说，这些都没有用于解释结果。切入点与其他统计数据包报告的阈值密切相关。
最后，我们看到了模型的剩余偏差-2*对数似然作为AIC。偏差和AIC对于模型比较都很有用。

有些人不满意没有p值。在这种情况下，计算p值的一种方法是将t值与标准正态分布进行比较，如z检验。当然，这只适用于无限自由度，但可以通过大样本进行合理近似，随着样本大小的减小，偏差会越来越大。此方法用于其他软件包，例如Stata公司首先，我们存储系数表，然后计算p值并与表合并。

##存储表
（可食用 <- 系数(总结（m） ））

##值标准误差t值##对1.04769 0.2658 3.9418##公开-0.05879 0.2979-0.1974##谷丙转氨酶0.61594 0.2606 2.3632##不太可能|有点可能2.20391 0.7795 2.8272##有点可能|很可能4.29936 0.8043 5.3453

##计算并存储p值
第页 <- pnorm（人名）(防抱死制动系统（可检测[， “t值”]), 下尾翼 = 错误的) * 2

##组合表
（可食用 <- cbind公司（可卡因， “p值” =p））

##值标准误差t值p值##对1.04769 0.2658 3.9418 8.087e-05##公开-0.05879 0.2979-0.1974 8.435e-01##gpa 0.61594 0.2606 2.3632 1.812e-02##不太可能|有点可能2.20391 0.7795 2.8272 4.696e-03##有可能|很可能4.29936 0.8043 5.3453 9.027e-08

我们还可以得到参数估计的置信区间。这些可以通过分析似然函数或使用标准误差并假设正态分布来获得。请注意，配置的CI不是对称的（尽管它们通常接近对称）。如果95%置信区间不超过0，则参数估计值具有统计显著性。

（ci） <- 限制（confint）（m） ） #默认方法提供配置的CI

##正在等待完成分析。。。

##          2.5 % 97.5 %##对0.5282 1.5722##公众-0.6522 0.5191##平均绩点0.1076 1.1309

限制.默认（米） #假设正常的CI

##          2.5 % 97.5 %##对0.5268 1.569##公众-0.6426 0.525##gpa 0.1051 1.127

两者的CI削好的和普通合伙人不包括0；公众的做。输出中的估计值以有序逻辑为单位给出，或有序对数赔率。所以对于削好的，我们可以说，如果增加一个单位削好的（即从0增加到1），我们预计的预期值应用在对数优势标度上，假设模型中的所有其他变量保持不变。对于普通合伙人，我们可以说，如果增加一个单位普通合伙人，我们预计应用在对数优势标度中，假设模型中的所有其他变量保持不变。

模型中的系数可能有点难以解释，因为它们是根据对数进行缩放的。解释逻辑回归模型的另一种方法是将系数转换为优势比。为了得到OR和置信区间，我们只需对估计值和置信区间进行指数化。

##优势比
经验(系数（m） ）

##削减公共gpa## 2.8511 0.9429 1.8514

##OR和CI
经验(cbind公司(或 = 系数（m） ，ci））

##或2.5%97.5%##对2.8511 1.6958 4.817##公开0.9429 0.5209 1.681##gpa 1.8514 1.1136 3.098标准

这些系数被称为比例比值比，我们可以像解释二进制的比值比一样解释这些系数逻辑回归。

解释比值比

根据概率的定义和概率的方向，对比值比有许多等价的解释。有关详细理由，请参阅如何解释R中有序逻辑回归的系数？这个(*)下面的符号表示这些选项中最简单的解释。

父母教育

(*)适用于家长做了上大学的几率更多可能（即。，非常或有点可能与不可能）申请人数是父母没有上过大学的学生的2.85倍，其他所有变量保持不变。
对于父母这样做的学生不上大学的几率较少的可能适用（即。，不可能的与一些或很可能）相比，这是父母上过大学的学生的2.85倍，所有其他变量保持不变。

学校类型

对于公立学校的学生来说更多可能（即。，非常或有点可能与不可能）申请人数比私立学校学生低5.71%（即（1-0.943）x 100%），其他所有变量保持不变。
- (*)对于私立学校的学生来说更多在所有其他变量（正比值比）不变的情况下，适用的可能性是公立学校学生的1.06倍（即1/0.943）。
对于私立学校的学生来说更少可能适用（即。，不可能的与有点或很可能的）相比，比公立学校学生低5.71%，保持所有其他变量不变。
- 对于公立学校的学生来说更少可能适用的是私立学校学生的1.06倍，所有其他变量（正比值比）保持不变。

平均绩点

(*)每台机组在里面折痕在学生的GPA中更多可能适用(非常或有点可能性与不可能性）相乘1.85倍（即增加85%），保持所有其他变量不变。
每台机组减少在学生的GPA中较少的可能适用(不可能的与一些或很可能的）相乘1.85倍，保持所有其他变量不变。

比例赔率假设

序数逻辑（和序数概率）回归的一个假设是，每对结果组之间的关系是相同的。换言之，序数逻辑回归假设，描述响应变量最低类别与所有较高类别之间关系的系数与描述下一个最低类别与全部较高类别之间的关系的系数相同，等等。这称为比例优势假设或平行回归假设。由于所有成对组之间的关系相同，因此只有一组系数。

如果不是这样，我们需要在模型中使用不同的系数集来描述每对结果组之间的关系。因此，为了评估我们模型的适当性，我们需要评估比例优势假设是否成立。在一些软件包中可以使用统计测试来实现这一点。然而，这些测试因倾向于拒绝零假设（即系数集相同）而受到批评，因此表明在假设成立的情况下，平行斜率假设不成立（见Harrell 2001年第335页）。我们无法在R中找到一个设施来执行通常用于测试平行坡度假设的任何测试。然而，哈雷尔确实推荐了一种评估平行性的图形方法斜率假设。此图中显示的值本质上是来自logit模型的（线性）预测，用于建模y大于或等于给定值的概率（对于y的每个级别），一次使用一个预测器（x）变量。为了创建此图，您需要Hmisc公司库。

下面的代码包含两个命令（第一个命令位于多行上），用于创建此图以测试比例优势假设。基本上，我们将使用单个预测因子绘制单个逻辑回归的预测逻辑图，其中结果组由apply>=2和apply>=3定义。如果不同预测级别的预测值之间的差异，例如削好的如果结果定义为apply>=2或apply>=3，则我们可以确信比例优势假设成立。换句话说，如果削好的=0和削好的当结果为应用>=2时，=1与结果为应用>=3时的差异相同，那么比例赔率假设可能成立。

第一个命令创建用于估计将要绘制的值的函数。该命令的第一行告诉R平方英尺是一个函数，这个函数带有一个参数，我们将其标记为y平方英尺函数将计算大于或等于目标变量每个值的对数概率。出于我们的目的，我们希望应用的对数概率大于或等于2，然后大于或等于3。根据因变量中类别的数量和变量的编码可能必须编辑此功能。下面的功能配置用于年变量有三个级别，1、2、3。如果因变量有4个级别，标记为1、2、3、4，则需要添加‘Y>=4’=qlogis（平均值（Y>=4））（去掉引号）在第一组括号内。如果因变量的编码是0、1、2而不是1、2、3，则需要编辑代码，将1的每个实例替换为0，将2替换为1，依此类推平方英尺我们找到的函数希腊语函数，它将概率转换为logit。因此，我们基本上将大于2或3的应用概率输入到qlogis公司，它将返回这些概率的logit变换。在内部qlogis公司函数，我们需要y>=2。当我们提供y参数时，例如应用，以运行平方英尺,y>=2将计算为0/1（FALSE/TRUE）向量，取该向量的平均值将得到应用于>=2的比例或概率。

下面的第二个命令调用函数平方英尺由预测因子定义的数据的几个子集。在本声明中，我们看到总结函数，并将公式作为第一个参数提供。当R看到呼叫总结通过公式参数，它将按公式右侧的组计算公式左侧变量的描述性统计信息，并将结果返回到一个漂亮的表中。默认情况下，总结将计算左侧变量的平均值。所以，如果我们使用了代码摘要（作为数字（应用）~pared+public+gpa）没有乐趣论证中，我们将通过pared，然后通过public，最后通过gpa将应用分成4个相等的组。然而，我们可以通过提供我们自己的函数来覆盖平均值的计算，即平方英尺到有趣=参数。最后一个命令要求R将内容返回给对象秒，这是一张桌子。

平方英尺 <- 功能(年) {
  c（c）('Y>=1' = qlogis公司(意思是（年） >= 1)),
    “Y>=2” = qlogis公司(意思是（年） >= 2)),
    “Y>=3” = qlogis公司(意思是（年） >= 三)))
}

（个） <- 具有（日期：， 总结(as.数字（适用） ~ 削好的 + 公众的 + 平均绩点， 乐趣=平方英尺））

##作为数字（应用）N=400## ## +-------+-----------+---+----+--------+------+##||N|Y>=1|Y>=2|Y>=3|## +-------+-----------+---+----+--------+------+##|pared |否|337|Inf|-0.37834|-2.441|##||是|63|Inf|0.76547|-1.347|## +-------+-----------+---+----+--------+------+##|公共|否|343|Inf|-0.20479|-2.345|##||是|57|Inf|-0.17589|-1.548|## +-------+-----------+---+----+--------+------+##|gpa|[1.90,2.73）|102|Inf|-0.39730|-2.773|##||[2.73,3.00）|99|Inf|-0.26415|-2.303|##||[3.00,3.28）|100|Inf|-0.20067|-2.091|##||[3.28,4.00]|99|Inf|0.06062|-1.804|## +-------+-----------+---+----+--------+------+##|整体||400|Inf|-0.20067|-2.197|## +-------+-----------+---+----+--------+------+

上表显示了如果我们回归我们的（线性）预测值因变量取决于我们的预测变量，一次一个，没有平行坡度假设。我们可以通过运行一系列二元逻辑回归，在因变量上具有不同的割点，并检查割点之间的系数相等。因此，我们放宽平行斜率假设，以检查其成立性。为了实现这一点，我们将原始的序数因变量转换为一个新的二进制因变量，如果原始的序因变量（此处应用)小于某个值一，如果是序数变量大于或等于一（注意，这是序数回归模型系数也表示）。这是针对k-1级的序数变量，并由作为数字（应用）>=一编码如下。第一行代码估计了削好的选择“不太可能”应用与“有点可能”或“很可能”。第二行代码估计了削好的选择“不太可能”或“有点可能”申请与“很可能”申请。查看此模型的截距（-0.3783），我们发现它与单元格中的预测值削过的当Y>=1时，等于列中的“no”，当Y>=1时，等于其下的值削好的等于“是”等于截距加上系数削好的（即-0.3783+1.1438=0.765）。

glm公司(我(as.数字（适用） >= 2) ~ 削皮， 家庭=“二项式”, 数据 =日期）

## ##调用：glm（公式=I（如数字（应用）>=2）~pared，family=“二项式”，##数据=dat）## ##系数：##（截距）准备##      -0.378        1.144  ## ##自由度：总计399（即零）；398残留物##零偏差：551##剩余偏差：534 AIC:538

glm公司(我(as.数字（适用） >= 三) ~ 精简， 家庭=“二项式”, 数据 =日期）

## ##调用：glm（公式=I（如数字（应用）>=3）~pared，family=“二项式”，##数据=dat）## ##系数：##（截距）准备##       -2.44         1.09  ## ##自由度：总计399（即零）；398残留物##零偏差：260##剩余偏差：252 AIC:256

我们可以使用此表中的值来帮助我们评估比例赔率假设对我们的模型来说是合理的。（注：，下面和上面都复制了该表。）例如，当削好的是等于“否”应用的预测值之间的差值大于或等于2和apply大于或等于3大约是2（-0.378–-2.440=2.062）。对于削好的等于“是”，应用较大值的预测值之差大于或等于2且应用大于或等于3也大致为2（0.765–-1.347=2.112）。这表明平行斜率假设是合理的（这些差异是下图所示的）。将我们的注意力转向公众的预测作为预测变量，我们可以看到公众的设置为“否”应用大于或等于2的预测，与应用大于或大于3约为2.14（-0.204–-2.345=2.141）。什么时候？公众的设置为“是”系数之间的差值约为1.37（-0.175–-1.547=1.372）。这个两组系数之间的距离差异（2.14对1.37）可能表明平行斜率假设不适用于预测器公众的.那个这表明上公立学校与私立学校的效果不同从“不太可能”到“有点可能”以及从“有点可能性”到“非常可能”的转变

下面的plot命令告诉R，我们要绘制的对象是秒.命令其中=1:3是一个值列表，指示y的级别应包含在情节。如果因变量有三个以上的水平，则需要将3更改为数类别（例如，四个类别为四个变量，即使其编号为0、1、2、3）。命令pch=1:3选择要使用的标记，和是可选的，如下所示xlab=“登录”其中标记了x轴，和main=“”将图形的主标签设置为空白。如果比例优势假设成立，对于每个预测变量，每一组从属类别的符号之间的距离变量，应保持类似。为了帮助证明这一点，我们将所有第一个系数集为零，因此有一个公共参考点。看变量的系数削好的我们可以看到两组系数相似。相反，距离在估计值之间公众的不同（即标记很多第二行比第一行相隔更远），表明比例赔率假设可能不成立。

s[， 4] <- s[， 4] - s[， 三]
s[， 三] <- s[， 三] - s[， 三]
秒 #打印

##作为数字（应用）N=400## ## +-------+-----------+---+----+----+------+##||N|Y>=1|Y>=2|Y>=3|## +-------+-----------+---+----+----+------+##|pared |否|337|Inf|0|-2.062|##||是|63|Inf|0|-2.113|## +-------+-----------+---+----+----+------+##|公共|否|343|Inf|0|-2.140|##||是|57|Inf|0|-1.372|## +-------+-----------+---+----+----+------+##|gpa|[1.90,2.73）|102|Inf|0|-2.375|##||[2.73,3.00）|99|Inf|0|-2.038|##||[3.00,3.28）|100|Inf|0|-1.890|##||[3.28,4.00]|99|Inf|0|-1.864|## +-------+-----------+---+----+----+------+##|整体||400|Inf|0|-1.997|## +-------+-----------+---+----+----+------+

情节（s，）， 哪一个=1:三, 多氯联苯=1:三, xlab公司=“logit”, 主要的=' ', xlim公司=范围（s[，三:4]))

一旦我们评估完我们模型的假设是否成立，我们可以得到预测的概率，这通常更容易了解系数或比值比。例如，我们可以改变gpa公司对于每个级别削好的和公众的并计算处于每个应用类别中的概率。我们通过创建新的要用于预测的所有值的数据集。

新数据 <- 数据帧(
  削过的 = 代表(0:1, 200),
  公众的 = 代表(0:1, 每个 = 200),
  普通合伙人 = 代表(序列(从 = 1.9, 到 = 4, 长度.out = 100), 4))

新数据 <- cbind公司（新日期， 预测（m，新日期， 类型 = “问题”))

##显示前几行
头（新日期）

##削减公共gpa不太可能有点可能非常可能## 1     0      0 1.900   0.7376          0.2205     0.04192## 2     1      0 1.921   0.4932          0.3946     0.11221## 3     0      0 1.942   0.7325          0.2245     0.04299## 4     1      0 1.964   0.4867          0.3985     0.11484## 5     0      0 1.985   0.7274          0.2285     0.04407## 6     1      0 2.006   0.4802          0.4023     0.11753

现在，我们可以用重塑2打包并打印不同条件下的所有预测概率。我们绘制预测的概率，用一条线连接，用结果的级别着色，应用，并按级别分面削好的和公众的。我们还使用自定义标签功能，添加更清晰的标签，显示每列和每行的内容图表示的。

lnewdat（新数据） <- 熔化（新日期， 标识.vars = c（c）(“已修剪”, “公共”, “gpa”),
  变量名称 = “级别”, 值名称=“概率”)
##查看前几行
头（新数据）

##公共gpa水平概率##1 0 0 1.900不太可能0.7376##2 1 0 1.921不太可能0.4932##3 0 0 1.942不太可能0.7325##4 1 0 1.964不太可能0.4867##5 0 0 1.985不太可能0.7274##6 1 0 2.006不太可能0.4802

ggplot图（lnewdat， 原子发射光谱(x个 =gpa， 年 =概率， 颜色 =级别） +
  地理线() + 面_网格（已修剪 ~ 公众， 贴标机=“标签_两者”)

需要考虑的事项

完美预测：完美预测意味着预测变量的一个值是仅与响应变量的一个值关联。如果是这样发生这种情况时，Stata通常会在输出的顶部发出注释删除案例以便模型可以运行。
样本量：订购物流和订购probit，使用最大似然估计需要足够的样本量。有多大大是一个有争议的话题，但它们几乎总是需要比OLS回归更多的案例。
空单元格或小单元格：您应该检查是否为空或小单元格通过在分类预测因子和结果变量。如果一个细胞只有很少的病例模型可能变得不稳定或根本无法运行。
伪R平方：找不到R平方的精确模拟在OLS中。伪R平方有很多种版本。请参阅Long和Freese 2005，了解更多细节和各种解释伪R平方。
诊断：对非线性模型进行诊断很困难，有序logit/probit模型甚至比二进制模型更困难。有关逻辑回归模型诊断的讨论，请参见Hosmer和Lemeshow（2000年，第5章）。注意，逻辑回归的诊断与概率回归的诊断类似。

工具书类

Agresti，A.（1996）分类数据简介分析纽约：John Wiley&Sons，Inc
Agresti，A.（2002）分类数据分析，第二版新泽西州霍博肯：John Wiley&Sons，Inc。
哈雷尔，F.E（2001）回归建模策略纽约：Springer-Verlag。
廖天凤（1994）解释概率模型：Logit、Probit和其他广义线性模型加利福尼亚州千橡树市：Sage Publications，Inc。
Powers，D.和Xie，Yu。分类数据分析的统计方法。英国宾利：Emerald Group Publishing Limited。