-
2 $\开始组$ 这回答了你的问题吗? GLM家族代表响应变量或残差的分布? $\端组$ – kjetil b halforsen公司 ♦ 评论 5月20日18:00 -
1 $\开始组$ 这个问题同时提出了许多问题。 1) 首先,对于OLS,残差也不是i.i.d。例如,想象一下大小为2的样本的平均值和残差。 2) GLM不建模误差项,而是建模分布。 误差项,在加性意义上,是高斯噪声的一种。 $\端组$ – 塞克斯都·恩披里柯 评论 5月20日19:53 -
$\开始组$ 可能有用: stats.stackexchange.com/search? q=考克斯+斯奈尔 $\端组$ – 塞克斯都·恩披里柯 评论 5月20日19:56 -
2 $\开始组$ 这一特殊情况可能会阐明一般问题: 为什么我们在线性回归中建模噪声,而不是在逻辑回归中建模? $\端组$ – 斯蒂芬·科拉萨 评论 5月20日21:06
4个答案
-
$\开始组$ 谢谢你的回答。 深入研究这一点使我意识到,即使对于简单的线性回归,我也有很多不理解或错误理解的地方。 不过,你的回答确实澄清了很多问题。 我不熟悉你在上一段中提到的所有变换,我意识到“变换”可能有一个我不知道的特定技术意义。 然而,我有一个非常基本的问题。 链接功能的目的是什么? 在我看来,线性模型很有用,因为正态分布具有可加性(其余部分将在下一条评论中介绍)。 $\端组$ 评论 5月20日20:54 -
$\开始组$ 可以按不同比例(系数)添加不同变量(X)的影响,并再现观测变量Y的分布。然而,这与其他分布不适用。 我认为使用link函数是解决这个问题的一种方法。 例如,取0到1之间的比值logit,得到正态分布值,如果取计数数据log,结果也是一样的。 然后你可以用一个线性模型,也就是一个正态分布变量的总和,对这个新的,某种正态分布的变量进行建模。 我错过了什么? $\端组$ 评论 5月20日20:54 -
$\开始组$ “例如,你取0到1之间的比值的logit,得到正态分布值,如果你取计数数据的log,结果也是如此。”——你应该解释一下是什么导致你认为这两件事会是这样。 这两种说法都不是真的,我已经在最后一段的前两句话中直接说过,它们产生的前提在我的回答中是错误的。, 而最后一句是解释原因。 我会考虑如何更详细地解释它。 $\端组$ – 格伦_b 评论 5月20日23:10 -
1 $\开始组$ @Boussens-DumonGrégoire关系是任何关系。然而,链接函数允许特定类型的非线性进入模型。 例如,如果逻辑回归模型是正确的,特征与条件期望之间的关系是非线性的。 然而,特征和转换后的条件期望之间的关系是线性的。 $\端组$ – 戴夫 评论 5月21日15:21 -
$\开始组$ @Glen_b我想我在被教给我的时候理解错了。老实说,我对你最后一段的内容一无所知。 我会在互联网上看到所有这些转变是什么,但现在我不知道它们意味着什么,也不知道其中一个比另一个弱或强。 我正在阅读GLM的维基百科页面,这里是另一个尝试。 链接函数的目的只是将非线性关系(E(Y)和预测器之间的关系)转换为线性关系,并满足E(Y|X)假设的分布假设吗? $\端组$ 评论 5月21日18:48
-
$\开始组$ 我想我理解你的二项式分布示例。 您希望拟合值为0或1。 因此,如果观察值为1,则误差将为0或负值,如果为0,则误差为0或正值。 因此,误差的分布取决于拟合值。 你能给我举一个例子吗,为什么我们对连续分布(例如伽玛分布)有同样的问题? $\端组$ 评论 5月20日17:38 -
$\开始组$ 此外,当您使用logit kink函数时,您将从[0-1]中包含的离散分布变为连续无界分布。 如果您尝试在logit尺度上拟合数据(估计$\text{logit}(y_i)$),那么您的错误也没有界限,因此您的模型中不能有一个iid的错误项吗? $\端组$ 评论 5月20日17:45 -
$\开始组$ @Boussens-DumonGrégoire在您的第二条评论中,您一直在谈论“分发”。 你指的是什么发行版? 注意,如果我取任何$\text{二项式}(n,p)$分布,然后从中减去$p$,则该分布仍然是离散的。 事实上,可以根据样本大小猜测$n$和$p$。 $\端组$ – 阿达莫 评论 5月20日20:24
将GLM简化为一种格式,该格式明确使用具有恶劣分布的残差,不会导致具有已知、理想属性的明显估计策略,也没有明确的方法计算置信区间或测试嵌套模型。 使用不使用残差的格式,从而得到我们从经典线性回归(高斯假设的OLS,相当于最大似然估计)中知道并喜爱的常见类型的点估计、区间估计和假设检验。
-
$\开始组$ 你好,戴夫。 谢谢你的回答。 我一整天都在看有关这方面的帖子,我的头都快要爆炸了,但我想我并没有慢慢开始理解。 有一件事我还不确定。 假设$Y|X$的分布是Gamma。 那么$g(Y|X)$的分布是什么? $\端组$ 评论 5月20日22:55 -
-
-
-
1
-
$\开始组$ 谢谢你的编辑。 还有很多事情我很困惑,哈哈。 0和1的logit显然不正常,但我认为在二元回归中,logit函数是按概率应用的,而不是直接应用于0和1。 当你生成一个0到1之间的数字向量并对这些数字应用logit函数时,你得到的值的分布实际上是正态的。 因此,通过将逆对数函数应用于正态分布的预测值,您应该能够获得估计的几率,从中可以得出Y的估计值,对吗? $\端组$ 评论 5月20日18:02 -
$\开始组$ @Boussens-DumonGrégoire,考虑我制作的二进制Y,二进制X的例子。 观察到的两个比例分别为0.2$和0.05$。 logits为-1.386294$和-2.944439$。 它们不是正态分布的。 $\端组$ 评论 5月20日18:05