-
5 $\开始组$ 比较常客$95\%$置信区间和贝叶斯$95\%$可信区间的含义可能有助于理解报价中固有的简化。 $\端组$ – 亨利 评论 4月7日12:27 -
1 $\开始组$ 在贝叶斯统计中,你认为数据是随机的还是固定的并不重要。 重要的是你要根据观察到的值设定条件,这在数学上等同于说它们是常数。 另一方面,重复实验时,频率专家的决定必须在95%的时间内正确。 为了推导或验证决策规则,您必须考虑重复实验的可能性:为此,您必须将数据视为随机变量。 只有建立了一般规则,才能将其应用于观察值。 $\端组$ – 雅克 评论 4月8日15:42 -
1 $\开始组$ 我的教授举了一个问题的例子,在他看来,这个问题只适用于贝叶斯方法:不知道柏拉图所有六部主要著作的出版顺序。 但有一两个是众所周知的,他的写作风格也有明显的转变。 因此,你可以使用所有常用的趋势估计来建议排名,但量化你对排名的信心只需要贝叶斯思维。 一个经常光顾的人不可能真正谈论无数的柏拉图,因为柏拉图出版了6本书,在写作风格上没有明显的趋势。 $\端组$ – 阿达姆 评论 4月8日19:53 -
1 $\开始组$ @亚当:我们可以谈论柏拉图的假设人口。 这很像苏格拉底的方法。 你从一个假设的信念开始,然后根据显示不一致的对话(或基于数据的统计数据)来伪造它。 此外,贝叶斯方法也像频率计方法一样使用数据分布的思想。 否则,该方法没有计算后验概率的似然函数。 似然函数是概率的函数,这就好比考虑了无数的柏拉图。 $\端组$ – 塞克斯都·恩披里柯 评论 4月8日20:11 -
$\开始组$ @亚当:我还认为,贝叶斯统计只有在遵循常客解释的情况下才是合理的:如果你考虑一组事件,你给出的概率为0.9为真,而平均而言,一个非常不同的比例是真的。。。 我真的希望你的事先影响我的推理吗? 为什么我会在乎你的后天信仰? 你只需要将你正在考虑的一个度量的集合作为轴心点,你就可以让频繁者的解释成为贝叶斯观点中理性信念的一个要求。 $\端组$ – Cliff AB公司 评论 4月9日5时16分
7个答案
在贝叶斯分析中,数据同样被认为是随机的,否则在贝叶斯定理中使用似然还有什么意义? 在频率分析中,参数也可以被视为随机变量。 (例如,可以使用先验来最小化置信区间长度的期望值)
可信区间将通过考虑 $\θ$ 鉴于 X美元$ 并考虑了节理分布的水平切片。 对于每个值 X美元$ 边界包含95%的潜在值 $\θ$ . 置信区间将通过考虑 X美元$ 鉴于 $\θ$ 并考虑了节理分布的垂直切片。 对于每个值 $\θ$ 边界包含95%的潜在值 X美元$
-
$\开始组$ 我想我有主意了。 频率计中的置信区间由$P(X |θ)$(或垂直线)导出 秒 )所以我们说“参数是固定的;数据是随机的”。 贝叶斯公式中的可信区间由$\pi(\theta|x)$(或 一 水平线),所以我们说“参数是随机的,数据是固定的”。 如果我想在获得观察值$x$后得到置信区间,我应该画一条水平线,并找到第一个图中两条红线所限定的$\theta$的相应范围。 我说得对吗? 此外,我不太理解你的第二个情节。 你能解释一下吗? $\端组$ – 肯·T 评论 4月9日18:07 -
1 $\开始组$ @肯特 ·置信区间由P(X|θ)导出。 可信区间由P(θ|x)导出” 这是一个很好的简洁描述。 (虽然它们是由这些不同的表达式派生出来的,但这并不一定意味着它们认为X或θ是内在固定的,只有在使用的表达式中,参数才是固定的。) $\端组$ 评论 4月9日19:10 -
1 $\开始组$ 我会看看能否更好地解释第二张图。 目前,假设一个观察值为$\bar{x}=1$,则间隔基于$\theta$的值,其中边界线穿过值$\bar}=1$。 请参阅此处的另一幅插图: 置信区间:如何正式处理$P(L(\textbf{X})\leq\theta,U(\textbf{X{)\geq\theda)=1-\alpha$ $\端组$ 评论 4月9日19:18 -
$\开始组$ 这类图的另一个例子是: stats.stackexchange.com/a/351330 值得注意的是,最后几段提到: “在垂直方向,你可以看到假设测试” 和 ·在水平方向,你可以看到Clopper-Pearson置信区间。 “ 。置信区间考虑θ固定的条件概率P(X|θ),但同时他们在不同的θ值范围内考虑这一点,θ可能被视为一个变量。 $\端组$ 评论 4月9日19:38
-
6 $\开始组$ 为什么贝叶斯模拟的“多重外观”不是 多种假设, 以不同的先验和不同的模型的形式表达(也许)? 难以捉摸的是,如果一个人用贝叶斯方法窥探,他可以得出表面上令人信服的后验结果,这仅仅反映了研究者在试图达到预期结果时的坚持! $\端组$ 评论 4月7日15:04 -
-
1 $\开始组$ 感谢您的回复。 我想我正在努力理解你所说的每一个“外观”的含义。我认为你可能没有进行一个公平的比较:对于连续实验,有一些频率学家的方法(源自Wald)严格控制整个实验的$\alpha$。 因此,您似乎是在对比frequentist过程的无效应用程序和Bayes过程的有效应用程序。// “视为过时”的使用尤其令人费解:毕竟,在任何数据排列下,最终的贝叶斯结果都不会相同吗? $\端组$ 评论 4月8日16:13 -
2 $\开始组$ Wald的序贯似然比检验是一种有效的方法,但它不适用于多个结果变量,也不能让你使用其他研究的先验信息。 更重要的是,它从未被临床试验界所接受,在临床试验界,分组序贯试验是一种规范,并且过分强调了$\alpha$-支出。 这涉及到对每个外观的惩罚,这与Bayes无关。 是的,在没有建模的时间趋势的情况下,贝叶斯是数据顺序依赖的,但先前计算的后验概率已过时并被忽略。 没有处罚的理由。 $\端组$ – 弗兰克·哈雷尔 评论 4月9日12:42 -
1
在阅读了一些材料后,似乎“数据是固定的”意味着观察到的数据是固定的,“数据是随机的”意味着随机变量R0是随机的。 这两种说法中的“数据”指的不是同一件事。
-
2 -
2 $\开始组$ ' 概率陈述“95%”是指用这些未来样本计算的假设置信区间(即使不可能,因此是假想的) “是一种常见的误解。 “95%”是模型关于可能样本的预采样含义,但没有重新采样 必修的 其有效性或解释。 毕竟,我们可以考虑CI方法在跨独立问题的CI方法的大量应用中的性能。 $\端组$ 评论 4月7日19:43 -
2 $\开始组$ ….一旦我们收集了样本,就不再存在随机性,因此也就不再存在抽样后的概率。 我们知道,我们计算的CI要么包含参数,要么不包含参数,但事实上,这是95%时间(给定模型)正确的过程的结果,这提供了一些信心。 现在,“95%的时间”可以指假设的重采样或跨不同问题实际重用程序,但无论是哪种方式,重采样是否可行都无关紧要,因为重采样不是CI方法的必要组成部分。 $\端组$ 评论 4月8日20:46 -
2 $\开始组$ 关于频率学家中重采样的讨论非常有趣。 我认为在频率学家方法中,重采样是不必要的。 假设我们设计了一个实验,测量1000只鸟中的10只鸟的重量,然后释放所有1000只鸟。 在这个实验中,重新采样是不可能的,但我们仍然假设鸟的重量是具有一定概率分布的随机变量的观测值。 只要它仍然是一个随机变量,频率学家的所有统计推断仍然适用。 $\端组$ – 肯·T 评论 4月9日10:13 -
2 $\开始组$ 看来我们已经达成了共识。 把它与@KenT最初的问题以及我上面的回答联系起来:假设$x$只是$x$的一个实现 基本的 对频率统计的(解释),而对贝叶斯主义者来说是无关紧要的。 $\端组$ – 杜尔登 评论 4月9日19:52
“数据是固定的”是指观测数据 x美元$ 是固定的,“数据是随机的”是指随机变量 X美元$ 是随机的。 这两种说法中的“数据”指的不是同一件事。
贝叶斯工具旨在总结参数的不确定性 $\θ$ ,取决于观测数据 x美元$ . 惯用工具旨在报告研究设计的属性,这些属性可以被视为随机变量的属性 X美元$ ……或者更典型地说,估计器的属性 $\hat\theta$ ,它本身被视为随机变量,是 X美元$ .
“数据是随机的……”(你故意选择专注于建模 给定参数值的数据 根据数据中的随机性) “…但参数是固定的。” 无论哪个值 是的)
“参数是随机的……”(它不一定是随机的,但在认知的意义上——你故意选择使用分布来总结你对参数的知识/信念) “……但数据是固定的”(不是字面上的--您经常 也 对数据有一个随机和/或认知模型——但你专注于报告后验分布,这取决于你刚刚看到的数据)