11
$\开始组$

在我看来两者都有贝叶斯和常态推理,观测数据x美元$被建模为随机变量的观测值X美元$它遵循一定的概率分布。因此,当我遇到两种说法——贝叶斯观点中的“数据是固定的”和频率主义观点中的”数据是随机的”时,我发现它们很难理解,因为它似乎暗示了对数据概念的解释存在差异。

阅读了一些资料后,似乎“数据是固定的”是指观察到的数据x美元$是固定的,“数据是随机的”是指随机变量X美元$是随机的。这两种说法中的“数据”指的不是同一件事。不确定我的解释是否正确。欢迎您的建议。如果我的解释是正确的,那么做这两个陈述是否多余/令人困惑?

编辑

两种说法的参考:-

$\端组$
8
  • 5
    $\开始组$ 比较常客$95\%$置信区间和贝叶斯$95\%$可信区间的含义可能有助于理解报价中固有的简化。 $\端组$
    – 亨利
    评论 4月7日12:27
  • 1
    $\开始组$ 在贝叶斯统计中,你认为数据是随机的还是固定的并不重要。重要的是你要根据观察到的值设定条件,这在数学上等同于说它们是常数。另一方面,重复实验时,频率专家的决定必须在95%的时间内正确。为了推导或验证决策规则,您必须考虑重复实验的可能性:为此,您必须将数据视为随机变量。只有建立了一般规则,才能将其应用于观察值。 $\端组$
    – 雅克
    评论 4月8日15:42
  • 1
    $\开始组$ 我的教授举了一个问题的例子,在他看来,这个问题只适用于贝叶斯方法:不知道柏拉图所有六部主要著作的出版顺序。但有一两个是众所周知的,他的写作风格也有明显的转变。因此,你可以使用所有常用的趋势估计来建议排名,但量化你对排名的信心只需要贝叶斯思维。一个经常光顾的人不可能真正谈论无数的柏拉图,因为柏拉图出版了6本书,在写作风格上没有明显的趋势。 $\端组$
    – 阿达姆
    评论 4月8日19:53
  • 1
    $\开始组$ @亚当:我们可以谈论柏拉图的假设人口。这很像苏格拉底的方法。你从一个假设的信念开始,然后根据显示不一致的对话(或基于数据的统计数据)来伪造它。此外,贝叶斯方法也像频率计方法一样使用数据分布的思想。否则,该方法没有计算后验概率的似然函数。似然函数是概率的函数,这就好比考虑了无数的柏拉图。 $\端组$ 评论 4月8日20:11
  • $\开始组$ @亚当:我还认为,贝叶斯统计只有在遵循常客解释的情况下才是合理的:如果你考虑一组事件,你给出的概率为0.9为真,而平均而言,一个非常不同的比例是真的。。。我真的希望你的事先影响我的推理吗?为什么我会在乎你的后天信仰?你只需要将你正在考虑的一个度量的集合作为轴心点,你就可以让频繁者的解释成为贝叶斯观点中理性信念的一个要求。 $\端组$ 评论 4月9日5时16分

7个答案7

重置为默认值
15
$\开始组$

链接引用中“data are fixed”或“parameters are ficked”表达式的用法不应按字面意思理解。

  • 在贝叶斯分析中,数据同样被认为是随机的,否则在贝叶斯定理中使用似然还有什么意义?
  • 在频率分析中,参数也可以被视为随机变量。(例如,可以使用先验来最小化置信区间长度的期望值)

不同之处在于,在计算区间时,他们考虑了数据和参数联合分布的不同边际分布。这不是频率与贝叶斯的对比,而是可信区间与基准/置信区间的对比。

你可以从这个问题的图中看到这种差异的例子有没有贝叶斯可信区间明显低于频率置信区间的例子

Wasserman示例

图像考虑了参数的联合分布$\θ$和数据X美元$.

  • 可信区间将通过考虑$\θ$鉴于X美元$并考虑了节理分布的水平切片。对于每个值X美元$边界包含95%的潜在值$\θ$.

  • 置信区间将通过考虑X美元$鉴于$\θ$并考虑了节理分布的垂直切片。对于每个值$\θ$边界包含95%的潜在值X美元$

正是这种条件与被描述为“固定”的参数或数据有关。贝叶斯可信区间考虑了$\θ$给定的固定值为X美元$。频率学家置信区间考虑了X美元$给定的固定值为$\θ$(实际上,区间考虑了许多此类固定值,区间是值的集合$\θ$其中数据的样本分布X美元$具有与观测数据一致的某些属性)。

由于这种调节,如果数据是某个值,则区间的覆盖概率将根据我们是否考虑覆盖而不同X美元$或参数为某一值时的覆盖范围$\θ$.

为什么95%置信区间(CI)并不意味着95%的概率包含平均值?


回顾我以前的一些回答,我注意到我也用了“fixed”这个短语。这是对这个问题的回答:如果可信区间具有平坦的先验,95%的置信区间是否等于95%的可信区间?

在这个答案中,我利用下面的图像描述了数据指数分布和参数均匀先验的示例情况下可信区间和置信区间的构造之间的差异。

这并不是说数据或参数必须被认为是真正固定的,而是间隔与条件分布的计算有关,其中一个(数据/参数)是在另一个(参数/数据)固定的基础上计算的。

可信区间和置信区间之间的差异

为什么这些问题都是针对置信区间而不是可信区间?在参数固定的情况下进行计算有什么意义?

由于频率计置信区间依赖于参数的计算条件,因此其优点可以独立于关于该参数分布的假设。

(尽管在概率的概念上可能存在哲学上的差异,但使用频率置信区间的统计学家并不一定认为参数是固定的。更重要的是,统计学家不需要使用任何关于参数分布的假设。)

$\端组$
4
  • $\开始组$ 我想我有主意了。频率计中的置信区间由$P(X |θ)$(或垂直线)导出)所以我们说“参数是固定的;数据是随机的”。贝叶斯公式中的可信区间由$\pi(\theta|x)$(或水平线),所以我们说“参数是随机的,数据是固定的”。如果我想在获得观察值$x$后得到置信区间,我应该画一条水平线,并找到第一个图中两条红线所限定的$\theta$的相应范围。我说得对吗?此外,我不太理解你的第二个情节。你能解释一下吗? $\端组$
    – 肯·T
    评论 4月9日18:07
  • 1
    $\开始组$ @肯特·置信区间由P(X|θ)导出。可信区间由P(θ|x)导出”这是一个很好的简洁描述。(虽然它们是由这些不同的表达式派生出来的,但这并不一定意味着它们认为X或θ是内在固定的,只有在使用的表达式中,参数才是固定的。) $\端组$ 评论 4月9日19:10
  • 1
    $\开始组$ 我会看看能否更好地解释第二张图。目前,假设一个观察值为$\bar{x}=1$,则间隔基于$\theta$的值,其中边界线穿过值$\bar}=1$。请参阅此处的另一幅插图:置信区间:如何正式处理$P(L(\textbf{X})\leq\theta,U(\textbf{X{)\geq\theda)=1-\alpha$ $\端组$ 评论 4月9日19:18
  • $\开始组$ 这类图的另一个例子是:stats.stackexchange.com/a/351330值得注意的是,最后几段提到:“在垂直方向,你可以看到假设测试”·在水平方向,你可以看到Clopper-Pearson置信区间。。置信区间考虑θ固定的条件概率P(X|θ),但同时他们在不同的θ值范围内考虑这一点,θ可能被视为一个变量。 $\端组$ 评论 4月9日19:38
11
$\开始组$

不,他们不是在谈论同一件事。这在连续实验中很容易看到,其中频率统计需要$\alpha美元$(类型I断言概率)对多个数据外观的惩罚,因为多个外观为数据极端化提供了更多机会(p值较低)。使用贝叶斯,数据是有条件的,每看一眼,你就会根据当前的累积数据计算出积极影响的概率。这些后验概率的含义在多次观察的过程中并没有改变,过去的数据只是被认为是过时的,当前的累积数据覆盖了你之前所知道的一切。

$\端组$
5
  • 6
    $\开始组$ 为什么贝叶斯模拟的“多重外观”不是多种假设,以不同的先验和不同的模型的形式表达(也许)?难以捉摸的是,如果一个人用贝叶斯方法窥探,他可以得出表面上令人信服的后验结果,这仅仅反映了研究者在试图达到预期结果时的坚持! $\端组$
    – 沃伯
    评论 4月7日15:04
  • $\开始组$ 不,这是对同一件事的多次重复分析。所以只有一个先验,只有当法官有一个分析人员没有使用的具有吸收状态的先验(先验中的峰值)时,才会对放弃的结论进行抽样。细节在这里。贝叶斯序列分析仅表示将以前的分析视为过时的更新。 $\端组$ 评论 4月8日16:07
  • 1
    $\开始组$ 感谢您的回复。我想我正在努力理解你所说的每一个“外观”的含义。我认为你可能没有进行一个公平的比较:对于连续实验,有一些频率学家的方法(源自Wald)严格控制整个实验的$\alpha$。因此,您似乎是在对比frequentist过程的无效应用程序和Bayes过程的有效应用程序。//“视为过时”的使用尤其令人费解:毕竟,在任何数据排列下,最终的贝叶斯结果都不会相同吗? $\端组$
    – 沃伯
    评论 4月8日16:13
  • 2
    $\开始组$ Wald的序贯似然比检验是一种有效的方法,但它不适用于多个结果变量,也不能让你使用其他研究的先验信息。更重要的是,它从未被临床试验界所接受,在临床试验界,分组序贯试验是一种规范,并且过分强调了$\alpha$-支出。这涉及到对每个外观的惩罚,这与Bayes无关。是的,在没有建模的时间趋势的情况下,贝叶斯是数据顺序依赖的,但先前计算的后验概率已过时并被忽略。没有处罚的理由。 $\端组$ 评论 4月9日12:42
  • 1
    $\开始组$ 感谢您的解释和澄清,非常感谢。 $\端组$
    – 沃伯
    评论 4月9日13:01
11
$\开始组$

我想他们的意思(引用你的资料可能会有所帮助)是贝叶斯推断涉及以观测数据为条件的后验概率。频繁推理通常仅以部分观察数据为条件(如果有的话)。尽管在随机测试中需要注意数据被认为是固定的,而实验治疗的分配是随机的。

我不确定用贝叶斯推断说“数据是固定的”是否特别有用。正如你所指出的,数据生成过程仍然有一个概率模型需要规定;不同于其他事物的说法固定的例如,回归模型中的预测因子,其值是来自抽样还是由实验者设定都无关紧要。对于“数据是随机的”w.r.t.频率学家的推断,仔细的讨论区分了数据作为潜在观测值(随机变量)&数据作为实际观察(其实现)-考虑例如。估计器估计.

正如@Henry所指出的那样,在对比贝叶斯分析与频率分析结果的解释所涉及的概率和c时,这可能是最有意义的。在置信区间内,什么是固定的,什么是随机的?在H.P.D.间期?杜登的回答解释得很好。

$\端组$
11
$\开始组$

在阅读了一些材料后,似乎“数据是固定的”意味着观察到的数据是固定的,“数据是随机的”意味着随机变量R0是随机的。这两种说法中的“数据”指的不是同一件事。

这并不完全正确,这个短语的意思是更像是在开玩笑,而不是在字面上。

为什么在Frequentist的观点中数据是随机的?

Frequentist和Bayesian都同意他们的模型假设数据是由一些随机过程生成的,例如$X\sim N(\mu,\sigma)$。在常客世界中,这是只有随机性的来源,因为它被认为$\亩$,美元\西格玛$只是未知但固定的值。因此,统计数据处理的是如何理解随机性,而从Frequentist的角度来看,唯一的随机性是X美元$.

为什么从贝叶斯的角度来看数据是固定的?

贝叶斯观点的不同之处在于它愿意考虑$\亩$,美元\西格玛$也是随机变量。而与此同时X美元$在知道这个值之前,人们认为它是一个随机变量,现在观察到它不再是随机的:掷硬币的结果是随机的,但掷硬币砸到头部的结果不是随机的。因此,一旦你观察了你的数据,剩下的唯一随机性就是感兴趣的参数的不确定性。

用一种更明确的方式来表述这一点:“Frequentist和Bayesian的观点都认为数据在被知道之前是随机的,但只有Bayesia认为感兴趣的参数的值仍然是随机的。”但听起来并不那么可爱。

$\端组$
1
  • $\开始组$ “贝叶斯观点的不同之处在于,它愿意将𝜇、𝜎也视为随机变量。“这是正确的,但我想补充一点说明:常客们将概率理解为可观察结果频率的一个极限。另一方面,贝叶斯主义者将概率理解得更广泛,因为它是一种对主观信息进行编码的方式(w.r.t.可用信息)不确定性。Bayesian根据参数值的可用信息进行推理,而Frequentist根据保证95%正确的通用算法进行推理。 $\端组$
    – 雅克
    评论 4月8日15:38
6
$\开始组$

在贝叶斯统计和频率统计中,您的现在的样品x美元$固定而有潜力其他样品(即。,未来实现X美元$)都是随机的。

频率学家依靠重采样的思想来解释估计量和测试统计的概率特性。以置信区间为例:它们是从样本中计算出来的,因此它们的随机性来源于X美元$.对于给定的样本$X=X$另一方面,它们是固定的;是否包含true参数(但你无法知道是哪一个)。如果没有数据是随机的想法,“95%置信区间”的概率陈述将毫无意义。

另一方面,贝叶斯主义者并不依赖于这种结构。可信区间的概率陈述是指你在考虑实际存在的样本后的知识。潜在的重采样X美元$不扮演任何角色,也不会影响您当前的知识状态。

$\端组$
13
  • 2
    $\开始组$ (+1)说得很好。可以比照说,估值和测试也是如此。 $\端组$ 评论 4月7日15:59
  • 2
    $\开始组$ '概率陈述“95%”是指用这些未来样本计算的假设置信区间(即使不可能,因此是假想的)“是一种常见的误解。“95%”是模型关于可能样本的预采样含义,但没有重新采样必修的其有效性或解释。毕竟,我们可以考虑CI方法在跨独立问题的CI方法的大量应用中的性能。 $\端组$ 评论 4月7日19:43
  • 2
    $\开始组$ ….一旦我们收集了样本,就不再存在随机性,因此也就不再存在抽样后的概率。我们知道,我们计算的CI要么包含参数,要么不包含参数,但事实上,这是95%时间(给定模型)正确的过程的结果,这提供了一些信心。现在,“95%的时间”可以指假设的重采样或跨不同问题实际重用程序,但无论是哪种方式,重采样是否可行都无关紧要,因为重采样不是CI方法的必要组成部分。 $\端组$ 评论 4月8日20:46
  • 2
    $\开始组$ 关于频率学家中重采样的讨论非常有趣。我认为在频率学家方法中,重采样是不必要的。假设我们设计了一个实验,测量1000只鸟中的10只鸟的重量,然后释放所有1000只鸟。在这个实验中,重新采样是不可能的,但我们仍然假设鸟的重量是具有一定概率分布的随机变量的观测值。只要它仍然是一个随机变量,频率学家的所有统计推断仍然适用。 $\端组$
    – 肯·T
    评论 4月9日10:13
  • 2
    $\开始组$ 看来我们已经达成了共识。把它与@KenT最初的问题以及我上面的回答联系起来:假设$x$只是$x$的一个实现基本的对频率统计的(解释),而对贝叶斯主义者来说是无关紧要的。 $\端组$
    – 杜尔登
    评论 4月9日19:52
6
$\开始组$

OP说:

“数据是固定的”是指观测数据x美元$是固定的,“数据是随机的”是指随机变量X美元$是随机的。这两种说法中的“数据”指的不是同一件事。

这是一个非常合理的思考方式。

  • 贝叶斯工具旨在总结参数的不确定性$\θ$,取决于观测数据x美元$.
  • 惯用工具旨在报告研究设计的属性,这些属性可以被视为随机变量的属性X美元$……或者更典型地说,估计器的属性$\hat\theta$,它本身被视为随机变量,是X美元$.

不确定性/精确度的常见摘要本质上是抽样误差与你的研究设计(以及被研究的人群)相关。他们只关注“偶然的不确定性”。

我发现如果我们谈论误差幅度而不是置信区间。一种物理测量仪器在广泛使用前在实验室进行测试,并以公开的精度估计值出售:“这种厨房秤的精度在0.1克以内!”,可以仔细选择具有特定误差范围的统计研究设计:“本研究设计的样本平均值应在95%时间内真实总体平均值的0.3个单位内!”

误差幅度取决于研究设计的各个方面,例如样本大小,分层(在调查抽样中)或分块(在设计实验中)的使用,等等……但在许多简单的情况下,频繁误差幅度确实存在取决于参数值。因此,在计算误差幅度时,通常可以将参数视为固定(但未知)值。因此,常客的速记短语是:

  • “数据是随机的……”(你故意选择专注于建模给定参数值的数据根据数据中的随机性)
  • “…但参数是固定的。”无论哪个值是的)

另一方面,贝叶斯对不确定性/准确性的总结通常也解释了“认知不确定性”。我做了什么相信在我看到这个新数据集之前,我应该如何根据这些数据更新我的信念?

前面和后面都是参数知识状态的总结。因此贝叶斯的简写短语是:

  • “参数是随机的……”(它不一定是随机的,但在认知的意义上——你故意选择使用分布来总结你对参数的知识/信念)
  • “……但数据是固定的”(不是字面上的--您经常对数据有一个随机和/或认知模型——但你专注于报告后验分布,这取决于你刚刚看到的数据)

现在,通过只关注偶然的不确定性,频繁使用的工具忽略了其他合法的不确定性来源。但如果你把不同的不确定性来源分开,你可以逐一检查,确保证据链中没有薄弱环节。

如果你只提供不确定性的贝叶斯总结,你可能会更难评估随机性与不确定性之间的联系,尤其是因为贝叶斯工具将认知不确定性和随机性不确定性结合到一个联合总结中。

$\端组$
-1
$\开始组$

什么是数据?数据有各种形状和大小。但数据实际上是什么?

我的身高和体重可以测量,它们的值可以用磅秤和尺子读取。这些值可以用铅笔记录在一张纸上或在我的电脑上键入。无论如何,读数只能以有限的精度进行记录。这就是我们所说的数据,即有限精度数字。

数据是一个本体论概念。数据是真实世界的一部分。因此,数据是固定的。

概率是一个认识论概念。认识论是对知识的本质、正当性和信仰的合理性的研究。

“随机性”存在于我们的脑海中,而不是物理世界的一部分。因此,随机变量与数据是一个根本不同的概念。

$\端组$
1
  • 4
    $\开始组$ 谢谢你的建议。我并不是在问数据的一般定义,而是两种陈述中“数据”的特殊含义。但是你提到的关于数据的内容很有趣。在我看来,数据有不同的含义。有些人可能将数据指代实体的内在可测量属性,如人的身高。我认为统计数据是指实验就像一个在1000人中挑选和测量10人身高的实验。虽然一个人的身高不是随机的,但挑选过程会产生随机性。 $\端组$
    – 肯·T
    评论 4月7日11:39

你的答案

单击“发布您的答案”,表示您同意我们的服务条款并确认您已阅读我们的隐私政策.

不是你想要的答案吗?浏览标记的其他问题问你自己的问题.