37
$\开始组$

R.A.Fisher后期的贡献之一是基准区间和基准原则论点然而,这种方法远不及频率论或贝叶斯原理论那么流行。什么是基准论点,为什么没有被接受?

$\端组$
7
  • 4
    $\开始组$ 有趣的问题。斯普洛特(2000)他说:“基准概率尚未被广泛接受。这主要是因为它的无限制使用会产生矛盾。因此,强调上述使用基准概率的假设非常重要……”第77页。他还提供了关于这些矛盾的参考,例如巴纳德(1987)这篇论文被用来论证费舍尔“看到了光明”并成为了贝叶斯。 $\端组$
    – 用户10525
    评论 2012年4月24日7:48
  • $\开始组$ 我想我读过费舍尔从未真正完成过他的信托论点,或者至少从未使其保持一致。Dempster在1964年发表的一篇AMS文章中说:“我们得出的结论是,信托论点的一般形式很有吸引力,但费舍尔强加的许多限制都很尴尬或模棱两可,或许应该被取代。” $\端组$
    – 韦恩
    评论 2012年5月3日2:43
  • $\开始组$ @韦恩:邓普斯特的说法让人大开眼界。谢谢。 $\端组$ 评论 2012年5月3日8:51
  • 2
    $\开始组$ 大约35年前,当我还是斯坦福大学的研究生时(透露了我的年龄),我们有一门研讨会课程“重读费舍尔”。研讨会的标题来自一年前发表的一篇论文(可能是吉米·萨维奇的)。无论如何,参加研讨会的每个学生都必须阅读费舍尔的一篇论文并进行报告。我的论文是关于著名的贝伦斯-菲舍尔问题的。该文件突出了信托论点。我对这篇论文和这门课的记忆不像35年前那么清晰了。 $\端组$ 评论 2012年5月4日15:03
  • 1
    $\开始组$ 费舍尔于20世纪60年代在澳大利亚去世。这早在我成为一名统计学家之前。我认为费舍尔认为信托理论是完整的。我认为其他统计学家在这个问题上开了一个洞,他很难为之辩护。但如果你读过费舍尔的书,你就会知道他很固执,总是坚信自己是对的(当时肯定是这样)。我还没有看过巴纳德的论文,但我怀疑费舍尔是否放弃了信托推理,我也怀疑他是否成为了贝叶斯主义者。 $\端组$ 评论 2012年5月4日15:04

5个答案5

重置为默认值
21
+100
$\开始组$

我很惊讶你不认为我们是权威。这里有一个很好的参考:生物统计学百科全书,第2卷,第1526页;这篇题为“费雪,罗纳德·艾尔默”的文章。作者琼·费雪·博克斯(R.A.Fisher的女儿)和A.W.F.Edwards从页面第一栏的底部开始,贯穿第二栏的大部分内容

费舍尔于1930年提出了信托论点[11]。。。。争议立即出现。费舍尔提出了信托参数作为贝叶斯逆参数的替代当没有客观的先验概率时,他谴责了概率可以说。

他们继续与杰弗里斯和内曼(特别是内曼在信任区间)讨论辩论。内曼·皮尔逊(Neyman-Pearson)关于假设检验和置信区间的理论是在费舍尔(Fisher)的文章发表后于20世纪30年代提出的。接下来是一个关键的句子。

后来,在以下情况下,出现了与基准论点有关的困难由于枢轴的非一致性,需要进行多元估计。

在《生物统计学百科全书》的同一卷中,有一篇文章,第1510-1515页,由泰迪·塞登菲尔德(Teddy Seidenfeld)撰写,标题为“置信概率”,详细介绍了该方法,并将置信区间与置信区间进行了比较。引用那篇文章的最后一段,

在1963年关于置信概率的会议上,萨维奇写道:“基准概率。。。似乎就是我所说的贝叶斯不打碎贝叶斯鸡蛋的煎蛋卷。”从这个意义上说,信托概率是不可能的。就像许多伟大的知识分子一样贡献,具有持久价值的是我们努力学习的东西理解费希尔对基准概率的见解。(参见Edwards[4]有关此主题的更多信息。)他对贝伦斯鱼的解决方案例如,问题是如何巧妙地处理令人讨厌的参数使用贝叶斯定理。从这个意义上说,“……信托论点是“向费舍尔学习”[36,p.926]。这样解释,它当然仍然是统计知识的宝贵补充。

我认为,在最后几句话中,爱德华兹试图给费舍尔一个有利的解释,尽管他的理论并不可信。我相信,通过阅读这些百科全书论文和其他统计论文中的类似论文,以及关于费舍尔的传记文章和书籍,你可以找到有关这方面的丰富信息。

其他一些参考

Box,J.Fisher(1978)。《T.A.Fisher:科学家的一生》,纽约威利出版社Fisher,R.A.(1930)逆概率。剑桥哲学学会会刊。26, 528-535.

Bennett,J.H.编辑(1990)《统计推断与分析:R.A.Fisher的精选通信》。牛津克拉伦登出版社。

Edwards,A.W.F.(1995)。信条推理和自然选择的基本理论。生物统计学51799-809。

Savage L.J.(1963)讨论。《国际统计研究所公报》40,925-927。

塞登菲尔德,T.(1979)。“统计推断的哲学问题”Reidel,Dordrecht.塞登菲尔德(Seidenfeld,T.)(1992年)。R·A·费希尔的基准论证和贝叶斯定理。统计科学7358-368。

Tukey,J.W.(1957)。一些具有基准相关性的例子。《数理统计年鉴》28,687-695。

Zabell,S.L.(1992)。R.A.Fisher和信托论点。统计科学7,369-387。

这个古柯词很难理解,因为正如塞登菲尔德在《生物统计百科全书》上发表的文章中所说,费舍尔一直在改变它

1930年出版后,在他余下的32年里生活,通过两本书和无数篇文章,费舍尔坚定地坚持(1)中的想法,以及导致它的推理我们可以称之为“半逆推理”奇怪费舍尔用他的新奇想法引起了这样的困惑

塞登菲尔德所指的方程(1)是参数的基准分布$\θ$鉴于x美元$作为$\text{fid}(\theta|x)\propto\partial F/\partial\theta$哪里$F(x,θ)$表示随机变量的单参数累积分布函数X美元$x美元$带参数$\θ$至少这是费希尔的初始定义。后来,它被扩展到多个参数,这就是麻烦开始于讨厌的参数美元\西格玛$Behrens-Fisher问题。所以基准分布就像参数的后验分布$\θ$给定观测数据x美元$但它是在没有包含上的先验分布的情况下构建的$\θ$.

我费了好大劲才弄到这一切,但不难找到。我们真的不需要回答这样的问题。用关键字“基准推断”进行谷歌搜索,很可能会显示我发现的所有内容以及更多内容。

我在谷歌上搜索了一下,发现北卡罗来纳大学的一位教授Jan Hannig对基准推断进行了广义化,试图对其进行改进。通过谷歌搜索,可以得到他最近的一些论文和一篇powerpoint演示文稿。我将复制并粘贴他演示文稿中的最后两张幻灯片,如下所示:

结束语

广义基准分布通常导致渐近正确的吸引解常客报道。

许多仿真研究表明,广义基准溶液具有非常好的小样本性质。

广义推理在某些领域的流行应用圈表明,如果计算机70年前可用的基准推断可能不会已被拒绝。

引用

Zabell(1992)“信托推理是R.A。费舍尔是一个巨大的失败。”埃夫隆(1998)“也许费舍尔最大的错误会成为21世纪的大热门!"

为了增加更多参考文献,这里是我从Hannig的《2009年中国统计》论文中摘录的参考文献列表。请原谅重复,但我认为这会有帮助。

Burch,B.D.和Iyer,H.K.(1997年)。方差比(或heri)的精确置信区间-稳定性)在混合线性模型中。生物统计学53,1318-1333。

Burdick,R.K.、Borror,C.M.和Montgomery,D.C.(2005a)。量规的设计与分析R&R研究。ASA-SIAM统计与应用概率系列。宾夕法尼亚州费城:工业和应用数学学会。

Burdick,R.K.,Park,Y.-J.,Montgomery,D.C.和Borror,C.M.(2005年b)。计量器R&R研究中误分类率的置信区间。《质量技术杂志》37,294-303。

Cai,T.T.(2005)。离散分布中的单侧置信区间。J.统计。计划。推论131,63-88。

Casella,G.和Berger,R.L.(2002年)。统计推断。沃兹沃思和布鲁克斯/科尔广告-高级图书与软件,加利福尼亚州太平洋格罗夫,第二版。

Daniels,L.、Burdick,R.K.和Quiroz,J.(2005)。用固定算子进行计量器R&R研究的置信区间。《质量技术杂志》37,179-185。

Dawid,A.P.和Stone,M.(1982)。基准推理的函数模型基础。安。统计师。10, 1054-1074. 由G.A.Barnard和D.A.S.Fraser进行讨论,以及作者的回复。

Dawid,A.P.、Stone,M.和Zidek,J.V.(1973年)。贝叶斯中的边缘化悖论结构推断。J.罗伊。统计师。Soc.系列。B 35189-233。经D.J.讨论。Bartholomew、A.D.McLaren、D.V.Lindley、Bradley Efron、J.Dickey、G.N.Wilkinson、,A.P.Dempster、D.V.Hinkley、M.R.Novick、Seymour Geisser、D.A.S.Fraser和A。Zellner,以及a.P.Dawid、M.Stone和J.V.Zidek的回复。

Dempster,A.P.(1966年)。基于的后验分布推理新方法样本数据。安。数学。统计师。37, 355-374.

Dempster,A.P.(1968年)。贝叶斯推理的推广。(经过讨论)。J.罗伊。统计师。Soc.B 30,205-247。

Dempster,A.P.(2008)。统计学家的Dempster-Shafer演算。国际期刊近似推理48,365-377。

E、 L.、Hannig、J.和Iyer,香港(2008)。Fiducial intervals for variance components in an非平衡二分量正态混合线性模型。J.Amer。统计师。协会103、854-865

Efron,B.(1998年)。R·A·费舍尔在21世纪。统计师。科学。13, 95-122. 带评论和作者的反驳。

Fisher,R.A.(1930年)。逆概率。剑桥哲学学会会刊第二十六章,第528-535页。

Fisher,R.A.(1933年)。逆概率和基准概率的概念未知参数。伦敦皇家学会会刊A 139,343-348。

费舍尔,R.A.(1935a)。统计推断中的基准论点。《优生学年鉴VI》,第91-98页。

Fisher,R.A.(1935b)。归纳推理的逻辑。J.罗伊。统计师。Soc.B 98,29-82页。

Fraser,D.A.S.(1961年)。关于信义推理。安。数学。统计师。32, 661-676.

弗雷泽·D·A·S(1966)。结构概率和推广。生物特征53,1-9。

Fraser,D.A.S.(1968年)。推理的结构。John Wiley&Sons,纽约朗顿-悉尼。

Fraser,D.A.S.(2006年)。信条推理。在《新帕尔格雷夫经济学词典》中(S.Durlauf和L.Blume编辑)。Palgrave Macmillan,第二版。关于广义推论543

Ghosh,J.K.(1994)。高阶同义词。NSF-CBMS区域会议系列。海伊-沃德:数理统计研究所。

Ghosh,J.K.和Ramamoorthi,R.V.(2003)。贝叶斯非参数。Springer系列统计。纽约施普林格-弗拉格。

Glagovskiy,Y.S.(2006年)。混合模型置信区间的构造柯西分布和正态分布。科罗拉多州统计系硕士论文州立大学。

Grundy,P.M.(1956年)。基准分布和先验分布:一个例子前者不能与后者相关联。J.罗伊。统计师。Soc.系列。B 18,217-221。

GUM(1995)。测量不确定度表示指南。国际组织-标准化组织(ISO),瑞士日内瓦。

Hamada,M.和Weerahandi,S.(2000年)。基于广义推断的测量系统评估-自然科学。《质量技术杂志》32,241-253。

Hannig,J.(1996)。作为鞅极限的条件分布。经理。论文,(捷克语),捷克共和国布拉格查尔斯大学。

Hannig,J.,E,L.,Abdel-Karim,A.和Iyer,H.K.(2006a)同时广义信标对数正态分布均值比值的置信区间。南方的。J.统计。35,261-269.

Hannig,J.,Iyer,H.K.和Patterson,P.(2006b)信度广义置信区间。J。阿默尔。统计师。协会101,254-269。

Hannig,J.和Lee,T.C.M.(2007)。小波回归的广义基准推断。技术。科罗拉多州立大学代表。

Iyer,H.K.和Patterson,P.(2002)。构造广义关键量和广义置信区间。科罗拉多州统计局技术代表2002/10州立大学。

Iyer,H.K.、Wang,C.M.J.和Mathew,T.(2004)。真的模型和置信区间实验室间试验中的数值。J.Amer。统计师。协会991060-1071。

Jeffreys,H.(1940年)。关于Behrens-Fisher公式的注释。《优生学年鉴》10,48-51。

杰弗里斯,H.(1961年)。概率论。牛津克拉伦登出版社,第三版。

Le Cam,L.和Yang,G.L.(2000)。统计学中的渐近。统计学中的斯普林格系列。新建约克:施普林格出版社,第二版。

Liao,C.T.和Iyer,香港(2004)。正态分布的公差区间方差分量。统计师。Sinica西尼卡14,217-229。

Lindley,D.V.(1958年)。置信分布和贝叶斯定理。J.罗伊。统计师。Soc.系列。B类20, 102-107.

McNally,R.J.、Iyer,H.K.和Mathew,T.(2003)。个体和群体生物试验-基于广义p值的等效性。医学统计22,31-53。

Mood,A.M.、Graybill,F.A.和Boes,D.C.(1974年)。统计学理论导论。McGraw-Hill,第三版。

Pounds,S.和Morris,S.W.(2003)。估计假阳性和假阴性的发生-通过近似和划分经验分布在微阵列研究中的活性成分p值。生物信息学19,123601242。

Salome,D.(1998)。通过信条方法进行星际推论。格罗宁大学博士论文-消息。544年1月HANNIG

Searle,S.R.、Casella,G.和McCulloch,C.E.(1992年)。差异组件。约翰·威利&Sons,纽约。

Stevens,W.L.(1950)。不连续分布参数的基准极限。生物特征37、117-129。

Tsui,K.-W.和Weerahandi,S.(1989)。假设显著性检验中的广义p值-存在干扰参数时的ses。J.Amer。统计师。协会84,602-607。

Wang,C.M.和Iyer,香港(2005)。使用发电机测量的不确定性传播-抽象推理。Metrologia计量42、145-153。

Wang,C.M.和Iyer,香港(2006a)。中被测项的广义置信区间存在A类和B类不确定性。测量值39,856–863。Wang,C.M.和Iyer,香港(2006b)。基于基准的矢量测量不确定度分析推断。Metrologia计量学43,486-494。

Weerahandi,S.(1993年)。广义置信区间。J.Amer。统计师。协会88,899-905。

Weerahandi,S.(2004)。重复测度中的广义推理。新泽西州霍博肯威利。

Wilkinson,G.N.(1977年)。关于解决统计推断中的争议。J.罗伊。统计师。Soc.系列。乙39119-171。经过讨论。

Yeo,I.-K.和Johnson,R.A.(2001年)。U统计量的统一强大数定律应用于变换到近对称。统计师。普罗巴伯。莱特。51, 63-69.

Zabell,S.L.(1992)。R.A.Fisher和信托论点。统计师。科学。7, 369-387.北卡罗来纳大学教堂统计与运营研究系美国北卡罗来纳州教堂山希尔27599-3260。电子邮件:[电子邮件保护](2006年11月接收;2007年12月接受)

我收到的文章是《中国统计》第19期(2009年),第491-544页关于广义推论*简·汉尼格北卡罗来纳大学教堂山分校

$\端组$
4
  • $\开始组$ @迈克尔·切尔尼克:我希望能对这个论点及其缺陷做出解释。我觉得目前的答案虽然很有用,但并不完整。 $\端组$ 评论 2012年5月7日19:39
  • $\开始组$ 我在《生物统计学百科全书》的摘录中描述了其中的一些内容,当然,你想知道的任何事情都可以在我引用的大量参考文献中找到。我提到汉尼格的作品是因为我在查看谷歌搜索结果时意外发现的。我还没有读过他的文章,但我认为它不同于其他描述方法和争议或指出缺陷的东西。汉尼格正在认真研究修改基准推断以使其有效。 $\端组$ 评论 2012年5月7日19:50
  • $\开始组$ 我认为这很有趣,无论它是否是你想要的。我还认为,像你提出的问题可以很容易地通过谷歌搜索得到答案。百科全书上的文章非常详细地解释了基准论点。你可以追溯到费舍尔1930年的论文,看看他最初是如何表述的。也许琼·费舍尔·博克斯(Joan Fisher Box)的费舍尔传记中也讨论过这一点。你还想要什么? $\端组$ 评论 2012年5月7日19:59
  • 4
    $\开始组$ @约翰罗斯:我补充了我的答案,我认为这使我的答案更加完整。总的来说,我觉得给某人一个能提供完整答案的具体参考就足够了。我认为,这个问题的提出者,谁真正对答案感兴趣,应该不辞辛劳地查阅参考文献,并以这种方式学习。我们都长大了,不必什么都被人用勺子喂。 $\端组$ 评论 2012年5月7日21:55
9
+50
$\开始组$

置信推理有时将可能性解释为参数$\theta$的概率。也就是说,如果$M(x)L(θ|x)$是有限的,则它被解释为$theta$的概率密度函数,其中$L(θ子|x)$\是$theta$and$M(x)=(int_{-\infty}^{infty{L(θ|x)d\theta)^{-1}$的似然函数。你可以看到卡塞拉和伯杰,第291-2页,了解更多详细信息。

$\端组$
1
  • $\开始组$ Casella和Berger做出了这样的陈述,但将似然函数视为等于基准分布并不完全正确。这仅适用于估计尺度参数或位置参数。对于速率参数的估计,它变为假。另请参见stats.stackexchange.com/a/592453/164061 $\端组$ 评论 2022年10月19日7:53
8
$\开始组$

除此之外,Fisher和Neyman在显著性检验和区间估计方面存在争议。内曼定义了置信区间,而费舍尔引入了置信区间。他们对其构造的争论不同,但构造的间隔通常是相同的。因此,在发现它们在处理贝伦斯-菲舍尔问题时有所不同之前,这些定义中的差异在很大程度上被忽略了。费舍尔坚定地支持信托方法,但尽管他表现出色,并大力提倡该方法,但似乎存在缺陷,而且由于统计界认为该方法不可信,因此不常讨论或使用。贝叶斯和频率主义的推理方法是剩下的两种。

$\端组$
1
$\开始组$

TL;博士

因为这个想法行不通,所以信托论点没有被接受。

基准分布被伪装成看起来像概率分布的东西(人们可能希望它表现得像概率分布),但它与概率分布不同。这只是概率的函数。

你可以对基准分布和后验概率密度做同样的事情。下面的例子说明了这一点,我们计算了80%的基准区间,但在某些情况下得到了100%的覆盖率。

不起作用的示例

迈克尔·切尔尼克(Michael R.Chernick)的回答很好,他提到,当人们试图将基准分布应用于多维环境时,例如贝伦斯·费希尔(Behrens-Fisher)问题,基准分布背后的逻辑开始失效。这里我们给出了一个一维的例子,已经表明它不起作用。

让我们做一些统计X美元$作为均匀分布

$$X\sim\mathcal{U}\left(\tea-0.5\sqrt{1+\tea^2},\tea+0.5\sqrt}\right)$$

我们可以绘制累积分布函数(CDF)$F(x;\θ)$作为的函数x美元$$\θ$使用等值线。

具有80%基准区间边界的cdf等值线

图中显示了CDF的功能x美元$$\θ$

  • 垂直方向,用于固定$\θ$,该函数描述观测的CDFx美元$这是一个随机变量。

    我们可以将概率密度函数计算为$$\frac{\partial}{\paratilx}F(x;\theta)$$

  • 水平方向,用于固定x美元$,该函数描述用于估计的基准分布$\θ$

    我们可以将基准密度计算为$$\frac{\partial}{\paratil\theta}F(x;\theta)$$

例如,当我们观察到基准密度时$x=0.1$看起来像。

基准密度

红色点位于80%区间[-0.396,0.475]内,这是密度最高的80%概率质量。

问题如下:当我们考虑相同的分位数时,基准分布的概率陈述仅“起作用”,与观测无关x美元$然而,当改变分位数作为的函数时x美元$然后,基准分布所包含的概率陈述的内容发生变化并变为虚假。因此,该分布不能以与概率密度类似的方式使用。发生这种情况的一个例子是,例如上面的例子,当我们计算最高密度区间与不同观测值形状不同的基准密度组合时x美元$(这使我们选择不同的分位数)。

我们可以在情节中看到这一点$\θ=0$在这种情况下,我们得到了80%的最高密度区间的100%覆盖率,而不是80%的覆盖率。当基准分布可用作$\θ$.

两个图的R代码:

####绘图参数d=0.01t=序列号(-2,2.6,d)t2=序列(3.4,4,d)tm=3灰色=rgb(0.3,0.3,0.3)###空画布图(-10,-10,xlim=c(-2.4),ylim=c(-3.5),xlab=表达式(θ),ylab=“x”,main=“最高密度80%简化区间示例”)###添加等值线对于(q in c(0:10)*0.1){线(t,t+(q-0.5)*sqrt(1+t^2),col=灰色)线条(t2,t2+(q-0.5)*sqrt(1+t2^2),col=灰色)文本(tm,tm+(q-0.5)*sqrt(1+tm^2),bquote(F(x*“;”*theta)==。(q) ),col=灰色,cex=0.6,srt=15+35*q)}基准=函数(x,绘图=真,α=0.8){dt=0.001###基准分布域tmin=(1/3)*(4*x-sqrt(4*x^2+3))tmax=(1/3)*(4*x+平方(4*x^2+3))ts=seq(tmin,tmax,dt)###计算分布f=(ts*x+1)/(ts^2+1)^1.5###通过密度排序计算最高密度区域ord=订单(f)#订单p=累计和(f[ord])*dt#累积概率sel=哪个(p<1-alpha)#选择最高alpha%密度的补体输出=范围(ts[ord][-sel])##最高α%密度区间的范围###密度示例图if(绘图==TRUE){绘图(ts,f,col=1+(ts>=输出[1])*(ts<=输出[2]))}输出}###计算作为观测x函数的间隔xs=序列(-4,5,0.01)low=将填充的c()###空数组高=c()for(xs中的x){间隔=基准(x,绘图=假)低=c(低,间隔[1])高=c(高,间隔[2])}###添加基准间隔的曲线线(低[低<2.6],xs[低<2.6],lwd=2)线(高[高<2.6],xs[高<2.6],lwd=2)###添加观察值X=0.1的示例间隔int=基准(0.1,绘图=0)#线(c(-2,2),c(0.1,0.1),lty=2)行(int,c(0.1,0.1),lwd=2,col=2)点(int,c(0.1,0.1),pch=21,col=2,bg=0,cex=0.7)文本(0.8,0.1,“x=0.1时的示例间隔”,pos=4,col=2)###示例图基准(0.1)标题(“x=0.1时基准分布示例\n最高80%密度以红色突出显示”)
$\端组$
0
$\开始组$

在一个大型工程本科班介绍统计数据佐治亚理工大学,当讨论总体平均值的置信区间时已知方差后,一名学生(用MATLAB语言)问我:“我可以将间隔计算为>norminv([alpha/2,1-alpha/2],barX,sigma/sqrt(n))吗?”翻译:他能取$\frac{\alpha}{2}$和$1-\frac}\alpha{2}$quantiles吗以$\bar X$为中心的正态分布,刻度为$\frac\sigma{\sqrt{n}}$?

我说——当然是的,他很自然地感到惊喜得出了基准分布的概念。

$\端组$
1
  • $\开始组$ 这不完全是一个答案。。。 $\端组$ 评论 2020年7月15日3:17

你的答案

单击“发布您的答案”,表示您同意我们的服务条款并确认您已阅读我们的隐私政策.

不是你想要的答案吗?浏览标记的其他问题问你自己的问题.