×

什么是统计模型?(附有评论和回复)。 (英语) 兹比尔1039.62003

摘要:本文讨论了两个密切相关的问题,“什么是统计模型?”和“什么是参数?”模型必须“有意义”和参数必须“有明确定义的含义”这两个概念在应用统计工作中根深蒂固,在本能层面上可以很好地理解,但在大多数形式化的建模和推理理论中都没有。在本文中,这些概念是用代数术语定义的,使用了态射、函子和自然变换。
有人认为,除非模型允许自然扩展,包括需要进行推理的领域,否则基于模型的推理是不可能的。例如,预测要求域包含所有未来单位、主题或时间点。尽管它通常不明确,但每一个合理的统计模型都承认这种扩展。
举例说明了为什么这种扩展是必要的,以及为什么需要形式化理论。在子参数的定义中,表明某些参数函数是自然的,而其他参数函数则不是。推断仅对自然参数有意义。这种区别对于构建先前的分布具有重要影响,也有助于解决关于Box-Cox模型的争议。

MSC公司:

62A01型 统计学基础和哲学主题
62F99型 参数化推理
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] ALDOUS,D.(1981)。随机变量部分可交换数组的表示。《多变量分析杂志》11 581-598·Zbl 0474.60044号 ·doi:10.1016/0047-259X(81)90099-3
[2] ANDREWS,D.F.和HERZBERG,A.(1985年)。数据。纽约州施普林格·Zbl 0567.62002号
[3] BARNDORFF-NIELSEN,O.E.和COX,D.R.(1994)。推理与抽象派。查普曼和霍尔,伦敦·Zbl 0826.62004号
[4] BARTLETT,M.S.(1978年)。田间试验分析中的最近邻模型(带讨论)。J.罗伊。统计师。Soc.序列号。乙40 147-174。JSTOR公司:·Zbl 0396.62051号
[5] BERGER,J.O.(1985)。《统计决策理论与贝叶斯分析》,第二版,纽约斯普林格出版社·Zbl 0572.62008号
[6] BERNARDO,J.M.和SMITH,A.F.M.(1994)。贝叶斯理论。纽约威利·Zbl 0796.6202号
[7] BESAG,J.(1974年)。晶格系统的空间相互作用和统计分析(含讨论)。J.罗伊。统计师。Soc.序列号。B 36 192-236。JSTOR公司:·Zbl 0327.60067号
[8] BESAG,J.和HIGDON,D.(1999)。农业田间试验的贝叶斯分析(附讨论)。J.罗伊。统计师。Soc.序列号。乙61 691-746。JSTOR公司:·Zbl 0951.62091号 ·doi:10.1111/1467-9868.00201
[9] BESAG,J.和KOOPERBERG,C.(1995年)。关于条件自回归和内在自回归。生物特征82 733-746。JSTOR公司:·Zbl 0899.62123号
[10] BEST,N.G.、ICKSTADT,K.和WOLPERT,R.L.(1999)。对贝萨格讨论的贡献
[11] J.罗伊。统计师。Soc.序列号。B 61 728-729。
[12] BICKEL,P.和DOKSUM,K.A.(1981年)。重温了对转换的分析。J.Amer。统计师。协会76 296-311。JSTOR公司:·Zbl 0464.62058号 ·doi:10.2307/2287831
[13] BILLINGSLEY,P.(1986年)。《概率与测度》,第二版,威利出版社,纽约·兹比尔0649.60001
[14] BOX,G.E.P.和COX,D.R.(1964年)。转换分析(含讨论)。J.罗伊。统计师。Soc.序列号。B 26 211-252。JSTOR公司:·Zbl 0156.40104号
[15] BOX,G.E.P.和COX,D.R.(1982年)。对转型的分析被重新审视、反驳。J.Amer。统计师。协会77 209-210。JSTOR公司:·Zbl 0504.62058号 ·doi:10.2307/2287791
[16] COX,D.R.(1958)。实验规划。纽约威利·Zbl 0084.15802号
[17] COX,D.R.(1986年)。对荷兰的评论(1986)。J.Amer。统计师。协会81 963-964。
[18] COX,D.R.和HINKLEY,D.V.(1974年)。理论统计。查普曼和霍尔,伦敦·Zbl 0334.62003号
[19] COX,D.R.和REID,N.(1987年)。参数正交性和近似条件推断(与讨论)。J.罗伊。统计师。Soc.序列号。B 49 1-39。JSTOR公司:·Zbl 0616.62006号
[20] COX,D.R.和SNELL,E.J.(1981年)。应用统计学。查普曼和霍尔,伦敦·Zbl 0612.62002号
[21] COX,D.R.和WERMUTH,N.(1996年)。多元相关性。查普曼和霍尔,伦敦·Zbl 0880.62124号
[22] DALE,J.R.(1984)。双变量有序响应的局部与全局关联。生物计量学71 507-514。JSTOR公司:·doi:10.1093/biomet/71.3507
[23] DE FINETTI,B.(1975年)。概率论2。纽约威利·Zbl 0328.60003号
[24] GELMAN,A.、CARLIN,J.B.、STERN,H.和RUBIN,D.B.(1995年)。贝叶斯数据分析。查普曼和霍尔,伦敦。
[25] GOODMAN,L.A.(1979年)。具有有序类别的交叉分类中关联分析的简单模型。J.Amer。统计师。协会74 537-552·doi:10.2307/2286971
[26] GOODMAN,L.A.(1981年)。具有有序类别的交叉分类分析中的关联模型和典型相关性。J.Amer。统计师。协会76 320-334·doi:10.2307/2287833
[27] HAMADA,M.和WU,C.F.J.(1992年)。复杂混叠设计实验分析。J.资格。技术24 130-137。
[28] HARVILLE,D.A.和ZIMMERMANN,D.L.(1999)。对Besag讨论的贡献(1999年)。J.罗伊。统计师。Soc.序列号。乙61 733-734。
[29] 赫尔兰,I.S.(1999a)。从对称和统计建模的量子力学。国际。J.理论。《物理学》第38卷第1851-1881页·Zbl 0953.81003号 ·doi:10.1023/A:1026676913271
[30] 赫尔兰,I.S.(1999b)。一般统计参数空间中对称性的量子理论。奥斯陆大学数学系技术报告。
[31] HINKLEY,D.V.和RUNGER,G.(1984)。转换数据的分析(带讨论)。J.Amer。统计师。协会79 302-320。JSTOR公司:·Zbl 0553.62051号 ·doi:10.2307/2288264
[32] 霍兰德·P(1986)。统计和因果推断(讨论)。J.Amer。统计师。协会81 945-970。JSTOR公司:·兹比尔0607.62001 ·doi:10.2307/2289064
[33] HORA,R.B.和BUEHLER,R.J.(1966年)。信度理论和不变估计。安。数学。统计师。37 643-656. ·Zbl 0148.13805号 ·doi:10.1214/aoms/1177699458
[34] KINGMAN,J.F.C.(1984年)。现状和潜在发展:一些个人观点。概率和随机过程。J.罗伊。统计师。Soc.序列号。A 147 233-244·Zbl 0547.60003号 ·doi:10.2307/2981679
[35] KINGMAN,J.F.C.(1993年)。泊松过程。牛津大学出版社·Zbl 0771.60001号
[36] LAURITZEN,S.(1988年)。极端家庭和充分统计系统。统计中的课堂笔记。49.斯普林格,纽约·Zbl 0681.62009号
[37] LEHMANN,E.L.(1983)。点估计理论。纽约威利·Zbl 0522.62020号
[38] LEHMANN,E.L.和CASELLA,G.(1998年)。点估计理论,第二版,纽约斯普林格出版社·Zbl 0916.62017号
[39] LITTELL,R.、FREUND,R.J.和SPECTOR,P.C.(1991)。SAS线性模型系统,第三版,SAS Institute,Cary,NC。
[40] MAC LANE,S.(1998年)。《职业数学家分类》,第二版,纽约斯普林格出版社·Zbl 0906.18001号
[41] MCCULLAGH,P.(1980年)。有序数据的回归模型(带讨论)。J.罗伊。统计师。Soc.序列号。乙42 109-142。JSTOR公司:·Zbl 0483.62056号
[42] MCCULLAGH,P.(1992年)。条件推理和柯西模型。生物特征79 247-259。JSTOR公司:·Zbl 0753.6202号 ·doi:10.1093/biomet/79.2.247
[43] 麦考拉,第(1996)页。莫比乌斯变换和柯西参数估计。安。统计师。24 787-808. ·Zbl 0859.62007 ·doi:10.1214/aos/1032894465
[44] MCCULLAGH,P.(1999)。商空间和统计模型。加拿大。J.统计。27 447-456. JSTOR公司:·Zbl 0946.62005号 ·数字对象标识代码:10.2307/3316103
[45] MCCULLAGH,P.(2000年)。不变性和阶乘模型(带讨论)。J.罗伊。统计师。Soc.序列号。B 62 209-256。JSTOR公司:·doi:10.1111/1467-9868.00229
[46] MCCULLAGH,P.和NELDER,J.A.(1989)。广义线性模型,第二版,查普曼和霍尔,伦敦·Zbl 0744.62098号
[47] 麦克拉夫。P.和WIT,E.(2000)。自然变化和海湾地图。技术报告。
[48] MERCER,W.B.和HALL,A.D.(1911年)。田间试验的实验误差。《农业杂志》。研究50 331-357。
[49] NELDER,J.A.(1977年)。线性模型的重新形成(与讨论)。J.罗伊。统计师。Soc.序列号。A 140 48-77。JSTOR公司:·doi:10.2307/2344517
[50] PEARSON,K.(1913年)。注意常量关联的表面。Biometrika 9 534-537。
[51] PLACKETT,R.L.(1965)。一类二元分布。J.Amer。统计师。协会60 516-522。JSTOR公司:·doi:10.2307/2282685
[52] RUBIN,D.(1978年)。因果效应的贝叶斯推断:随机化的作用。安。统计师。6 34-58. ·Zbl 0383.62021号 ·doi:10.1214/aos/1176344064
[53] RUBIN,D.(1986)。《荷兰评论》(1986)。J.Amer。统计师。协会81 961-962。
[54] 史密斯,A.F.M.(1984)。现状和潜在发展:一些个人观点。贝叶斯统计。J.罗伊。统计师。Soc.序列号。A 147 245-259·Zbl 0555.65100号 ·doi:10.2307/2981672
[55] TJUR,T.(2000)。对McCullagh讨论的贡献(2000年)。J.罗伊。统计师。Soc.序列号。乙62 238-239。
[56] 怀特·P(1974)。对贝萨格讨论的贡献(1974年)。J.罗伊。统计师。Soc.序列号。B 36 228。JSTOR公司:
[57] YANDELL,B.S.(1997年)。设计实验的实际数据分析。查普曼和霍尔,伦敦·Zbl 1056.62500号
[58] 伊利诺伊州芝加哥60637-1514电子邮件:pmcc@galton.uchicago.edu贝格(1995)、贝萨格和希格顿(1999)以及鲁和特杰尔梅兰德(2002)。然而,与品种试验一样,空间效应通常是次要的,主要目的是在配方中吸收适当水平的空间变化,而不是产生具有科学解释参数的空间模型。然而,麦库拉的基本观点得到了很好的理解。例如,我认为MRF在地理流行病学中的使用[例如,Besag、York和Mollié(1991)]主要具有探索性价值,可以建议额外的空间相关协变量,这些协变量的加入可以理想地免除空间公式的需要;
[59] 费尔菲尔德-史密斯(1938)和皮尔斯(1976)的均匀性试验。当然,在真正的品种试验中,人们可能想预测几个单独品种在整个领域的总产量,但这不需要将公式扩展到McCullagh的概念图。实际上,这种计算在理论上特别适合于贝叶斯范式,因为人们应该处理潜在的可观测量,而不仅仅是参数,在实践中,通过MCMC,因为后验预测分布是严格可用的。也就是说,对于品种A的总产量,我们使用在播种有A的地块上观察到的产量,并根据参数值的每个MCMC样本的可能性生成一组观察值,从而建立总产量的相应分布。人们还可以为品种A和品种B之间的总产量差异构建可靠的区间,并轻松解决排序和选择中的各种问题,这些问题在频率专家框架中根本无法考虑;例如,播种任何特定品种(可能根据实验选择)获得总产量的后验概率至少为10
[60] 吨(1986)。研究结果表明,在设计糟糕的实验中,从空间分析中获得的收益可以提供与标准分析和优化设计相称的改进。这并不是采用糟糕设计的原因,但简单的事实是,尽管统计学家做出了努力,但许多实验都是使用随机完全块进行的。生育率的表示非常灵活,但也很节俭,这是非常可取的,因为有许多需要估计的品种效应,但复制非常有限。McCullagh在第8节中对调和函数的离散近似在两个方面都失败了:首先,局部最大值或最小值不存在,除非(人为地)出现在试验边缘的曲线上;其次,拟合中损失的自由度等于这样的曲线图的数量,因此是相当大的(实际上,矩形布局中少了四个自由度,因为在整个分析过程中忽略了角点曲线!)。然而,调和函数的平均性质有一些吸引人的地方,只要它稍微灵活一点就好了。所需要的是一个随机效应(用频率学家的术语来说)版本,这正是内在自回归在伯克希尔哈撒韦和其他地方使用背后的思想。实际上,除了边缘效应(因为伯克希尔哈撒韦将数组嵌入到一个较大的数组中以满足这种效应)之外,这种方案完全符合麦克拉夫的离散调和函数,并且它们也很好地适合更合理的生育函数。有关Mercer和Hall数据的具体评论,请参见下文。当然,空间尺度仍然是品种试验的一个重要问题,确实在第2.3节和BH的反驳中进行了实证讨论。对于一维调整,最简单可行的连续体过程是具有任意水平的布朗运动,其中必要的积分可以是ATKINSON,A.C.和BAILEY,R.A.(2001).百年来,在Biometrika上下设计实验。生物特征88 53-97。JSTOR公司:·Zbl 1037.62069号 ·doi:10.1093/biomet/88.1.53
[61] BESAG,J.E.(1974年)。晶格系统的空间相互作用和统计分析(含讨论)。J.罗伊。统计师。Soc.序列号。B 36 192-236。JSTOR公司:·Zbl 0327.60067号
[62] BESAG,J.E.(1975年)。非晶格数据的统计分析。统计学家24 179-195。
[63] BESAG,J.E.、GREEN,P.J.、HIGDON,D.M.和MENGERSEN,K.L.(1995)。贝叶斯计算和随机系统(带讨论)。统计师。科学。10 3-66. ·Zbl 0955.6252号 ·doi:10.1214/ss/1177010123
[64] BESAG,J.E.和HIGDON,D.M.(1993年)。农业田间试验的贝叶斯推断。牛市。国际。统计师。仪器55 121-136。
[65] BESAG,J.E.和HIGDON,D.M.(1999)。农业田间试验的贝叶斯分析(附讨论)。J.罗伊。统计师。Soc.序列号。乙61 691-746。JSTOR公司:·Zbl 0951.62091号 ·doi:10.1111/1467-9868.00201
[66] BESAG,J.E.和KEMPTON,R.A.(1986年)。使用相邻地块进行田间试验的统计分析。生物统计学42 231-251·Zbl 0658.62129号 ·doi:10.2307/2531047
[67] BESAG,J.E.和KOOPERBERG,C.L.(1995)。条件和内在自回归。生物医药82 733-746。JSTOR公司:·Zbl 0899.62123号
[68] BESAG,J.E.、YORK,J.C.和MOLLI E.A.(1991年)。贝叶斯图像恢复,在空间统计中的两个应用(与讨论)。Ann.Inst.Statist公司。数学。43 1-59. ·Zbl 0760.62029号 ·doi:10.1007/BF00116466
[69] 布莱曼,L.(2001)。统计建模:两种文化(讨论)。统计师。科学。16 199- 231. ·Zbl 1059.62505号 ·doi:10.1214/ss/1009213726
[70] ERS,S.D.和BESAG,J.E.(2000)。疾病绘图中对塌陷边缘的推断。医学统计19 2243-2249。
[71] 费尔菲尔德·史密斯(1938)。描述农作物产量异质性的经验法则。《农业杂志》。科学。28 1-23.
[72] FISHER,R.A.(1922年)。理论统计学的数学基础。菲洛斯。事务处理。罗伊。Soc.伦敦Ser。222 309-368。
[73] FISHER,R.A.(1928年)。《研究工作者的统计方法》,第二版,爱丁堡Oliver and Boy d出版社。
[74] GILMOUR,A.R.、CULLIS,B.R.、SMITH,A.B.和VERBy LA,A.P.(1999)。J.E.Besag和D.M.Higdon的论文讨论。J.罗伊。统计师。Soc.B 61 731-732。
[75] 海因,V.(1955)。二维平稳随机过程模型。生物特征42 170-178。JSTOR公司:·Zbl 0067.36504号 ·doi:10.1093/biomet/42.1-2.170
[76] KÜNSCH,H.R.(1987年)。二维晶格上的内禀自回归和相关模型。生物特征74 517-524·Zbl 0671.62082号 ·doi:10.1093/biomet/74.3.517
[77] MATéRN,B.(1986年)。空间变化。纽约州施普林格·兹比尔0608.62122
[78] MCBRATNEY,A.B.和WEBSTER,R.(1981)。通过作物产量的光谱分析检测垄沟模式。国际。统计师。版次49 45-52。
[79] PEARCE,S.C.(1976年)。对费尔菲尔德-史密斯(Fairfield Smith)环境变化定律的考察。《农业杂志》。科学。87 21-24.
[80] RUE,H.和TJELMELAND,H.(2002)。将高斯马尔可夫随机场拟合为高斯场。扫描。J.统计。29 31-49. ·Zbl 1017.62088号 ·doi:10.1111/1467-9469.00058
[81] WHITTLE,P.(1962年)。地形相关性、幂律协方差函数和扩散。生物特征49 305-314。JSTOR公司:·Zbl 0114.08003号 ·doi:10.1093/biomet/49.3-4.305
[82] 华盛顿西雅图98195-4322电子邮件:julian@stat.washington.edu最近由Chen、Lockhart和Stephens(2002)撰写。它对我有吸引力的一个原因是,如果考虑更现实的半参数模型,a(Y)=X+,(6),其中a是任意的单调变换,并且具有N(\mu,2)分布,那么/在N-1/2速率下是可识别和可估计的,而不是可识别的。Bickel和Ritov(1997)讨论了在速率n-1/2下估计/和a的方法,并在他们的论文中建议了算法的方法。我对选择(,)感兴趣,因为它的考虑是对欣克利-伦格批评的适当回应。人们需要为(,)指定一个联合置信区间,以便做出诸如“规模上的影响程度与数据一致”的声明缺乏知识对剩余方差的影响是可以解释的。如果McCullagh能够以某种方式将本文的微积分与函子、语态和规范图的语言分离开来,那么对于像我这样更注重分析的统计学家来说,这将更具吸引力。
[83] BICKEL,P.和RITOV,Y.(1997年)。变换模型中秩和协变量的局部非随机正态性。《吕西安·勒·卡姆的费斯切里夫:概率与统计研究论文》(D.Pollard,E.Torgersen and G.Yang,eds.)43-54。纽约州施普林格·Zbl 0897.62017号
[84] CHEN,G.、LOCKHART,R.A.和STEPHENS,M.A.(2002年)。线性模型中的Box-Cox变换:大样本理论和正态性检验(带讨论)。加拿大。J.统计。30 177-234. JSTOR公司:·Zbl 1012.62072号 ·doi:10.2307/3315946
[85] 加利福尼亚州伯克利94720-3860电子邮件:bickel@stat.berkeley.eduMAC LANE,S.(1998年)。《在职数学家分类》,第二版,施普林格出版社,纽约。
[86] 弗雷泽·D·A·S(1968a)。黑盒或综合模型。技术计量学10 219-229。JSTOR公司:·doi:10.2307/1267040
[87] 弗雷泽·D·A·S(1968b)。推理的结构。纽约威利·Zbl 0164.48703号
[88] MCCULLAGH,P.(1992年)。条件推理和柯西模型。生物特征79 247-259。JSTOR公司:·Zbl 0753.6202号 ·doi:10.1093/biomet/79.2.247
[89] 安大略省多伦多市M5S 3G3加拿大电子邮件:reid@utstat.utoronto.ca摘自Helland(2002)。在模型的参数空间上定义一个群G。如果(1)=(2)表示(g 1)=。通常,如果函数=()的水平集被转换为Dawid、Stone和Zidek(1973)详细讨论的其他不一致性,则参数是自然的。他们的主要问题是违反了似是而非的归约原则:假设应用于数据(y,z)的一般推理方法会得出一个事实上仅取决于z的答案。如果只对z应用相同的方法,那么应该会出现相同的答案。该原理的贝叶斯实现如下:首先假设概率密度p(y,z|,)依赖于参数=(,),边际密度p(z|)仅依赖于此。那么下面的含义应该成立:如果(a)边缘后验密度(|y,z)仅依赖于通过z的数据(y,z。对于适当的前导词(,),可以用a()作为适当的边缘前导词来表示。Dawid、Stone和Zidek(1973)给出了几个例子,在这些例子中,上述含义被我们有时期望在客观的Bay推论中得到的那种不恰当的先验所违背。就我们的目的而言,有趣的情况是在参数空间上定义了一个变换群G。假设在G下是最大不变的,并给出了一些正则性条件,Dawid,Stone和Zidek(1973)首先证明了p(z|,)只依赖于,其次证明了(a)始终保持s,最后证明了(b)保持当且仅当先验是G(d)d形式,其中G是右Haar测度,以及测量DAWID,A.P.,STONE,M.和ZIDEK,J.V.(1973年)。贝叶斯和结构推理中的边缘化悖论(附讨论)。J.罗伊。统计师。Soc.序列号。B 35 189-233。JSTOR公司:
[90] 赫尔兰,I.S.(2001)。系统下回归模型的简化。《统计学和概率的代数方法》(M.Viana和D.Richards编辑)139-153。阿默尔。数学。佛罗里达州普罗维登斯Soc·Zbl 1012.62077号
[91] 赫尔兰,I.S.(2002)。固定对称群下的统计推断。网址:http://www.math.uio.no/ingeh/。网址:
[92] BROWN,L.D.(1984)。杰克·基弗的研究超出了实验设计的范畴。安。统计师。12 406-415. ·Zbl 0549.01017号 ·doi:10.1214/aos/1176346495
[93] 卡蒂尔,P.(2001)。疯狂一天的工作:从格罗森迪克到康奈斯和康采维奇。空间和对称概念的演变。牛市。阿默尔。数学。Soc.38 389-408·Zbl 0985.01005号 ·doi:10.1090/S0273-0979-01-00913-2
[94] GROTHENDIECK,A.(1955年)。Produits张量拓扑和espaces nucléaires。内存。阿默尔。数学。第16章·Zbl 0123.30301号
[95] HUBER,P.J.(1961年)。一般范畴中的同伦理论。数学。年鉴144 361-385·Zbl 0099.17905号 ·doi:10.1007/BF01396534
[96] 勒·卡姆(1964)。充分性和近似充分性。安。数学。统计师。35 1419-1455. ·Zbl 0129.11202号 ·doi:10.1214/aoms/1177700372
[97] ARBUTHNOTT,J.(1712)。上帝的旨意,来源于两性出生时观察到的持续规律。菲洛斯。事务处理。罗伊。Soc.伦敦186-190年27月。
[98] BAILEY,R.A.(1981年)。实验设计的统一方法。J.罗伊。统计师。Soc.序列号。一个144 214-223。JSTOR公司:·Zbl 0469.62053号 ·doi:10.2307/2981920
[99] BAILEY,R.A.(1991年)。随机实验的分层(讨论)。J.罗伊。统计师。Soc.序列号。乙53 27-78。JSTOR公司:·Zbl 0800.62477号
[100] 科克斯,法学博士(1990年)。模型在统计分析中的作用。统计师。科学。5 169-174. ·Zbl 0955.62518号 ·doi:10.1214/ss/1177012165
[101] DIACONIS,P.(1988)。概率统计中的群表示。加利福尼亚州海沃德IMS·Zbl 0695.60012号
[102] DIACONIS,P.、GRAHAM,R.L.和KANTOR,W.M.(1983年)。完美洗牌的数学。申请中的预付款。数学。4 175-196. ·Zbl 0521.05005号 ·doi:10.1016/0196-8858(83)90009-X
[103] FURSTENBURG,H.(1963年)。非交换随机乘积。事务处理。阿默尔。数学。Soc.108 377-428。JSTOR公司:·Zbl 0203.19102号 ·doi:10.2307/1993589
[104] 格伦南德,U.(1963)。代数结构上的概率。纽约威利·Zbl 0131.34804号
[105] MCCULLAGH,P.(1999)。商空间和统计模型。加拿大。J.统计。27 447-456. JSTOR公司:·Zbl 0946.62005号 ·数字对象标识代码:10.2307/3316103
[106] MCCULLAGH,P.(2000年)。不变性和阶乘模型(带讨论)。J.罗伊。统计师。Soc.序列号。B 62 209-256。JSTOR公司:·doi:10.111/1467-9868.00229
[107] PINCUS,S.和KALMAN,R.E.(1997年)。并非所有(可能)的“随机”序列都是相等的。程序。美国国家科学院。科学。美国94 3513-3518。JSTOR公司:·Zbl 0873.11047号 ·doi:10.1073/pnas.94.8.3513
[108] PINCUS,S.和SINGER,B.H.(1996年)。随机性和不规则程度。程序。美国国家科学院。科学。美国93 2083-2088。JSTOR公司:·Zbl 0849.60002号 ·doi:10.1073/pnas.93.5.2083
[109] CONNECTICUT GUILFORD 06437电子邮件:stevepincus@alum.mit.edu在McCullagh(1980)中。假设我们正在处理一个宇宙,其中处理二进制响应的自然模型是逻辑回归模型。这可能是一些社会经济研究领域,人们对品牌的各种特征或服务水平的态度被记录在一个二元量表中,其兴趣在于这些态度对各种背景变量的依赖性。我们如何扩展这个宇宙来处理有序的分类反应,例如,在三点积极/冷漠/消极尺度上?一个自然的要求似乎是,如果数据被(任意)选择一个切点二分法(例如,将消极和冷漠放在一个类别中),那么由此产生的边际模型就是逻辑回归模型。毕竟,这只是记录二进制响应的一种方式,即使这样丢弃信息会伤害任何统计学家,但它始终是在更无形的层面上进行的。另一个自然要求是,利率参数(常数项为明显例外)不应取决于如何选择切点。很容易证明,这两个要求通过一类且只有一类有序响应模型得以满足,即can模型和Nelder(1989)模型。因此,我们在这里遇到了一个荒谬的情况,即对一个简单而规范的问题的可能规范但不幸不存在的答案导致了一系列非常有用的方法。过度分散模型是作为完全可接受的操作对象而存在的,但不是作为数学对象。我个人的观点[Tjur(1998)]是,给这些模型一个具体解释的最简单方法是通过对正常数据的非线性模型进行近似,并对这些模型的常用估计方法进行小调整。但无论是这一点,还是拟似然的概念,都没有回答一个基本问题,即是否有一种方法可以修改上述条件(1)和(2),从而使具有超分散性的广义线性模型的有意义理论成为唯一的答案。在目前的背景下,人们不禁要问,这些模式是否有必要以通常的意义“存在”。也许一、两个世纪后,人们会发现这个问题无关紧要,就像我们发现关于数字+存在性的旧讨论无关紧要一样?如果是这样的话,那么肯定需要对统计模型采取新的态度。
[110] MCCULLAGH,P.(1980年)。有序数据的回归模型(含讨论)。J.罗伊。统计师。Soc.序列号。乙42 109-142。JSTOR公司:·Zbl 0483.62056号
[111] MCCULLAGH,P.和NELDER,J.A.(1989)。广义线性模型,第2版。编辑:查普曼和霍尔,伦敦·Zbl 0744.62098号
[112] NELDER,J.A.和WEDDERBURN,R.W.M.(1972)。广义线性模型。J.罗伊。统计师。Soc.序列号。甲135 370-384。
[113] TJUR,T.(1998)。广义线性模型中的非线性回归、拟似然和过度分散。阿默尔。统计师。52 222-227. JSTOR公司:·doi:10.2307/2685928
[114] 最近由Wichura(2001)获得。弗雷泽和里德问范畴理论是否能提供一个框架之外的更多功能。我在这里的经验与胡贝尔的相似,也就是说范畴理论非常适合于这个目的,但作为逻辑的一个分支,这就是我们所能期望的。关于变异系数,我同意,在某些应用中,这是一个有用的自然参数或统计,就像在一些应用中,相关系数是有用的一样。本文中使用的群是这样的,即原点要么是固定的,要么是完全任意的。无论哪种情况,都没有对冲的余地。实际上,事情很少如此明朗。为了证明变异系数的合理性,在我看来,应用必须使测量尺度具有与问题相关的合理明确的起源。带有实分数线性群的柯西模型最初被用作一个示例,以突出某些推理问题。我认为我没有遇到过这样一个应用程序,在这个应用程序中,很容易为这个群体的相关性提供令人信服的理由。尽管如此,我认为研究这些例子有助于揭示它们在基础问题上的作用。中位数不是一个自然的子参数,这一事实使人们对该组在“传统”应用中的相关性产生了严重怀疑。为了扭转这一争论,柯西模型在实际分数线性变换下是封闭的,这一事实本身并不是选择该组作为基本类别的充分理由。从这个意义上说,我同意弗雷泽的推理结构的一个基本论点,即群体取代了概率模型。Tjur的言论抓住了我试图做的事情的精神。在累积logit模型中,直观地清楚地表明,感兴趣的参数不应取决于如何选择切点这一说法意味着什么。通常情况下,直觉上清晰的东西不太容易用数学术语表达。这并不意味着最大似然估计值不受此选择的影响。因此,尽管Tjur关于过度分散模型的第二个条件有一定的吸引力,但我认为它不具有与第一个条件相同的效力。他对回归中自然子参数的描述是一个清晰的模型。
[115] 给定轮廓上的值(Matheron,1971)。这两个过程也是共形的,但相似之处到此为止。在添加独立过程的情况下,共形过程集也是闭合的。因此,白噪声和W的和是共形的,但不是马尔可夫的。在白噪声和W的卷积之前,似乎不太可能存在另一个高斯增量的保角过程。Whittle(1954)的平稳高斯过程族具有马尔可夫性质[Chilès和Delfiner(1999)],但该族在共形映射和卷积下都不是封闭的。
[116] CHILÈS,J.-P.和DELFINER,P.(1999)。地理统计学。纽约威利·Zbl 0922.62098号
[117] FEy NMAN,R.P.、LEIGHTON,R.B.和SANDS,M.(1964年)。费曼物理讲座。马萨诸塞州雷丁市Addison-Wesley。
[118] 弗雷泽·D·A·S(1968b)。推理的结构。纽约威利·Zbl 0164.48703号
[119] 赫尔兰,I.S.(1999a)。从对称和统计建模的量子力学。国际。J.理论。Phy第38条,1851-1881·Zbl 0953.81003号 ·doi:10.1023/A:1026676913271
[120] KINGMAN,J.F.C.(1972年)。关于球面对称的随机序列。生物特征59 492-494。JSTOR公司:·Zbl 0238.60025号 ·doi:10.1093/生物技术/59.2.492
[121] 马库拉赫(1839)。一篇关于哭失速反射和折射的动力学理论的文章。事务处理。罗伊。爱尔兰学院21 17-50。
[122] MATHERON,G.(1971)。区域化变量理论及其应用。枫丹白露数学形态学中心教长。
[123] 怀特·P(1954)。关于平面内的静止过程。生物特征41 434-449。JSTOR公司:·Zbl 0058.35601号 ·doi:10.1093/biomet/41.3-4.434
[124] WICHURA,M.(2001年)。一些有限性定理。
[125] 伊利诺伊州芝加哥60637-1514电子邮件:pmcc@galton.uchicago.edu ·Zbl 1194.00044号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。