×

指数族的平滑样条方差分析,应用于威斯康星州糖尿病视网膜病变的流行病学研究。(1994年内曼纪念讲座)。 (英语) Zbl 0854.62042号

小结:设(y_i\),\(i=1,\dots,n\)是密度为\(y_i)的独立观测值,其形式为\(h(y_i,f_i)=\exp[y_i_i-b(fi)+c(y_ i)]\,其中\(b\)和\(c\)是给定的函数,\(b~)是两倍连续可微的,并且有界于0。设\(fi=f(t(i))\),其中\(t=(t1,\dots,t_d)\在{\mathcal t}^{(1)}\otimes\cdots\otimes{\matchcal t}^(d)}={\mathcal t}\)中,\({\math2al t}(\alpha)}\)是相当一般形式的可测空间,\(f\)是\({mathcal t}\)上的一个未知函数,具有一些假定的“光滑”性质。给定(y_i,t(i),i=1,dots,n),需要在({mathcal t})中包含的某个感兴趣区域中估计(f(t))。
我们开发了平滑样条方差分析模型对该表格数据的拟合\[f(t)=C+\sum_\alpha f_alpha(t\alpha)+\sum_{\alpha<\beta}f_{\ alpha\beta{(t_alpha,t_beta)+\cdots。\]分解的分量满足边条件,这推广了参数方差分析的常用边条件。在适当的函数空间中,得到了(f)的估计值作为\[{mathcal L}(y,f)+\sum_\alpha\lambda_\alfa J_\alα(f_alpha)+\sam_{alpha<\beta}\lambda{\alpha\ beta}J_{\alfa\beta{(f_alpha\betaneneneep)+\cdots,\]其中,({mathcal L}(y,f))是给定的(f)的负对数似然,(y=(y_1,dots,y_n)’是二次惩罚泛函,ANOVA分解以某种方式终止。将此程序转换为实用数据分析工具需要五个主要部分:
(1) 确定ANOVA分解中包含哪些项的方法(模型选择),(2)选择平滑参数良好值的方法,(lambda{alpha\beta},dots\),(3)关于估计的置信声明方法,(4)计算的数值算法,最后,(5)公共软件。
在本文中,我们依靠早期的工作并填补了重要的空白,实施了这一计划。整体方案应用于威斯康星州糖尿病视网膜病变流行病学研究的Bernoulli数据,根据糖化血红蛋白、糖尿病持续时间和体重指数对糖尿病视网膜病变进展风险进行建模。相信该结果在大型流行病学研究数据分析中具有广泛的实际应用。

MSC公司:

62G07年 密度估算
41甲15 样条线近似
第62页第10页 统计学在生物学和医学中的应用;元分析
65日第10天 数值平滑、曲线拟合
41A63型 多维问题
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] BATES,D.M.、LINDSTROM,M.J.、WAHBA,G.和YANDELL,B.S.1987。GCVPACK:通用交叉验证例程。通信统计。仿真计算。16 263 297. Z轴·Zbl 0618.62004号 ·doi:10.1080/03610918708812590
[2] 布莱曼,L.1991。利用噪声数据估计多元函数的方法。讨论。技术计量学33 125 160。Z.JSTOR公司:·Zbl 0742.62037号 ·doi:10.2307/1269038
[3] 布莱曼,L.、弗里德曼,J.、奥尔森,R.和斯通,C.1984。分类和回归树。华兹华斯,加利福尼亚州贝尔蒙特·Zbl 0541.62042号
[4] CHAMBERS,J.和HASTIE,T.1992年。加利福尼亚州贝尔蒙特市S.Wadsworth和Brooks Cole的统计模型·Zbl 0776.62007号
[5] 陈,Z.1991。交互样条模型及其收敛速度。安。统计师。19 1855 1868. ·Zbl 0738.62065号 ·doi:10.1214/aos/1176348374
[6] 陈,Z.1993。用交互样条模型拟合多元回归函数。J.罗伊。统计师。Soc.序列号。乙55 473 491。Z.JSTOR公司:·Zbl 0783.62029号
[7] CHEN,Z.,GU,C.和WAHBA,G.1989。评论A.Buja、T.Hastie和R.Tibshirani的“线性平滑器和加法模型”。安。统计师。17 515 521. Z.公司·Zbl 0689.62029号 ·doi:10.1214/aos/1176347115
[8] CHENG,B.和TITERINGTON,D.,1994年。神经网络:从统计学角度Z的综述,并进行讨论。统计师。科学。9 2 54。Z.公司·Zbl 0955.62589号 ·doi:10.1214/ss/1177010638
[9] COX,D.和CHANG,Y.1990。广义平滑样条的迭代状态空间算法和交叉验证。香槟伊利诺伊大学统计系技术报告49。Z.Z.公司。
[10] COX,D.、KOH,E.、WAHBA,G.和YANDELL,B.1988年。在半参数偏样条和广义样条模型中测试参数零模型Z.hy势。安。统计师。16 113 119. Z.公司·Zbl 0673.62017号 ·doi:10.1214/aos/1176350693
[11] CRAVEN,P.和WAHBA,G.1979年。用样条函数平滑噪声数据:用广义交叉验证方法估计平滑的正确程度。数字。数学。31 377 403. Z.公司·Zbl 0377.65007号 ·doi:10.1007/BF01404567
[12] EFRON,B.和STEIN,C.,1981年。方差的折刀估计。安。统计师。9 586 596. Z.公司·Zbl 0481.62035号 ·doi:10.1214/aos/1176345462
[13] EFRON,B.和TIBSHIRANI,R.1993年。引导程序简介。查普曼和霍尔,伦敦。Z.公司·Zbl 0835.62038号
[14] 欧盟银行,R.1988。样条平滑和非参数回归。纽约州德克尔·Zbl 0702.62036号
[15] 弗里德曼,J.1991。多元自适应回归样条。安。统计师。19 1 141. Z.公司·兹比尔0765.62064 ·doi:10.1214/aos/1176347963
[16] FRIEDMAN,J.H.和STUETZLE,W.,1981年。投影追踪回归。J.艾默。统计师。协会76 817 823。Z.JSTOR公司:·doi:10.2307/2287576
[17] GEMAN,S.、BIENENSTOCK,E.和DOURSAT,R.1992。神经网络和偏差方差困境。神经计算4 1 58。Z。
[18] 吉拉德,D.1987。一种快速的“蒙特卡罗交叉验证”程序,用于处理含有噪声数据的大型最小二乘问题。技术报告RR 687-M,IMAG,法国格勒诺布尔。Z.公司·Zbl 0665.65010号
[19] 吉拉德,D.1989。一种快速的“蒙特卡罗交叉验证”程序,用于处理含有噪声数据的大型最小二乘问题。数字。数学。56 1 23. Z.公司·Zbl 0665.65010号 ·doi:10.1007/BF01395775
[20] 吉拉德,D.1991。岭L回归和正则化中GCV和C的快速随机版本的非理想最优性。安。统计师。19 1950 1963. Z.公司·Zbl 0754.62030号 ·doi:10.1214/aos/1176348380
[21] GOLUB,G.和VON MATT,U.1995。大规模问题中的广义交叉验证。斯坦福大学科学计算数学项目技术报告即将发布。Z。
[22] GREEN,P.和SILVERMAN,B.1994。非参数回归和广义线性模型。查普曼和霍尔,伦敦。Z.公司·Zbl 0832.62032号
[23] GREEN,P.和YANDELL,B.1985年。半参数广义线性模型。统计中的课堂笔记。32 44 55. 柏林施普林格。Z。
[24] GU,C.1989年。RKPACK及其应用:拟合平滑样条模型。在Z会议记录中,统计计算第42 51节。阿默尔。统计师。弗吉尼亚州亚历山大市协会代码。可通过netlib访问。Z。
[25] GU,C.1990年。非高斯回归模型中的自适应样条平滑。J.艾默。统计师。协会85 801 807。Z.JSTOR公司:·doi:10.2307/2290018
[26] GU,C.1992年a。交叉验证非高斯数据。计算与图形统计杂志1 169 179。Z。
[27] GU,C.1992年b。带加法项的非参数回归模型的诊断。J.艾默。统计师。协会87 1051 1057。Z。
[28] 顾,C.1992c。惩罚似然回归:贝叶斯分析。统计师。Sinica 2 255 264号。Z.公司·Zbl 0822.62023号
[29] GU,C.,BATES,D.,CHEN,Z.和WAHBA,G.1989。通过Householder三对角化计算GCV函数,并应用于相互作用样条模型的拟合。SIAM J.矩阵分析。申请。10 457 480. Z.公司·Zbl 0685.65134号 ·数字对象标识代码:10.1137/0610033
[30] GU,C.和QIU,C.1994。惩罚似然回归:一个简单的随机分析。统计师。Sinica 4 297 304号。Z.公司·Zbl 0823.62050号
[31] GU,C.和WAHBA,G.1991a。J.Friedman对“多元自适应回归样条曲线”的评论。安。统计师。19 115 123. Z.公司·兹比尔0765.62064 ·doi:10.1214/aos/1176347963
[32] GU,C.和WAHBA,G.1991b。通过牛顿法使用多个平滑参数最小化GCV GML分数。SIAM J.科学。统计师。计算。12 383 398. ·Zbl 0727.65009号 ·doi:10.1137/0912021
[33] GU,C.和WAHBA,G.1993a。张量积薄板样条方差的半参数分析。J.罗伊。统计师。Soc.序列号。乙55 353 368。Z.JSTOR公司:·Zbl 0786.62048号
[34] GU,C.和WAHBA,G.1993b。采用成分贝叶斯“置信区间”的平滑样条方差分析。《计算与图形统计学杂志》2 97 117。Z.JSTOR公司:·doi:10.2307/1390957
[35] HASTIE,T.和TIBSHIRANI,R.,1990年。广义加性模型。查普曼和霍尔,伦敦。Z.公司·Zbl 0747.62061号
[36] HASTIE,T.和TIBSHIRANI,R.1993年。变系数模型。J.罗伊。统计师。Soc.序列号。乙55 757 796。Z.JSTOR公司:·Zbl 0796.62060号
[37] 哈德森,M.1978。指数族的自然恒等式及其在多参数估计中的应用。安。统计师。6 473 484. Z.公司·Zbl 0391.62006号 ·doi:10.1214/aos/1176344194
[38] 哈金森,M.1984。噪声数据的一些曲面拟合和轮廓绘制程序的摘要。澳大利亚联邦科学与工业研究组织数学与统计部ACT 84 6技术报告,堪培拉。Z。
[39] 哈金森,M.1989。拉普拉斯平滑样条影响矩阵迹的随机估计。通信统计。仿真计算。18 1059 1076. Z.公司·兹伯利0695.62113 ·doi:10.1080/03610918908812806
[40] 哈金森,M.和盖斯勒,P.1994。样条线不仅仅是平滑插值器。Geoderma 62 45 67。
[41] KLEIN,B.E.K.,DAVIS,M.D.,SEGAL,P.,LONG,J.A.,HARRIS,W.A.,HAUG,G.A.,MAGLI,Y.和Z。
[42] Sy RJALA,S.1984年。糖尿病视网膜病变:严重程度和进展评估。眼科91 10 17。Z。
[43] KLEIN,R.、KLEIN、B.E.K.、MOSS,S.E.和CRUICKSHANKS,K.J.1994a。高血糖血症与糖尿病视网膜病变长期发病率和进展的关系。内科学档案154 2169 2178。Z。
[44] KLEIN,R.、KLEIN、B.E.K.、MOSS,S.E.和CRUICKSHANKS,K.J.1994b。威斯康星州糖尿病视网膜病变流行病学研究。十四、。糖尿病视网膜病变的十年发病率和进展。眼科学档案112 1217 1228。Z。
[45] KLEIN,R.、KLEIN、B.E.K.、MOSS,S.E.、DAVIS,M.D.和DEMETS,D.L.1984a。威斯康星糖尿病视网膜病变流行病学研究。二、。诊断年龄小于30岁时糖尿病视网膜病变的患病率和风险。眼科档案102 520 526。Z。
[46] KLEIN,R.、KLEIN、B.E.K.、MOSS,S.E.、DAVIS,M.D.和DEMETS,D.L.1984b。威斯康星州糖尿病视网膜病变流行病学研究。三、 诊断年龄为30岁或以上时糖尿病视网膜病变的患病率和风险。眼科学档案102 527 532。Z。
[47] KLEIN,R.、KLEIN、B.E.K.、MOSS,S.E.、DAVIS,M.D.和DEMETS,D.L.1988年。糖化血红蛋白预测糖尿病视网膜病变的发生和进展。美国医学会杂志260 2864 2871。Z。
[48] KLEIN,R.、KLEIN、B.E.K.、MOSS,S.E.、DAVIS,M.D.和DEMETS,D.L.1989a。血压是糖尿病视网膜病变发生或进展的预测因素吗?内科学档案149 2427 2432。Z。
[49] KLEIN,R.、KLEIN、B.E.K.、MOSS,S.E.、DAVIS,M.D.和DEMETS,D.L.1989b。威斯康星州糖尿病视网膜病变流行病学研究。九、 诊断年龄小于30岁时糖尿病视网膜病变的四年发病率和进展。眼科学档案107 237 243。Z。
[50] KLEIN,R.、KLEIN、B.E.K.、MOSS,S.E.、DAVIS,M.D.和DEMETS,D.L.1989c。威斯康星州糖尿病视网膜病变流行病学研究。十、糖尿病视网膜病变发病年龄在30岁或30岁以上时的四年发病率和进展情况。眼科学档案107 244 249。Z。
[51] KLEIN R.、KLEIN B.E.K.、MOSS S.E.、DEMETS D.L.、KAUFFMAN I.和VOSS P.S.1984。威斯康星州南部糖尿病患病率。美国流行病学杂志119 54 61。Z。
[52] LI,K.C.1985年。从Stein的无偏风险估计到广义交叉验证方法。安。统计师。13 1352 1377. Z.公司·Zbl 0605.62047号 ·doi:10.1214/aos/1176349742
[53] LI,K.C.1986年。岭回归L中C的无偏最优性和广义交叉验证及其在样条平滑中的应用。安。统计师。14 1101 1112. Z.公司·Zbl 0629.62043号 ·doi:10.1214/aos/1176350052
[54] 刘,Y.1993。神经网络中泛化误差和模型选择的无偏估计。未发表手稿,布朗大学物理系大脑和神经系统研究所。
[55] LUO,Z.和WAHBA G.1995。Hy-brid自适应样条曲线。技术报告947,威斯康星大学麦迪逊分校统计系。Z。
[56] 马洛斯,C.1973。对C.Technometrics 15 661 675的一些评论。p Z·Zbl 0269.62061号 ·doi:10.2307/1267380
[57] MCCULLAGH,P.和NELDER,J.1989年。广义线性模型,第二版,查普曼和霍尔,伦敦。Z.公司·兹比尔074462098
[58] 穆迪,J.1991。有效参数数:非线性学习系统中的泛化和正则化分析。《神经信息Z处理系统进展》,J.Moody、S.Hanson和R.Lippman主编,847 854。考夫曼,加利福尼亚州圣马特奥。
[59] NELDER,J.和WEDDERBURN,R.1972。广义线性模型。J.罗伊。统计师。Soc.序列号。A 35 370 384。Z。
[60] Ny CHKA,D.1988年。平滑样条曲线的贝叶斯置信区间。J.艾默。统计师。协会83 1134 1143。Z.JSTOR公司:·doi:10.2307/2290146
[61] Ny CHKA,D.1990年。平滑样条的平均后验方差和平均平方误差的一致估计。安。统计师。18 415 428. Z.公司·Zbl 0731.62084号 ·doi:10.1214/aos/1176347508
[62] Ny CHKA,D.、WAHBA,G.、GOLDFARB,S.和PUGH,T.,1984年。基于二维横截面观测值估计三维肿瘤大小分布的交叉验证样条方法。J.艾默。统计师。协会79 832 846。Z.O’SULLIVAN,F.1983年。一些惩罚似然估计方案的分析。威斯康星大学麦迪逊分校统计系,技术报告726,博士论文。Z.O'SULLIVAN,F.1990年。二维拉普拉斯平滑的迭代方法及其在图像恢复中的应用。J.艾默。统计师。协会85 213 219。Z.O'SULLIVAN,F.、YANDELL,B.和RAy NOR,W.,1986年。广义线性模型中回归函数的自动平滑。J.艾默。统计师。协会81 96 103。Z.JSTOR公司:·兹比尔0572.62085 ·doi:10.2307/2288713
[63] RAGHAVAN,N.1993年。非参数logistic回归中的贝叶斯推断。伊利诺伊大学香槟分校博士论文。Z。
[64] RIPLEY,B.1994年。神经网络和相关分类方法。J.罗伊。统计师。Soc.序列号。B 56 409 456。Z.JSTOR公司:·Zbl 0815.62037号
[65] ROOSEN,C.和HASTIE,T.1994年。自动平滑样条线投影追踪。计算与图形统计杂志3 235 248。Z.SAS INSTITUTE 1989年。SAS STAT用户指南,第6版,第4版。SAS Institute,Inc.,Cary,North Carolina。Z。
[66] SHIAU,J.J.、WAHBA,G.和JOHNSON,D.,1986年。包含对流层顶和锋面边界信息的部分样条模型。大气与海洋技术杂志3 714 725。Z。
[67] 斯通,C.1994。讨论了多项式样条及其张量积在多元Z函数估计中的应用。安。统计师。22 118 184. Z.公司·Zbl 0827.62038号 ·doi:10.1214/aos/1176325361
[68] WAHBA,G.1978年。不正确的先验、样条曲线平滑和防止回归中模型错误的问题。J.罗伊。统计师。Soc.序列号。乙40 364 372。Z.JSTOR公司:·Zbl 0407.62048号
[69] WAHBA,G.1980。样条基、正则化和广义交叉验证,用于解决含有大量噪声数据的近似问题。在近似理论中,Z.III W.切尼,第905 912版。学术出版社,纽约·Zbl 0485.41012号
[70] WAHBA,G.1981年。球体上的样条线插值和平滑。SIAM J.科学。统计师。计算。2 5 16. Z.公司·Zbl 0537.65008号 ·doi:10.1137/0902002
[71] 瓦赫巴,1982年。勘误表:球体上的样条插值和平滑。SIAM J.科学。统计师。计算。3 385 386. Z.公司·Zbl 0537.65009号 ·doi:10.1137/0903024
[72] WAHBA,G.1983年。交叉验证平滑样条的贝叶斯“置信区间”。J.罗伊。统计师。Soc.序列号。B 45 133 150。Z.JSTOR公司:·兹比尔0538.65006
[73] WAHBA,G.1990年。观测数据的样条模型。费城SIAM。Z.公司·Zbl 0813.62001号
[74] WAHBA,G.1992年。基于平滑样条和再生核的多元函数和算子估计。在非线性建模和预测中。圣菲研究所Z.《复杂性科学研究》,M.Casdagli和S.Eubank合编,第12 95 112页。马萨诸塞州雷丁市Addison-Wesley。
[75] WAHBA,G.1995年。非线性学习系统中的泛化和正则化。在HandZ中。《大脑理论和神经网络》,M.Arbib主编,426 430。麻省理工学院出版社。
[76] WAHBA,G.、GU,C.、WANG,Y.和CHAPPELL,R.,1995年。软分类,即风险估计,通过惩罚对数似然和平滑样条方差分析。在泛化数学中。圣达菲研究所《复杂性科学研究》,Z.Proceedings D.Wolpert,ed.20 329 360。马萨诸塞州雷丁市Addison-Wesley·Zbl 0861.68079号
[77] WAHBA,G.、JOHNSON,D.、GAO,F.和GONG,J.1994年。数值天气预报模型的自适应调整:三维和四维数据同化中的随机GCV。每月天气回顾123 3358 3369。Z。
[78] WAHBA,G.和WENDELBERGER,J.1980。使用样条和交叉验证进行变分目标分析的一些新的数学方法。每月天气回顾108 1122 1145。Z。
[79] 王,Y.1994。指数族数据方差的平滑样条分析。威斯康星大学麦迪逊分校928技术报告博士论文。Z。
[80] 王,1995年。GRKPACK:将方差模型的平滑样条分析拟合到指数族的数据。技术报告942,威斯康星大学麦迪逊分校统计系。Z。
[81] WANG,Y.和WAHBA,G.1995。平滑样条的Bootstrap置信区间及其与贝叶斯“置信区间”的比较。J.Statist。计算。模拟。51 263 280. Z.公司·Zbl 0842.62036号 ·网址:10.1080/00949659508811637
[82] WANG,Y.、WAHBA,G.、CHAPPELL,R.和GU,C.,1995年。贝努利SS-ANOVA模型中平滑参数估计和贝叶斯置信区间的仿真研究。通信统计。仿真计算。出现。Z.公司·Zbl 0850.62340号 ·doi:10.1080/03610919508813292
[83] WEBER,R.和TALKNER,P.1993年。关于空间相关函数模型的一些评论。每月天气回顾121 2611 2617。Z。
[84] WONG,W.1992年。估计损失。芝加哥大学统计系技术报告356。Z。
[85] XIANG,D.和WAHBA,G.1995。测试广义线性模型Null Hy pothesis与“平滑”备选方案。威斯康星大学麦迪逊分校统计系技术报告953。Z。
[86] YANDELL,B.1986年。非线性广义交叉验证算法。《计算机科学Z与统计学:第18届界面综合》,T.Boardman主编,Amer。统计师。华盛顿特区协会。
[87] 威斯康星州马迪逊53706 1420华盛顿高度密歇根州安娜堡48109
[88] CHONG GU RONALD KLEIN,医学博士,统计系BARBARA KLEIN(医学博士),普渡大学眼科数学科学系大楼,印度威斯康星州西拉斐特大学,邮编:47907 610 NORTH WALNUT STREET MADISON,WISCONSIN 53705
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。