×

零膨胀非负连续数据的统计分析:综述。 (英语) Zbl 1420.62457号

摘要:零膨胀非负连续(或半连续)数据在生物医学、经济和生态学研究中经常出现。示例包括药物滥用、医疗费用、医疗利用、生物标记物(例如CD4细胞计数、冠状动脉钙评分)、单细胞基因表达率和微生物组分的(相对)丰度。这类数据的特征通常是存在很大一部分零值和正连续值,这些值向右倾斜且异方差。这两个特征都表明,没有简单的参数分布可能适合建模此类结果。本文回顾了分析零膨胀非负结果数据的统计方法。我们将从横截面设置开始,讨论分离零值和正值的方法,并引入灵活的模型来表征正值的右偏态和异方差。然后,我们将介绍相关零膨胀非负连续数据的模型,使用随机效应处理来自同一对象的重复测量值与模型不同部分的重复测量结果之间的相关性。我们还将讨论相关主题的扩展,例如零膨胀计数和生存数据、非线性协变量效应以及纵向零膨胀非负连续数据和生存的联合模型。最后,我们将用三个真实数据集(即微生物组、医疗费用和饮酒)来说明这些方法。将提供示例代码以促进这些方法的应用。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62米10 统计学中的时间序列、自相关、回归等(GARCH)
62J02型 一般非线性回归
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 艾奇逊J.(1955)。关于原点处具有离散概率质量的正随机变量的分布。J.Amer。统计师。协会50 901-908·Zbl 0065.12604号
[2] Albert,P.S.(2005)。给编辑的信。生物统计学61 879-881。
[3] Amemiya,T.(1994)。统计学和计量经济学导论。哈佛大学出版社,马萨诸塞州波士顿。
[4] Bang,H.和Tsiatis,A.A.(2002年)。截尾成本数据的中值回归。生物统计学58 643-649·Zbl 1210.62041号 ·doi:10.1111/j.0006-341X.2002.00643.x
[5] Basu,A.和Manning,W.G.(2006年)。指数条件均值框架内比例风险假设的检验。卫生服务。结果研究方法6 81-100。
[6] Basu,A.、Manning,W.G.和Mullahy,J.(2004)。比较替代模型:对数与考克斯比例风险?健康经济。13 749-765。
[7] Basu,A.和Rathous,P.J.(2005)。使用灵活的链接和方差函数模型估计对健康结果的边际和增量影响。生物统计6 93-109·Zbl 1069.62085号 ·doi:10.1093/biostatistics/kxh020
[8] Berk,K.N.和Lachenbruch,P.A.(2002年)。带零的重复测量。Stat.Methods Med.Res.11 303-316.《统计方法医学研究》,第11卷,第303-316页·兹比尔1121.62574 ·doi:10.1191/0962280202sm293ra
[9] Bjerre,B.、Marques,P.、Selen,J.和Thorsson,U.(2007年)。瑞典酒后驾车者酒精点火联锁计划:对医院护理利用率和病假的影响。添加102 560-570。
[10] Blough,D.K.,Madden,C.W.和Hornbrook,M.C.(1999)。使用广义线性模型建模风险。《健康经济学杂志》18 153-171。
[11] Boag,J.W.(1949年)。癌症治疗治愈患者比例的最大似然估计。J.罗伊。统计师。Soc.11 15-53·兹标0034.08001 ·doi:10.1111/j.2517-6161.194.tb00020.x
[12] Box,G.E.P.和Cox,D.R.(1964年)。转换分析。(经讨论)J.R.Stat.Soc.Ser。B.统计方法26 211-252·Zbl 0156.40104号 ·doi:10.1111/j.2517-6161.1964.tb00553.x
[13] Breton,C.V.、Kile,M.L.、Catalano,P.J.、Hoffman,E.、Quamruzzaman,Q.、Rahman,M.、Mahiuddin,G.和Christiani,D.C.(2007年)。GSTM1和APE1基因型影响砷诱导的氧化应激:一项重复测量研究。环境。健康6 39。
[14] Chai,H.S.和Bailey,K.R.(2008)。对数正态分布在离散分量为零的连续数据分析中的应用。统计医学27 3643-3655·doi:10.1002/sim.3210
[15] Chai,H.、Jiang,H.,Lin,L.和Liu,L.(2018)。微生物组分数据的边缘化两部分Beta回归模型。公共科学图书馆计算。生物14 e1006329。
[16] Chen,E.Z.和Li,H.(2016)。用于分析纵向微生物组分数据的两部分混合效应模型。生物信息学32 2611-2617。
[17] Chen,J.、Johnson,B.A.、Wang,X.Q.、O'Quigley,J.,Isaac,M.、Zhang,D.和Liu,L.(2012)。酒精治疗研究中的轨迹分析。酒精。临床。实验结果36 1442-1448。
[18] Chen,J.、Liu,L.、Johnson,B.A.和O'Quigley,J.(2013a)。半参数混合模型的惩罚似然估计及其在酒精治疗研究中的应用。《美国法律总汇》第32卷第335-346页。
[19] Chen,J.、Liu,L.、Zhang,D.和Shih,Y.-C.T(2013b)。均值和方差函数的灵活模型,应用于医疗成本数据。Stat.Med.32 4306-4318。
[20] Chen,J.、Liu,L.、Shih,Y.-C.T.、Zhang,D.和Severini,T.A.(2016)。相关医疗费用的灵活模型,应用于医疗支出小组调查数据。Stat.Med.35 883-894。
[21] Cooper,N.J.、Lambert,P.C.、Abrams,K.R.和Sutton,A.J.(2007年)。使用贝叶斯-马尔可夫链蒙特卡罗方法预测随时间变化的成本:早期炎症性多关节炎的应用。卫生经济学16 37-56。
[22] Cotter,D.、Thamer,M.、Narasimhan,K.、Zhang,Y.和Bullock,K.(2006)。将epoetin研究转化为实践:政府的作用和科学证据的使用。健康事务.251249-1259。
[23] Dominici,F.和Zeger,S.L.(2005)。使用回归进行平滑分位数比率估计:估计可归因于吸烟的疾病的医疗支出。生物统计6 505-519·Zbl 1169.62405号 ·doi:10.1093/biostatistics/kxi031
[24] Dominici,F.、Cope,L.、Naiman,D.Q.和Zeger,S.L.(2005)。平滑分位数比率估计。生物特征92 543-557·Zbl 1183.62056号 ·doi:10.1093/biomet/92.3543
[25] Dow,W.H.和Norton,E.C.(2003)。选择并解释用于角点解决方案的checkit和两部分模型。健康服务。结果研究方法。4 5-18。
[26] Duan,N.(1983年)。涂抹估计:一种非参数重传方法。J.Amer。统计师。协会78 605-610·Zbl 0534.62021号 ·网址:10.1080/01621459.1983.10478017
[27] Duan,N.、Manning,W.G.、Morris,C.和Newhouse,J.P.(1983年)。医疗保健需求替代模型的比较。J.总线。经济。统计1 115-126。
[28] Dudley,R.A.、Harrell,F.E.Jr、Smith,L.R.、Mark,D.B.、Calif,R.M.、Pryor,D.B.,Glower,D.、Lipscomb,J.和Hlatky,M.(1993年)。比较评估临床因素对冠状动脉搭桥手术费用影响的分析模型。临床杂志。流行病46 261-271。
[29] Falk,D.、Wang,X.Q.、Liu,L.、Fertig,J.、Mattson,M.、Ryan,M.,Johnson,B.、Stout,R.和Litten,R.Z.(2010年)。无酗酒天数的受试者百分比:作为酒精临床试验疗效终点的评估。酒精。临床。2022-2034年到期决议34。
[30] 《永别了,V.T.》(1982)。使用混合模型分析长期幸存者的生存数据。生物统计学38 1041-1046。
[31] Finak,G.、McDavid,A.、Yajima,M.、Deng,J.、Gersuk,V.、Shalek,A.K.、Slichter,C.K.、Miller,H.W.、McElrath,M.J.、Prlic,M.,Linsley,P.S.和Gottardo,R.(2015)。MAST:评估转录变化和表征单细胞RNA测序数据异质性的灵活统计框架。基因组生物学.16 278。
[32] 食品和药物管理局(2006年)。Vivitrol 21-897的医学综述。美国政府,马里兰州罗克维尔。
[33] Gatsonis,C.、Epstein,A.M.、Newhouse,J.P.、Normand,S.L.和McNeil,B.J.(1995年)。老年急性心肌梗死患者冠状动脉造影应用的变化:一项使用层次logistic回归的分析。医疗护理33 625-642。
[34] Ghosh,P.和Albert,P.S.(2009年)。纵向半连续数据的贝叶斯分析及其在针灸临床试验中的应用。计算。统计师。数据分析53 699-706·Zbl 1452.62808号 ·doi:10.1016/j.csda.2008.09.011
[35] Hall,D.B.(2000)。具有随机效应的零膨胀泊松和二项回归:案例研究。生物统计学56 1030-1039·Zbl 1060.62535号 ·doi:10.1111/j.0006-341X.2000.01030.x
[36] Hall,D.B.和Severini,T.A.(1998年)。聚类数据的扩展广义估计方程。J.Amer。统计师。协会93 1365-1375·Zbl 1032.62066号 ·doi:10.1080/01621459.1998.10473798
[37] Han,D.,Liu,L.,Su,X.,Johnson,B.和Sun,L.(2018年)。随机效应两部分模型的变量选择。统计方法医学研究DOI:10.1177/0962280218784712。
[38] Heckman,J.J.(1979年)。样本选择偏差作为规范错误。计量经济学47 153-161·Zbl 0392.62093号 ·doi:10.2307/1912352
[39] Heitjan,D.F.,Kim,C.Y.和Li,H.(2004年)。审查数据成本效益的贝叶斯估计。Stat.Med.23 1297-1309。
[40] Henderson,R.、Diggle,P.和Dobson,A.(2000年)。纵向测量和事件时间数据的联合建模。生物统计1465-480·Zbl 1089.62519号 ·doi:10.1093/biostatistics/1.4.465
[41] Hyndman,R.和Grunwald,G.(2000年)。混合分布马尔可夫模型的广义加性建模及其在墨尔本降雨量中的应用。澳大利亚。N.Z.J.Stat.42 145-158。
[42] Jain,A.K.和Strawderman,R.L.(2002)。医疗成本数据的灵活风险回归建模。生物统计3 101-118·兹比尔1133.62354 ·doi:10.1093/biostatistics/3.1.101
[43] James,G.、Witten,D.、Hastie,T.和Tibshirani,R.(2013)。统计学习导论:在R.Springer统计课文中的应用103。纽约州施普林格·Zbl 1281.62147号
[44] Jha,A.K.、Varosy,P.D.、Kanaya,A.K、Hunninghake,D.B.、Hlatky,M.A.、Waters,D.D.、Furberg,C.D.和Shlipak,M.G.(2003年)。患有心脏病的黑人和白人女性在医疗保健和疾病结局方面的差异。第108 1089-1094号通告。
[45] Johnson,B.A.、Rosenthal,N.、Capece,J.A.、Wiegand,F.、Mao,L.、Bayers,K.、McKay,A.、Ait-Daoud,N.,Anton,R.F.、Ciraulo,D.A.、Kranzler,H.R.、Mann,K.,O'Malley,S.和Swift,R.M.(2007年)。托吡酯治疗酒精依赖——一项随机对照试验。美国医学协会期刊298 1641-1651。
[46] Johnson,B.A.、Ait-Daoud,N.、Wang,X.-Q.、Penberthy,J.K.、Javors,M.A.、Seneviratne,C.和Liu,L.(2013)。托吡酯治疗可卡因成瘾:一项随机临床试验。美国精神病学杂志医学主任协会70 1338-1346。
[47] Kalbfleisch,J.D.和Prentice,R.L.(2002)。失效时间数据的统计分析,第二版,《概率统计中的威利级数》。Wiley Interscience,新泽西州霍博肯·Zbl 1012.62104号
[48] Kuk,A.Y.C.和Chen,C.(1992年)。将逻辑回归与比例风险回归相结合的混合模型。生物特征79 531-541·Zbl 0775.62300号 ·doi:10.1093/biomet/79.3.531
[49] Lambert,D.(1992)。零膨胀泊松回归,及其在制造缺陷中的应用。技术计量学34 1-14·Zbl 0850.62756号 ·doi:10.2307/1269547
[50] Leung,S.F.和Yu,S.(1996年)。关于样本选择和两部分模型之间的选择。计量经济学杂志72 197-229·Zbl 0881.62132号 ·文件编号:10.1016/0304-4076(94)01720-4
[51] Lewis,J.D.、Chen,E.Z.、Baldassano,R.N.、Otley,A.R.、Griffiths,A.M.、Lee,D.、Bittinger,K.、Bailey,A.、Friedman,E.S.、Hoffmann,C.、Albenberg,L.、Sinha,R.、Compher,C.、Gilroy,E.、Nessel,L.,Grant,A.、Chehoud,C.,Li,H.、Wu,G.和Bushman,F.D.(2015)。炎症、抗生素和饮食是小儿克罗恩病肠道微生物组的环境压力源。细胞宿主微生物18 489-500。
[52] Li,P.、Schneider,J.E.和Ward,M.M.(2007)。关键通道医院转换对患者安全的影响。健康服务。第42号决议2089-2108;讨论2294-2323。
[53] Li,C.S.和Taylor,J.M.G.(2002)。半参数加速失效时间-修复模型。Stat.Med.21 3235-3247。
[54] Lin,D.Y.、Etzioni,R.、Feuer,E.J.和Wax,Y.(1997)。根据不完整的随访数据估算医疗费用。生物统计学53 419-434·Zbl 0881.62116号 ·doi:10.2307/2533947
[55] Lipscomb,J.、Ancukiewicz,M.、Parmigiani,G.、Hasselblad,V.、Samsa,G.和Matchar,D.B.(1998)。预测疾病成本:中风替代模型的比较。医学博士。制造商18 S39-S56。
[56] Littell,R.C.、Milliken,G.A.、Stroup,W.W.、Wolfinger,R.D.和Schabernberger,O.(2006)。SAS for Mixed Model,第二版,SAS Institute Inc.,北卡罗来纳州卡里。
[57] Liu,L.(2009)。联合建模纵向半连续数据和生存,并应用于纵向医疗成本数据。Stat.Med.28 972-986。
[58] Liu,L.和Huang,X.(2008)。在脆弱性比例风险模型中使用高斯求积进行估计。统计医学27 2665-2683。
[59] Liu,Y.和Liu,L.(2015)。纵向数据和事件发生时间的联合模型。《劳特利奇国际护理研究高级定量方法手册》(S.J.Henly编辑)253-263。泰勒和弗朗西斯,伦敦。
[60] Liu,L.,Ma,J.Z.和Johnson,B.A.(2008)。多级两部分随机效应模型,用于酒精依赖性研究。统计医学27 3528-3539。
[61] Liu,L.、Wolfe,R.A.和Huang,X.(2004年)。针对复发事件和终末期事件的共享虚弱模型。生物统计学60 747-756·Zbl 1274.62827号 ·doi:10.1111/j.0006-341X.2004.00225.x
[62] Liu,L.,Wolfe,R.A.和Kalbfleisch,J.D.(2007)。审查医疗费用和死亡率的共享随机效应模型。Stat.Med.26 139-155。
[63] Liu,L.、Conaway,M.R.、Knaus,W.A.和Bergin,J.D.(2008)。随机效应四部分模型,应用于相关医疗费用。计算。统计师。数据分析52 4458-4473·Zbl 1452.62823号 ·doi:10.1016/j.csda.2008.02.034
[64] Liu,L.、Strawderman,R.L.、Cowen,M.E.和Shih,Y.C.T.(2010)。相关医疗费用的灵活两部分随机效应模型。《健康经济学杂志》29 110-123。
[65] Liu,L.,Huang,X.,Yaroshinsky,A.和Cormier,J.N.(2016a)。存在终末事件时零膨胀复发事件的联合脆弱性模型。生物统计学72 204-214·Zbl 1393.62079号 ·doi:10.1111/biom.12376
[66] Liu,L.、Strawderman,R.L.、Johnson,B.A.和O'Quigley,J.M.(2016b)。分析重复测量的半连续数据,并应用于酒精依赖性研究。统计方法医学研究25 133-152。
[67] Lu,S.-E.,Lin,Y.和Shih,W.C.J.(2004)。使用聚类数据分析临床试验中的过度无变化。生物统计学60 257-267·Zbl 1130.62376号 ·doi:10.1111/j.0006-341X.2004.00155.x
[68] Mahmud,S.、Lou,W.W.和Johnston,N.W.(2010年)。具有多余零的重复测量数据的概率-对数偏态-正态混合模型,应用于儿科呼吸系统症状的队列研究。BMC医学研究方法10 55。
[69] Manning,W.G.(1998)。记录的因变量、异方差和重传问题。《健康经济学杂志》17 283-295。
[70] Manning,W.G.、Basu,A.和Mullahy,J.(2005)。偏态结果数据风险调整的广义建模方法。健康经济学杂志,20 465-488。
[71] Manning,W.G.,Duan,N.和Rogers,W.H.(1987)。关于样本选择和两部分模型之间选择的蒙特卡罗证据。计量经济学杂志35 59-82。
[72] Manning,W.G.和Mullahy,J.(2001)。估计日志模型:转换还是不转换?《健康经济学杂志》20 461-494。
[73] Manning,W.、Morris,C.、Newhouse,J.等人(1981年)。医疗保健需求的两部分模型:健康保险研究的初步结果。《健康、经济和健康经济学》(J.van der Gaag和M.Perlman编辑)103-123。荷兰北部,阿姆斯特丹。
[74] Martinussen,T.和Scheike,T.H.(2006)。生存数据的动态回归模型。生物与健康统计。纽约州施普林格·Zbl 1096.62119号
[75] McDavid,A.、Finak,G.、Chattopadyay,P.K.、Dominguez,M.、Lamoreaux,L.、Ma,S.S.、Roederer,M.和Gottardo,R.(2013)。基于单细胞qPCR的基因表达实验中的数据探索、质量控制和测试。生物信息29 461-467。
[76] Min,Y.和Agresti,A.(2005)。零膨胀计数数据重复测量的随机效应模型。统计模型5 1-19·Zbl 1070.62060号 ·doi:10.1191/1471082X05st084oa
[77] Moulton,L.和Halsey,N.(1995年)。带有检测限的混合模型,用于疫苗抗体反应的回归分析。生物统计学51 1570-1578·Zbl 0875.62502号 ·doi:10.2307/2533289
[78] Mullahy,J.(1998)。关于二的许多麻烦:重新考虑卫生计量经济学中的重传和两部分模型。《健康经济学杂志》17 247-281。
[79] Neelon,B.、O'Malley,A.J.和Norman,S.-L.T.(2011年)。纵向医疗支出数据的贝叶斯两部分潜在类别模型:评估心理健康和药物滥用平价的影响。生物统计学67 280-289·Zbl 1216.62040号 ·文件编号:10.1111/j.1541-0420.2010.01439.x
[80] Neelon,B.、O'Malley,A.J.和Smith,V.A.(2016)。卫生服务研究中的零修正计数和半连续数据建模第1部分:背景和概述。Stat.Med.35 5070-5093。
[81] Neelon,B.、Zhu,L.和Neelon、S.E.B.(2015)。半连续数据的贝叶斯两部分空间模型及其在急诊科支出中的应用。生物统计16 465-479。
[82] Neelon,B.、Chang,H.H.、Ling,Q.和Hastings,N.S.(2016年)。零膨胀计数数据的时空障碍模型:探索急诊科就诊的趋势。Stat.Methods Med.Res.25 2558-2576,《美国医学文摘》,第2558-2576页。
[83] Olsen,M.K.和Schafer,J.L.(2001)。半连续纵向数据的两部分随机效应模型。J.Amer。统计师。协会96 730-745·Zbl 1017.62064号 ·doi:10.1198/016214501753168389
[84] Othus,M.、Barlogie,B.、LeBlanc,M.L.和Crowley,J.J.(2012)。治愈模型是分析生存率的有用统计工具。临床。癌症研究18 3731-3736。
[85] Park,R.E.(1966年)。异方差误差项估计。计量经济学34 888。
[86] 彭毅(2000)。治愈率估计的非参数混合模型。生物统计学56 237-243·Zbl 1060.62651号 ·doi:10.1111/j.0006-341X.2000.00237.x
[87] 彭毅(2003)。拟合半参数曲线模型。计算。统计师。数据分析41 481-490·Zbl 1429.62588号 ·doi:10.1016/S0167-9473(02)00184-6
[88] Peng,Y.、Taylor,J.M.G.和Yu,B.(2007)。具有存活分数的多元失效时间数据的边际回归模型。寿命数据分析13 351-369·Zbl 1331.62434号 ·doi:10.1007/s10985-007-9042-4
[89] Pullenayegum,E.M.和Willan,A.R.(2007年)。用于成本效益分析的半参数回归模型:提高从审查数据进行估计的效率。统计医学26 3274-3299。
[90] Raudenbush,S.W.、Yang,M.-L.和Yosef,M.(2000)。通过高阶多元拉普拉斯近似,具有嵌套随机效应的广义线性模型的最大似然。J.计算。图表。统计9 141-157。
[91] Rigby,R.A.和Stasinopoulos,D.M.(2005)。位置、规模和形状的广义加性模型。J.R.统计社会服务。C.申请。统计数字54 507-554·Zbl 1490.62201号 ·doi:10.1111/j.1467-9876.2005.00510.x
[92] Robert,C.P.(2007年)。贝叶斯选择:从决策理论基础到计算实现,第二版,统计学中的施普林格文本。纽约州施普林格·Zbl 1129.62003号
[93] Rondeau,V.、Schaffner,E.、Corbière,F.、Gonzalez,J.R.和Mathoulin-Pélissier,S.(2013)。生存数据的治愈脆弱模型:应用于乳腺癌复发和结直肠癌医院再入院。统计方法医学研究22 243-260。
[94] Schoenfeld,D.(1982)。比例风险回归模型的部分残差。生物特征69 239-241·Zbl 0506.03001号
[95] Smith,V.A.、Preisser,J.S.、Neelon,B.和Maciejewski,M.L.(2014)。半连续数据的边缘化两部分模型。《美国法律总汇》第33卷第4891-4903页。
[96] Smith,V.A.、Neelon,B.、Maciejewski,M.L.和Preisser,J.S.(2017a)。两部分总比一部分好。健康服务。结果研究方法17 198-218。
[97] Smith,V.A.、Neelon,B.、Preisser,J.S.和Maciejewski,M.L.(2017b)。纵向半连续数据的边缘化两部分模型。统计方法医学研究26 1949-1968。
[98] 索贝尔,L.C.和索贝尔,M.B.(1992)。时间轴跟踪反馈:一种评估自我报告酒精消费量的技术。《测量酒精消费:心理社会和生物化学方法》(R.Z.Litten和J.P.Allen编辑)41-72。Humana Press Inc.,新泽西州托托瓦。
[99] Sposto,R.(2002)。癌症治疗模型分析:应用于儿童癌症组的数据。统计医学21 293-312。
[100] Stram,D.O.和Lee,J.W.(1994年)。纵向混合效应模型中的方差分量检验。生物统计学50 1171-1177·Zbl 0826.62054号 ·doi:10.2307/2533455
[101] Stukel,T.A.、Lucas,F.L.和Wennberg,D.E.(2005)。医疗保险急性心肌梗死患者侵袭强度与医疗管理的区域差异的长期结果。美国医学协会期刊293 1329-1337。
[102] Stukel,T.A.、Fisher,E.S.、Wennberg,D.E.、Alter,D.A.、Gottlieb,D.J.和Vermeulen,M.J.(2007年)。使用倾向评分和工具变量法分析有创心脏管理对AMI生存率的治疗选择偏倚效应的观察性研究。美国医学协会期刊297 278-285。
[103] Su,L.,Tom,B.D.M.和Farewell,V.T.(2009)。纵向半连续数据的两部分混合模型中的偏差。生物统计10 374-389·兹比尔1437.62617
[104] Su,X.、Wijayasinghe,C.S.、Fan,J.和Zhang,Y.(2016)。通过近似信息标准对Cox比例风险模型进行稀疏估计。生物统计学72 751-759·Zbl 1390.62121号 ·doi:10.1111/biom.12484
[105] Sy,J.P.和Taylor,J.M.G.(2000年)。Cox比例风险治愈模型中的估计。生物统计学56 227-236·Zbl 1060.62670号 ·doi:10.1111/j.0006-341X.2000.00227.x
[106] Therneau,T.M.和Grambsch,P.M.(2000)。生存数据建模:扩展考克斯模型。生物学与健康统计学。纽约州施普林格·Zbl 0958.62094号
[107] Tian,L.、Zucker,D.和Wei,L.J.(2005)。关于具有时变回归系数的Cox模型。J.Amer。统计师。协会100 172-183·Zbl 1117.62435号 ·doi:10.1198/016214500000845
[108] 托宾,J.(1958)。有限因变量关系的估计。计量经济学26 24-36·Zbl 0088.36607号 ·doi:10.2307/1907382
[109] Tooze,J.A.、Grunwald,G.K.和Jones,R.H.(2002)。聚类为零的重复测量数据分析。统计方法医学研究11 341-355·Zbl 1121.62674号 ·doi:10.1191/0962280202sm291ra
[110] Tooze,J.A.、Midthune,D.、Dodd,K.W.、Freedman,L.S.、Krebs-Smith,S.M.、Subar,A.F.、Guenther,P.M.,Carroll,R.J.和Kipnis,V.(2006)。一种新的统计方法,用于估计偶尔消费的食物的通常摄入量,并应用于其分配。《美国饮食杂志》。协会106 1575-1587。
[111] Tsiatis,A.A.和Davidian,M.(2004)。纵向和时间-事件数据的联合建模:概述。统计师。中国14 809-834·Zbl 1073.62087号
[112] Twisk,J.和Rijmen,F.(2009年)。纵向tobit回归:一种分析具有下限或上限效应的结果变量的新方法。临床杂志。流行病学62 953-958。
[113] Tyler,A.D.、Smith,M.I.和Silverberg,M.S.(2014)。分析人体微生物组:医生指南。美国胃肠病学杂志109 983-993。
[114] Vonesh,E.F.、Greene,T.和Schluchter,M.D.(2006年)。用于联合分析纵向数据和事件时间的共享参数模型。Stat.Med.25 143-163。
[115] Vuong,Q.H.(1989)。模型选择和非嵌套假设的似然比检验。计量经济学57 307-333·Zbl 0701.62106号 ·doi:10.2307/1912557
[116] Wang,M.-C.,Qin,J.和Chiang,C.-T.(2001)。用信息审查分析重复事件数据。J.Amer。统计师。协会96 1057-1065·Zbl 1072.62646号 ·doi:10.1198/016214501753209031
[117] Williamson,J.M.、Datta,S.和Satten,G.A.(2003年)。当集群大小具有信息性时,对集群数据进行边际分析。生物计量59 36-42·Zbl 1210.62082号 ·数字标识代码:10.1111/1541-0420.0005
[118] Wooldridge,J.M.(2002)。横断面和面板数据的经济计量分析。麻省理工学院出版社,马萨诸塞州剑桥·Zbl 1441.62010年
[119] Wulfsohn,M.S.和Tsiatis,A.A.(1997)。生存率和纵向数据的联合模型,用误差测量。生物统计学53 330-339·Zbl 0874.62140号 ·doi:10.2307/2533118
[120] Xie,H.、McHugo,G.、Sengupta,A.、Clark,R.和Drake,R.(2004)。一种分析具有多个零的长纵向结果的方法。门。健康服务。第6号决议239-246。
[121] Yabroff,K.R.、Warren,J.L.、Schrag,D.、Mariotto,A.、Meekins,A.、Topor,M.和Brown,M.L.(2009年)。结直肠癌患者治疗费用估算方法的比较。医疗护理47 S56-S63。
[122] 山口,K.(1992)。带有存活分数回归模型的加速失效时间回归模型:在日本“永久就业”分析中的应用。J.Amer。统计师。协会87 284-292。
[123] Yu,Z.、Liu,L.、Bravata,D.M.、Williams,L.S.和Tepper,R.S.(2013)。具有时变系数的半参数递归事件模型。《法律总汇》第32卷第1016-1026页。
[124] Zhang,M.、Strawderman,R.L.、Cowen,M.E.和Wells,M.T.(2006年)。两部分层次模型的贝叶斯推断:用于分析管理医疗保健中的提供者。J.Amer。统计师。协会101 934-945·Zbl 1120.62308号 ·doi:10.1198/016214500500001429
[125] 周小海和涂伟(1999)。几个独立总体的比较意味着其样本包含对数正态和可能为零的观测值。生物统计学55 645-651·Zbl 1059.62518号 ·doi:10.1111/j.0006-341X.1999.00645.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。