×

重尾分布的伽马形状混合物。 (英语) Zbl 1400.62292号

概述:卫生服务研究中的一个重要问题是估计超过给定阈值的医疗支出比例。通常,医疗支出呈现高度偏斜、重尾分布,对于这种分布,(a)简单的变量转换不足以实现易处理的低维参数形式,以及(b)非参数方法在估计大阈值的超越概率方面效率不高。基于这一背景,本文基于混合发生在形状参数上的伽马分布的混合,提出了一种估计重尾分布尾部概率的通用贝叶斯方法。该系列为重尾分布的建模提供了一种灵活而新颖的方法,计算效率高,只需要为单个参数指定一个先验分布。通过仿真研究,我们将我们的方法与常用的方法进行了比较,例如对数正态模型和非参数替代方法。我们发现,与这些备选方案相比,mixture-gamma模型显著提高了估计尾部概率的预测性能。我们还将我们的方法应用于医疗当前受益人调查(MCBS),我们估计了吸烟引起的疾病超过给定住院费用的概率。我们已经在开源GSM软件包中实现了该方法,该软件包可从Comprehensive R Archive Network获得。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abramowitz,M.和Stegun,I.A.E.(1972年)。,带公式、图形和数学表的数学函数手册,第9版。纽约州多佛市·Zbl 0543.33001号
[2] Aitchison,J.和Shen,S.M.(1980年)。Logistic正态分布:一些性质和用途。,生物特征67 261-272。JSTOR公司:·Zbl 0433.62012号 ·doi:10.2307/2335470
[3] Aitkin,M.和Rubin,D.B.(1985年)。有限混合模型中的估计和假设检验。,J.罗伊。统计师。Soc.序列号。B 47 67-75·Zbl 0576.62038号
[4] Barber,J.和Thompson,S.(2004年)。成本数据的多元回归:广义线性模型的使用。,J.卫生服务研究和政策9 197-204。
[5] Briggs,A.和Gray,A.(2006年)。卫生保健费用的分布及其经济评价的统计分析。,《健康经济学杂志》25 198-213。
[6] Briggs,A.、Nixon,R.、Dixon,S.和Thompson,S..(2005年)。成本数据的参数建模:一些模拟证据。,卫生经济学14 421-428。
[7] Buntin,M.B.和Zaslavsky,A.M.(2004)。关于两部分模型和转换,有太多麻烦吗?比较医疗保险支出建模方法。,《健康经济学杂志》23 525-542。
[8] Cantoni,E.和Ronchetti,E.(1998年)。一种稳健的方法,用于分析医疗保健支出中的扭曲和严重后果。,J.卫生服务研究与政策3 233-245。
[9] Conigliani,C.和Tancredi,A.(2005年)。医疗保健技术成本的半参数建模。,医学统计24 3171-3184·doi:10.1002/sim.2012年
[10] Conwell,L.J.和Cohen,J.W.(2005)。2002年美国非机构化平民中高医疗费用人群的特征。技术报告。网址:www.meps.ahrq.gov/papers/st73/stat73.pdf。医疗保健研究和质量机构。
[11] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977年)。通过EM算法获得不完整数据的最大似然。,J.罗伊。统计师。Soc.序列号。B 39 1-38。JSTOR公司:·Zbl 0364.62022号
[12] Diebolt,J.和Robert,C.P.(1990年)。有限混合分布的贝叶斯估计。一、理论方面。技术报告110,巴黎第六大学,巴黎·Zbl 0711.62026号
[13] Diebolt,J.和Robert,C.P.(1994年)。通过贝叶斯抽样估计有限混合分布。,J.罗伊。统计师。Soc.序列号。乙56 363-375。JSTOR公司:·Zbl 0796.62028号
[14] Dodd,S.、Bassi,A.、Bodger,K.和Williamson,P.(2004)。用于分析成本数据的多变量回归模型的比较。,临床实践评估杂志9 197-204。
[15] Dominici,F.、Cope,L.、Naiman,D.Q.和Zeger,S.L.(2005)。平滑分位数比估计(平方)。,生物特征92 543-557·Zbl 1183.62056号 ·doi:10.1093/biomet/92.3543
[16] Dominici,F.和Zeger,S.L.(2005)。带回归的平滑分位数比估计:估计吸烟归因疾病的医疗支出。,生物统计学6 505-519·Zbl 1169.62405号 ·doi:10.1093/biostatistics/kxi031
[17] Duan,N.(1983年)。涂抹估计:一种非参数重传方法。,J.Amer。统计师。协会78 605-610。JSTOR公司:·Zbl 0534.62021号 ·doi:10.2307/2288126
[18] Fraley,C.和Raftery,A.E.(2002年)。基于模型的聚类、判别分析和密度估计。,J.Amer。统计师。协会97 611-631。JSTOR公司:·Zbl 1073.62545号 ·doi:10.1198/016214502760047131
[19] Fraley,C.和Raftery,A.E.(2006年)。MCLUST第3版R:正态混合建模和基于模型的聚类。华盛顿大学统计系技术报告504。
[20] Gelman,A.(2007)。努力进行调查加权和回归建模。,统计师。科学。22 153-164. ·兹比尔1246.62043 ·doi:10.1214/0883423060000000691
[21] Jasra,A.、Holmes,C.C.和Stephens,D.A.(2005年)。马尔可夫链蒙特卡罗方法和贝叶斯混合建模中的标签切换问题。,统计师。科学。20 50-67. ·Zbl 1100.62032号 ·doi:10.1214/088342305000000016
[22] Johnson,E.、Dominici,F.、Griswold,M.和Zeger,S.L.(2003)。吸烟导致的疾病病例及其医疗费用:对全国医疗费用调查的分析。,《计量经济学杂志》112 135-151·Zbl 1038.62101号 ·doi:10.1016/S0304-4076(02)00157-4
[23] Kilian,R.、Matschinger,H.、Loefler,W.、Roick,C.和Angermeyer,M.C.(2002年)。精神分裂症治疗资源消耗分析中处理歪斜分布成本变量的方法比较。,J.心理健康政策与经济学5 21-31。
[24] Lehmann,E.L.和Casella,G.(1998)。,点估计理论,第二版,纽约斯普林格出版社·Zbl 0916.62017号
[25] Lindsay,B.G.(1995)。,混合模型:理论、几何和应用。加利福尼亚州海沃德IMS·Zbl 1163.62326号
[26] Lipscomb,J.、Ancukiewicz,M.、Parmigiani,G.、Hasselblad,V.、Samsa,G.和Matchar,D.B.(1998)。预测疾病成本:中风替代模型的比较。,医疗决策18 S39-S56。
[27] Liu,J.S.(1994)。贝叶斯计算中的坍塌吉布斯采样器及其在基因调控问题中的应用。,J.Amer。统计师。协会89 958-966。JSTOR公司:·Zbl 0804.62033号 ·doi:10.2307/2290921
[28] Lohr,S.L.(1999)。,取样:设计和分析。达克斯伯里出版社,加利福尼亚州太平洋格罗夫·Zbl 0967.62005年
[29] MacEachern,S.N.(1994年)。用共轭型Dirichlet过程先验估计正态均值。,通信统计-模拟。计算。23 727-741. ·Zbl 0825.62053号 ·doi:10.1080/003610919408813196
[30] MacEachern,S.N.、Clyde,M.和Liu,J.S.(1999)。非参数贝叶斯模型的序贯重要性抽样:下一代。,加拿大。J.统计。27 251-267。JSTOR公司:·Zbl 0957.62068号 ·doi:10.2307/3315637
[31] 曼宁,W.G.(1998)。记录因变量、异方差和重传问题。,《健康经济学杂志》17 283-295。
[32] Manning,W.G.和Mullahy,J.(2001)。估计日志模型:要转换还是不转换?,《健康经济学杂志》20 461-494。
[33] Marin,J.M.、Mengersen,K.和Robert,C.P.(2005)。混合分布的贝叶斯建模和推断。年,《统计手册》25(D.Dey和C.R.Rao编辑)459-507。荷兰北部,阿姆斯特丹。
[34] McLachlan,G.和Peel,D.(2000)。,有限混合模型。纽约威利·Zbl 0963.62061号
[35] Mullahy,J.(1998)。关于二的许多麻烦:重新考虑卫生计量经济学中的重传和两部分模型。,《健康经济学杂志》17 247-281。
[36] Mullahy,J.和Manning,W.G.(2005年)。偏态结果数据风险调整的广义建模方法。,《健康经济学杂志》24 465-488。
[37] Pfeffermann,D.(1993)。建模调查数据时采样权重的作用。,国际。统计师。版次61 310-337·Zbl 0779.62009年 ·doi:10.2307/1403631
[38] Powers,C.A.、Meyer,C.M.、Roebuck,M.C.和Vaziri,B.(2005年)。使用药房索赔数据对总医疗成本进行预测建模:替代计量经济学成本建模技术的比较。,医疗43 1065-1072。
[39] Richardson,S.和Green,P.J.(1997)。关于成分数目未知的混合物的贝叶斯分析(附讨论)。,J.罗伊。统计师。Soc.序列号。乙59 731-792。JSTOR公司:·Zbl 0891.62020号 ·数字标识代码:10.1111/1467-9868.00095
[40] Robert,C.P.(1996)。分布的混合:推断和估计。年,《马尔可夫链蒙特卡罗实践》(W.R.Gilks、S.Richardson和D.J.Spiegelhalter编辑)441-464。查普曼和霍尔/CRC,纽约·兹比尔0849.62013
[41] Roeder,K.和Wasserman,L.(1997)。使用混合法线的实用贝叶斯密度估计。,J.Amer。统计师。协会92 894-902。JSTOR公司:·Zbl 0889.62021号 ·doi:10.2307/2965553
[42] Tanner,M.A.和Wong,W.H.(1987)。通过数据增强计算后验分布。,J.Amer。统计师。协会82 528-540。JSTOR公司:·Zbl 0619.62029号 ·doi:10.2307/2289457
[43] Titterington,D.M.(1997)。混合物分布。年,统计科学百科全书399-407。纽约威利。
[44] Titterington,D.M.、Smith,A.F.M.和Makov,U.E.(1985)。,有限混合分布的统计分析。奇切斯特·威利·Zbl 0646.62013.中
[45] Tu,W.和Zhou,X.-H.(1999)。比较基于对数正态分布和零值成本的医疗成本的Wald检验。,医学统计18 2749-2761。
[46] Venturini,S.、Dominici,F.和Parmigiani,G.(2008)。补充“重尾分布的伽马形状混合物”DOI:,10.1214/08-AOAS156SUPP·Zbl 1400.62292号 ·doi:10.1214/07-AOAS156
[47] Willan,A.R.和Briggs,A.H.(2006)。,成本效益数据的统计分析。纽约威利·Zbl 1129.62109号 ·doi:10.1002/0470856289
[48] Zellner,A.(1971)。对数正态分布和对数正态回归的贝叶斯和非贝叶斯分析。,J.Amer。统计师。协会66 327-330。JSTOR公司:·兹比尔0226.62064 ·doi:10.2307/2283930
[49] 周晓华、高S.和惠S.L.(1997)。两个独立对数正态样本均值的比较方法。,生物统计学53 1129-1135·Zbl 0890.62039号 ·doi:10.2307/2533570
[50] Zhou,X.-H,Li,C.,Gao,S.和Tierney,W.M.(2001)。配对设计研究中卫生保健费用平均数相等性的测试方法。,医学统计20 1703-1720。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。