×

理解抽样偏差:NBA选秀案例研究。 (英语) Zbl 1478.62021号

摘要:在一些实际数据应用中,选择过程自然会产生偏差样本。最近,P.经济等【《生物杂志》第62卷第1期,238–249页(2020年;Zbl 1441.62334号)]使用二元加权分布的概念,提出了四种不同的权重函数族来描述二元样本中的偏差是由于采用抽样方案导致样本中具有特定属性的个体的过度或不足重表达的情况。本文重点揭示了每个变量对双变量样本中偏差的贡献。更具体地说,在贝叶斯观点下,使用近似贝叶斯计算方法从后验分布中进行近似采样,并使用偏差信息准则比较使用不同权重函数获得的模型的拟合度。该方法以NBA选秀球员的真实数据集为例进行了说明。

MSC公司:

62D05型 抽样理论、抽样调查
62H10型 统计的多元分布
第62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿方索,L。;Corte Real,P.,《使用加权分布建模运营风险》,ASTIN Bull,46,2,469-485(2016)·兹比尔1390.91329 ·doi:10.1017/asb.2016.4
[2] 阿诺德,B。;Nagaraja,H.,关于二元加权分布的一些性质,公共统计理论方法,20,5-6,1853-1860(1991)·Zbl 0900.62073号 ·doi:10.1080/03610929108830602
[3] Berkson,J.,《四重表分析应用于医院数据的局限性》,Biom Bull,247-53(1946)·doi:10.2307/3002000
[4] Celeux,G。;福布斯,F。;CP罗伯特;Titterington,DM,贝叶斯分析,1,4,651-673(2006)·Zbl 1331.62329号
[5] Duong,T。;Goud,B。;Schauer,K.,《用于自动检测细胞形态变化的基于密度的封闭式框架》,《国家科学院学报》,第109、22、8382-8387页(2012年)·doi:10.1073/pnas.1117796109
[6] Economou,P。;Batsidis,A。;Tzavelas,G。;Alexopoulos,P.,ADNI:伯克森悖论和加权分布:阿尔茨海默病的应用,《生物医学杂志》,62,238-249(2020)·Zbl 1441.62334号 ·doi:10.1002/bimj.20190046
[7] Economou,P。;Tzavelas,G。;Batsidis,A.,在不替换有限总体的情况下,基于r尺寸的抽样的稳健推断,《应用统计杂志》,47,13-15,2808-2824(2020)·Zbl 1521.62302号 ·doi:10.1080/02664763.2019.1711031
[8] Fisher,R.,《确定方法对频率估计的影响》,《安·尤根》,第6、1、13-25页(1934年)·JFM 62.1373.02标准 ·文件编号:10.1111/j.1469-1809.1934.tb02105.x
[9] Geneletti,S。;贝斯特,N。;托莱达诺,MB;埃利奥特,P。;Richardson,S.,《利用贝叶斯后分层揭示病例对照研究中的选择偏差》,《统计医学》,322555-2570(2013)·doi:10.1002/sim.5722
[10] 格陵兰,S.,《量化随机模型中的偏差:经典混杂与碰撞分层偏差》,流行病学,14300-306(2003)
[11] 古普塔,RC;Kirmani,S.,加权分布在随机建模中的作用,Commun Statist,19,9,3147-3162(1990)·兹比尔0734.62093 ·doi:10.1080/03610929008830371
[12] Hernan,M。;埃尔南德斯·迪亚兹,S。;Robins,J.,《选择偏差的结构方法》,流行病学,15615-625(2004)·doi:10.1097/01.ede.0000135174.63482.43
[13] Jain,K。;Nanda,A.,关于多元加权分布,公共统计理论方法,24,102517-2519(1995)·Zbl 0875.62203号 ·doi:10.1080/03610929508831631
[14] Kacprzak,T。;赫贝尔,J。;阿马拉。;Réfrégier,A.,用分位数回归加速近似贝叶斯计算:宇宙红移分布的应用,宇宙天体物理杂志,2018,2042(2018)·doi:10.1088/1475-7516/2018/02/042
[15] Kavetski,D。;费尼西亚,F。;Reichert,P。;Albert,C.,《使用近似贝叶斯计算的水文模型特征域校准:理论和与现有应用的比较》,《水资源研究》,54,6,4059-4083(2018)·doi:10.1002/2017WR020528
[16] 麦金利,T。;弗农,I。;安德里亚纳基斯,I。;北卡罗来纳州麦克里什。;奥克利,J。;Nsubuga,R。;戈德斯坦,M。;White,R.,复杂随机流行病模型的近似贝叶斯计算和基于模拟的推理,《统计科学》,33,1,4-18(2018)·Zbl 1407.62406号 ·doi:10.1214/17-STS618
[17] 南达,A。;Jain,K.,单变量和双变量病例的一些加权分布结果,J Stat Plan推断,77,2,169-180(1999)·Zbl 0924.62018号 ·doi:10.1016/S0378-3758(98)00190-6
[18] 纳瓦罗,J。;Ruiz,J。;Aguila,YD,《多元加权分布:综述和一些扩展》,统计学,40,1,51-64(2006)·Zbl 1098.62068号 ·doi:10.1080/02331880500439691
[19] 帕蒂尔,G。;Rao,C.,《加权分布和尺寸偏差抽样及其在野生动物种群和人类家庭中的应用》,《生物统计学》,34,2,179-189(1978)·兹伯利0384.62014 ·数字对象标识代码:10.2307/253008
[20] Pearl,J.,《实证研究的因果图》,《生物统计学》,82,4,669-688(1995)·Zbl 0860.62045号 ·doi:10.1093/biomet/82.4.669
[21] Rao,C.,《关于确定方法产生的离散分布》,Sankhya Indian J Stat Ser A(1961-2002),27,2-4311-324(1965)·Zbl 0212.21903号
[22] 雷纳,L。;马林,J。;Pudlo,P。;里巴特,M。;CP罗伯特;Estoup,A.,《贝叶斯参数推断的ABC随机森林》,生物信息学,35,10,1720-1728(2018)·doi:10.1093/bioinformatics/bty867
[23] 理查德·L。;Berg,K。;Thomas,B.,《美国国家篮球协会一级男篮运动员的身体和表现特征》,J Strength Cond Res,8,4,214-218(1994)
[24] Rotnitzky A,Robins J(2005),生存分析中的逆概率加权估计。收录于:生物统计学百科全书。威利,伦敦
[25] 萨缪尔森,S。;Anestad,H。;Skrondal,A.,一般队列抽样设计的分层病例-队列分析,Scan J Stat,343,103-119(2007)·Zbl 1142.62082号 ·数字对象标识代码:10.1111/j.1467-9469.2006.00552.x
[26] JM萨拉比亚;Gomez-Deniz,E.,《多元分布的构建:一些最新结果的回顾》,SORT,32,1,3-36(2008)·Zbl 1178.60014号
[27] 施皮格尔(Spiegelhalter),DJ;最佳,NG;英国石油公司卡林;Van Der Linde,A.,模型复杂性和拟合的贝叶斯度量,J R Stat Soc Ser B(Stat Methodol),64,4,583-639(2002)·Zbl 1067.62010年 ·数字对象标识代码:10.1111/1467-9868.00353
[28] Spirtes,P。;Glymour,C。;Scheines,R.,因果、预测和搜索(1993),剑桥:麻省理工学院出版社,剑桥·Zbl 0806.62001 ·doi:10.1007/978-1-4612-2748-9
[29] Tzavelas,G。;Douli,M。;Economou,P.,偏倚样本的模型误指定效应,Metrika,80,2,171-185(2017)·Zbl 1361.62014年 ·doi:10.1007/s00184-016-0597-5
[30] VanderWeel,T。;赫尔曼,M。;Robins,J.,《随机定向无环图和未测量混杂因素偏向的方向》,《流行病学》,第19期,第720-728页(2008年)·doi:10.1097/EDE.0b013e3181810e29
[31] 齐夫·G。;Lidor,R.,《男女篮球运动员垂直跳跃——观察和实验研究综述》,《科学与医学体育杂志》,13,3,332-9(2010)·doi:10.1016/j.jsams.2009.02.009
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。