×

Sklar的omega:基于高斯连接的协议评估框架。 (英语) Zbl 1490.62016年

摘要:一致性的统计测量——最常用的形式是码间一致性(也称为码间可靠性),即两个或多个编码者对相同分析单元的评分一致性——在许多领域都很重要,例如内容分析、教育、计算语言学、,运动。我们提出了Sklar的Omega,这是一个基于高斯copula的框架,不仅用于测量编码器间的一致性,还用于测量编码器内的一致性、方法间的一致性和相对于黄金标准的一致性。我们通过将Sklar’s Omega和Krippendorff’s Alpha(一个公认的非参数一致性系数)应用于模拟数据、Krippentorff先前分析的标称数据以及来自股骨髋臼撞击髋关节软骨成像研究的连续数据,证明了我们方法的有效性和优势。我们提出的方法的应用得到了开源R软件包sklarsomega的支持,该软件包可从综合R档案网下载。该软件包允许用户将Omega方法应用于名义分数、序数分数、百分比、计数、金额(即非负实数),和余额(即任何实数);并且可以容纳任意数量的单元、任意数量的编码器和丢失。经典推理适用于所有级别的测量,而贝叶斯推理仅适用于连续结果。

MSC公司:

62-08 统计学相关问题的计算方法
62时20分 关联度量(相关性、典型相关性等)
62小时05 多元概率分布的表征与结构理论;连接线
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Akaike,H.,统计模型识别的新视角,IEEE Trans。自动。控制,19,6,716-723(1974)·Zbl 0314.62039号
[2] Altman,D.G.,Bland,J.M.:医学测量:方法比较研究的分析。统计学家32(3),307-317(1983)
[3] 阿尔茨坦,R。;Poesio,M.,计算语言学的代码间协议,计算。语言学家。,34, 4, 555-596 (2008)
[4] 班纳吉,M。;卡波佐利,M。;麦克斯威尼,L。;Sinha,D.,Beyond kappa:评等者间协议措施综述,《加拿大统计杂志》,27,1,3-23(1999)·Zbl 0929.62117号
[5] EM贝内特;阿尔伯特·R。;AC Goldstein,《通过有限回应提问进行沟通》,《公共行动》。Q.,18,3,303-308(1954)
[6] 伯格特,C。;吕申多夫,L.,关于最优风险分配问题,统计与决策,24,1-2006,153-171(2006)·Zbl 1186.91117号
[7] KP伯纳姆;安德森博士;Huyvaert,KP,《行为生态学中的AIC模型选择和多模态推理:一些背景、观察和比较》,Behav。经济。社会生物学。,65, 1, 23-35 (2011)
[8] 伯德·R。;卢,P。;Nocedal,J。;Zhu,C.,边界约束优化的有限内存算法,SIAM J.Sci。计算。,16, 5, 1190-1208 (1995) ·Zbl 0836.65080号
[9] 陈,X。;范,Y。;Tsyrennikov,V.,半参数多元copula模型的有效估计。技术报告04-W20(2004),田纳西州纳什维尔:田纳西省纳什维尔范德比尔特大学
[10] Chrisman,NR,制图测量的重新思考水平,制图地理信息系统,25,4,231-242(1998)
[11] 奇切蒂,DV;范斯坦(Feinstein),AR,《高度一致但低kappa:II》。解决悖论,J.Clin。流行病。,43, 6, 551-558 (1990)
[12] Cohen,J.,标称量表的一致系数,教育。精神病。测量。,20, 1, 37-46 (1960)
[13] Cohen,J.,Weighted kappa:名义规模协议,规定规模分歧或部分信贷,心理。公牛。,70, 4, 213-220 (1968)
[14] 康格,AJ,多评分者kappas的整合和泛化,心理。公牛。,88, 2, 322 (1980)
[15] 康威,RW;Maxwell,WL,最短操作专业的网络调度,Oper。决议,10,1,51-73(1962)
[16] Davies,M.,Fleiss,J.L.:多项式数据的测量一致性。生物统计学,第1047-1051页(1982)·Zbl 0501.62045号
[17] AC戴维森;Hinkley,DV,Bootstrap Methods and their Application(1997),剑桥:剑桥大学出版社,剑桥·Zbl 0886.62001号
[18] Eddelbuettel,D。;Francois,R.,Rcpp:无缝R和C++集成,J.Stat.Softw。,40, 8, 1-18 (2011)
[19] 阿肯色州范斯坦;Cicchetti,DV,《高度一致但低kappa:I.两个悖论的问题》,J.Clin。流行病。,43,6543-549(1990年)
[20] Ferguson,TS,《数理统计:决策理论方法》(1967),纽约:学术出版社,纽约·兹比尔0153.47602
[21] Fernholz,LT,平滑经验分布函数的几乎必然收敛性,Scand。J.Stat.,18,3,255-262(1991)·Zbl 0798.62063号
[22] 吉咪·弗莱格尔(JM Flegal);哈兰,M。;Jones,GL,Markov chain Monte Carlo:我们能相信第三位重要人物吗?,统计科学。,23, 2, 250-260 (2008) ·Zbl 1327.62017年
[23] Flegal,J.M.、Hughes,J.、Vats,D.、Dai,N.、Gupta,K.、Maji,U.:mcmcse:MCMC的蒙特卡罗标准误差。加利福尼亚州河滨,印度坎普尔(2021年)。(R软件包版本1.5-0)
[24] Fleiss,JL,《衡量许多评分员之间的名义评分一致性》,Psychol。公牛。,76, 5, 378 (1971)
[25] 富勒,R。;Sain,SR,spam:稀疏矩阵R包,重点是高斯马尔可夫随机场的MCMC方法,J.Stat.Softw。,36, 10, 1-25 (2010)
[26] Genest,C。;Neslehova,J.,计数数据的交配引物,Astin Bulletin,37,2475(2007)·Zbl 1274.62398号
[27] Genz,A.:多元正态概率的数值计算。J.计算。图表。《法令》第1(2)卷,第141-149页(1992年)
[28] CJ Geyer;琼斯,GL;Shen,X.,Le Cam做得很简单:在没有LLN或CLT或样本量趋于无穷大的情况下,最大似然渐近,现代统计理论和应用的进展:纪念莫里斯·L的节日(2013),美国俄亥俄州比奇伍德数学统计研究所:美国俄亥俄州比奇伍德数学统计学研究所伊顿·Zbl 1327.62123号
[29] 吉尔伯特,P。;Varadhan,R.,numDeriv:精确数值导数,R包版本,2016,8-1,1(2019)
[30] Godambe,V.:正则最大似然估计的最佳性质。安。数学。《统计》第31(4)卷,第1208-1211页(1960年)·Zbl 0118.34301号
[31] Gwet,KL,计算评分者之间的可靠性及其在高一致性存在下的方差,Br.J.Math。统计心理学。,61, 1, 29-48 (2008)
[32] Gwet,KL,《事后可靠性手册:衡量评级者之间协议程度的最终指南》(2014年),马里兰州盖瑟斯堡有限责任公司:Advanced Analytics,LLC,马里兰州盖瑟斯堡
[33] Gwet,KL,《检验相关一致性系数差异的统计显著性》,Educ。精神病。测量。,76, 4, 609-637 (2016)
[34] 韩,Z。;De Oliveira,V.,《关于地质统计计数数据的高斯copula模型的相关结构》,《澳大利亚和新西兰统计杂志》,58,1,47-69(2016)·Zbl 1373.62560号
[35] AF海耶斯;Krippendorff,K.,回应对编码数据的标准可靠性度量的呼吁,Commun。方法测量。,1,1,77-89(2007年)
[36] Henn,L.L.:离散数据高斯copula回归模型贝叶斯推断的三种方法的局限性和性能。计算统计,第1-38页(2021年)
[37] Henn,法学博士;休斯,J。;伊萨卡,E。;Ellermann,J。;Mortazavi,S。;齐格勒,C。;日产,MJ;Morgan,P.,《使用股髋臼撞击软骨定量磁共振成像数据进行疾病严重程度分类》,《统计医学》,36,9,1491-1505(2017)
[38] Holm,S.,一个简单的顺序拒绝多重测试程序,Scand。J.Stat.,6,2,65-70(1979)·Zbl 0402.62058号
[39] 胡克,R。;Jeeves,TA,数字和统计问题的直接搜索解决方案,J.ACM,8,2,212-229(1961)·Zbl 0111.12501号
[40] Huang,A.,Mean-离散计数的参数化Conway-Maxwell-Poisson回归模型,统计模型。,17, 6, 359-380 (2017) ·Zbl 07289488号
[41] Hughes,J.,krippendorffsalpha:使用Krippendorff的Alpha系数测量一致性的R包,《R期刊》,13,1413-425(2021)
[42] Hughes,J.,关于具有离散边界的直接高斯copula模型的分布变换近似的偶然精确性,《统计与概率快报》,177(2021)·Zbl 1474.62170号
[43] 伊哈卡,R。;Gentleman,R.,R:数据分析和图形语言,J.Compute。图表。统计,5299-314(1996)
[44] Kazianka,H.,基于近似连接的离散空间数据估计和预测,Stoch。环境。Res.风险评估。,27, 8, 2015-2026 (2013)
[45] 卡齐安卡,H。;Pilz,J.,《基于Copula的连续和离散数据(包括协变量)地质统计建模》,Stoch。环境。Res.风险评估。,242661-673(2010年)·Zbl 1416.86025号
[46] Kendall,MG,等级相关性的一种新测量方法,生物统计学,30,1-2,81-93(1938)·Zbl 0019.13001号
[47] 加利福尼亚州克拉森;Wellner,JA,二元正态copula模型中的有效估计:正态边缘最不利,Bernoulli,3,1,55-77(1997)·Zbl 0877.62055号
[48] Krippendorff,K.:内容分析:其方法简介。Sage,洛杉矶(2012)
[49] Krippendorff,K.:计算Krippentorff的字母可靠性。宾夕法尼亚大学技术报告(2013)
[50] Landis,J.R.,Koch,G.G.:类别数据的观察者一致性测量。生物计量学,第159-174页(1977年)·Zbl 0351.62039号
[51] Lindsay,B.,复合似然法,Contemp。数学。,80, 1, 221-239 (1988) ·Zbl 0672.62069号
[52] 刘,H。;Lafferty,J。;Wasserman,L.,《非规范:高维无向图的半参数估计》,J.Mach。学习。2009年10月10日,2295-2328号决议·Zbl 1235.62035号
[53] 摩根,P。;日产,MJ;休斯,J。;Mortazavi,S。;Ellermann,J.,T2*标测提供的信息与关节镜下对髋臼软骨的评估具有统计可比性,软骨,9,3,237-240(2018)
[54] Mosteller,F。;Tukey,J.,《数据分析与回归:统计学第二课程》(1977年),Addison-Wesley出版公司:Addison-Whesley行为科学系列,Addison-Wesley出版社
[55] 马斯格罗夫,D。;休斯,J。;Eberly,L.,区域数据的层次copula回归模型,空间统计,17,38-49(2016)
[56] Nelsen,RB,《Copulas简介》(2006),纽约:Springer,纽约·Zbl 1152.62030
[57] 日产,MJ;Mortazavi,S。;休斯,J。;摩根大通。;Ellermann,J.,T2*股骨-髋臼撞击患者在有或无关节内Gd-DTPA2的情况下髋臼和股骨软骨的松弛时间,Am.J.Roentgenol。,204、6、W695(2015)
[58] Prentice,R.L.:将二元回归与每个二元观测值的协变量相关联。生物统计学,第1033-1048页(1988年)·Zbl 0715.62145号
[59] R核心团队,R:统计计算语言与环境(2021),奥地利维也纳:R统计计算基金会,奥地利维也纳
[60] 里巴特,M.,库利,D.,戴维森,A.C.:基于复合可能性的贝叶斯推断,以及对空间极值的应用。《中国统计》,第813-845页(2012年)·Zbl 1238.62031号
[61] Rüschendorf,L.,序贯概率比检验OC-函数的随机有序分布和单调性,统计学,12,3,327-338(1981)·Zbl 0481.62063号
[62] Rüschendorf,L.,《关于分布变换、Sklar定理和经验copula过程》,J.Stat.Planning Inference,139,11,3921-3927(2009)·Zbl 1171.60313号
[63] Scott,WA,内容分析的可靠性:标称规模编码的案例,公共Opin。Q.,19,321-325(1955)
[64] 卖方,KF;Borle,S。;Shmueli,G.,计数数据的COM-Poisson模型:方法和应用调查,应用。斯托克。模型。公共汽车。印度,28,2,104-116(2012)·Zbl 06292434号
[65] Serfling,R。;Mazumder,S.,中值绝对偏差的指数概率不等式和收敛结果及其修正,《统计与概率快报》,79,16,1767-1773(2009)·Zbl 1456.62056号
[66] Shmueli,G。;明卡,TP;巴蒂斯特·卡丹;博勒,S。;Boatwright,P.,《拟合离散数据的有用分布:Conway-Maxwell-Poisson分布的复兴》,J.Roy。统计社会:序号。C(应用统计),54,1,127-142(2005)·Zbl 1490.62058号
[67] Singh,S.,Póczos,B.:非超常信息估计。In:Precup,D.,Teh,Y.W.,(eds),《第34届国际机器学习会议论文集》,《机器学习研究论文集》第70卷,第3210-3219页。PMLR(2017)
[68] Sklar,A.,《维度和边界划分函数》,Publ。仪器统计。巴黎大学,8229-231(1959)·Zbl 0100.14202号
[69] 斯密顿,北卡罗来纳州,kappa统计的早期历史,生物统计学,41,3,795-795(1985)
[70] 斯皮尔曼,CE,《两个事物之间关联的证明和测量》,美国心理学杂志。,15, 72-101 (1904)
[71] 施皮格尔(Spiegelhalter),DJ;最佳,NG;英国石油公司卡林;Van Der Linde,A.,模型复杂性和拟合的贝叶斯度量,J.Royal Stat.Society:Series B(Statistical Methodology),64,4,583-639(2002)·兹比尔1067.62010
[72] 史蒂文斯,SS,《计量尺度理论》,《科学》,第103、2684、677-680页(1946年)·邮编:1226.91050
[73] Szabó,Z.,Póczos,B.,Szirtes,G.,Lőrincz,A.:后非线性独立子空间分析。摘自:《人工神经网络国际会议》,第677-686页。施普林格(2007)
[74] Tierney,L.、Rossini,A.J.、Li,N.、Sevcikova,H.:雪:简单工作站网络。R包版本0.4-3(2018)
[75] Varadhan,R.,University,J.H.,Borchers,H.W.,Research,A.C.,Bechard,V.,Montreal,H.:dfoptim:无导数优化。R包版本2020.10-1(2020)
[76] Varin,C.:关于复合边际可能性。AStA进展统计分析92(1),1-28(2008)·Zbl 1171.62315号
[77] 宋学坤,P.,高斯copula生成的多元离散模型,Scand。《统计杂志》,27,2,305-320(2000)·Zbl 0955.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。