×

评级数据的累积模型和CUB模型:比较分析。 (英语) Zbl 07763644号

摘要:顺序测量作为评级、偏好和评估数据在应用学科中非常常见,其分析需要适当的建模方法来解释、分类和预测响应模式。这项工作提出了两个统计框架之间的比较讨论,这两个框架服务于这些目标:建立的一类累积模型和一类离散随机变量的混合物,表示为幼兽模型,其独特的特征是指定不确定性组件来处理不确定性和异质性。在调查了它们的定义和主要特征之后,我们通过模拟实验和选定的案例研究比较了所选范式的性能。本文通过对结果、相对优势和局限性以及图形层面进行广泛的比较分析,旨在丰富对这两种方法的理解。最后,对备选策略的关键问题进行了总结性审查,并给出了一些最终评论,旨在支持统一的设置。
{©2018 The Authors.International Statistical Review©2018国际统计研究所}

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agresti,A.(2010年)。有序分类数据分析,第二版,霍博肯:威利·Zbl 1263.62007年
[2] Agresti,A.和Kateri,M.(2017年)。多项式累积链接模型中群体比较的序数概率效应度量。生物统计学,73,214-219·Zbl 1366.62201号
[3] Aitchison,J.&Silvey,S.(1957年)。将概率分析推广到多个响应的情况。《生物统计学》,第44期,第131-140页·Zbl 0080.36303号
[4] Ananth,C.V.和Kleinbaum,D.G.(1997年)。顺序反应的回归模型:方法和应用综述。国际流行病学杂志。,26, 1323-1332.
[5] Anderson,J.A.(1984)。回归和有序分类变量。J.R.统计社会服务。B、 第46页,第1-30页·Zbl 0578.62064号
[6] Anderson,J.A.和Philips,P.R.(1981年)。有序分类变量的回归、判别和测量模型。J.R.统计社会服务。C、 第30页,第22-31页·Zbl 0459.62045号
[7] Biernacki,C.和Jacques,C.(2016)。基于模型的多元有序数据聚类依赖于随机二进制搜索算法。统计计算。,26, 929-943. ·Zbl 1505.62068号
[8] Box,G.E.P.&Draper,N.R.(1987年)。经验模型构建和响应面。纽约:Wiley·Zbl 0614.62104号
[9] Brant,R.(1990)。在序数逻辑回归的比例优势模型中评估比例性。生物统计学,46,1171-1178。
[10] Breen,R.和Luijkx,R.(2010年)。有序数据的混合模型。社会学。方法研究,39,3-24。
[11] Capecchi,S.、Endrizzi,I.、Gasperi,F.和Piccolo,D.(2016)。一种用于检测消费者偏好中受试者和受试者协变量的多产品方法。《英国食品杂志》,118(3),515-526。
[12] Capecchi,S.和Iannario,M.(2016)。基尼异质性指数用于检测有序数据调查中的不确定性。麦德龙,74223-232·Zbl 1365.62116号
[13] Capecchi,S.&Piccolo,D.(2017年)。处理顺序反应中的异质性。质量数量,51,2375-2393。
[14] Capecchi,S.&Simone,R.(2018年)。基于模型的综合指标提案:欧洲感知歧视的经验。社会指标。物件。https://doi.org/10.1007/s11205-018-1849-9 ·doi:10.1007/s11205-018-1849-9
[15] Cappelli,C.、Simone,R.和Di Iorio,F.(2017年)。成长的快乐:一棵基于模型的树。《统计与数据科学:新挑战,新一代》,《意大利统计学会会议记录》,彼得鲁奇,A.(编辑)和弗尔德,R.(编辑),费伦泽:费伦泽大学出版社,第261-266页。ISBN(在线):978‐88‐6453‐521‐0。
[16] Carpita,M.、Ciavolino,E.和Nitti,M.(2018年)。欧洲经济舆论预测的MIMIC‐CUB模型。社会指标。决议,1-19。https://doi.org/10.1007/s11205-018-1885-4 ·doi:10.1007/s11205-018-1885-4
[17] Cohen,J.(1960年)。标称标度的一致系数。教育。心理学。测量。,20, 37-46.
[18] Corduas,M.(2011年)。通过Kullback‐Liebler差异评估评级分布的相似性。在复杂数据结构的分类和多元分析中。柏林,海德堡,《分类、数据分析和知识组织研究:施普林格-弗拉格》,第221-228页。
[19] Corduas,M.、Cinquanta,L.和Ievoli,C.(2013)。葡萄酒属性对购买决策的重要性:意大利消费者感知研究。食品质量。首选项,28407-418。
[20] Cugnata,F.&Salini,S.(2017年)。序数数据替代插补方法的比较。通信统计。模拟计算。,46(1), 315-330. ·Zbl 1360.62018年
[21] D’Elia,A.和Piccolo,D.(2005年)。偏好数据分析的混合模型。计算。统计师。数据分析。,第4917-934页·Zbl 1429.62077号
[22] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977年)。通过EM算法获得不完整数据的最大似然(讨论后)。J.R.统计社会服务。B、 39、1-38页·Zbl 0364.62022号
[23] Di Iorio,F.和Iannario,M.(2012年)。用于解释CUB模型的剩余诊断。统计学,LXXII,163-172·Zbl 1453.62761号
[24] Dobson,A.J.和Barnett,A.G.(2008)。《广义线性模型简介》,第三版,佛罗里达州博卡拉顿:查普曼和霍尔——CRC出版社·Zbl 1165.62049号
[25] Ferrari,S.&Cribari‐Neto,F.(2004)。建模率和比例的贝塔回归。J.应用。统计人员。,31, 799-815. ·Zbl 1121.62367号
[26] Franses,P.H.&Paap,R.(2001年)。营销研究中的定量模型。剑桥:剑桥大学出版社。
[27] Gini,C.(1912)。变异性和变异性。卡利亚里大学(A,III,Part II)Giurisprudenza学院经济研究所(Studi economico‐giuridici)。
[28] Gottard,A.、Iannario,M.和Piccolo,D.(2014)。CUB模型中的不确定性变化。高级数据分析。分类,10225-244·Zbl 1414.62327号
[29] Greene,W.H.(2008)。《计量经济学分析》,第6版,新泽西州上鞍河:皮尔逊-普伦蒂斯霍尔出版社。
[30] Greene,W.H.&Hensher,D.A.(2003年)。离散选择分析的潜在类模型:与混合逻辑的对比。运输。决议,B部分,37,681-689。
[31] Grilli,L.、Iannario,M.、Piccolo,D.和Rampichini,C.(2014)。潜在类CUB模型。高级数据分析。分类,8105-119。
[32] Grün,B.和Leisch,F.(2008)。具有可变和固定效应的多项式logit模型有限混合的可识别性。J.分类,25,225-247·Zbl 1276.62021号
[33] Gwet,K.L.(2016)。测试相关一致性系数的差异的统计显著性。教育。心理学。测量。,76609年至637年。
[34] Hamamersh,D.S.(1985年)。期望、预期寿命和经济行为。《Q.J.经济学》。,100, 389-408.
[35] Homer,D.W.&Leemshow,S.(2000)。应用逻辑回归,第二版,新泽西州上鞍河:皮尔逊普伦蒂斯霍尔。
[36] Hubler,O.(1977)。伪潜在模型:拟合优度度量、残差、估计、测试和模拟。统计师。论文,38,271-285·Zbl 0959.62120号
[37] Hurd,M.D.和McGarry,K.(1995年)。健康和退休研究中主观生存概率的评估。J.Hum.资源。,30,S268-S292。
[38] Hurd,M.D.和McGarry,K.(2002年)。主观生存概率的预测有效性。经济。《期刊》,第112卷,第966-985页。
[39] Iannario,M.(2009年)。有序数据模型的拟合度量。四边形。统计人员。,11, 39-72.
[40] Iannario,M.(2010年)。关于有序数据混合模型的可辨识性。Metron,LXVIII,87-94·Zbl 1301.62017年
[41] Iannario,M.(2012年a)。在一类有序响应的混合模型中对避难所选择进行建模。统计师。方法应用。,21, 1-22. ·Zbl 1333.62181号
[42] Iannario,M.(2012年b)。序数变量的层次CUB模型。通信统计。理论方法,41,3110-3125·Zbl 1296.62067号
[43] Iannario,M.(2012c)。序数数据混合模型的初步估计。高级数据分析。分类,6163-184·Zbl 1254.62004年
[44] Iannario,M.(2013)。有序数据中的建模不确定性和过度分散。通信统计。理论方法,43,771-786·Zbl 1287.62001号
[45] Iannario,M.(2015)。对评级调查中的规模效应和不确定性进行建模。电子。J.应用。统计师。分析。,8(3), 329-345.
[46] Iannario,M.、Monti,A.C.、Piccolo,D.和Ronchetti,E.(2017年)。顺序响应模型的稳健推理。电子。《美国联邦法律大全》,第11卷,第3407-3445页·Zbl 1390.62041号
[47] Iannario,M.和Piccolo,D.(2010年)。主观生存概率的统计建模。属,LXVI,17-42。
[48] Iannario,M.和Piccolo,D.(2012年)。评级调查中的顺序数据建模框架。《联合统计会议记录》,营销统计部分,加利福尼亚州圣地亚哥,第3308-3322页。
[49] Iannario,M.和Piccolo,D.(2016a)。用于对有序数据建模的通用框架。统计师。方法应用。,25, 163-189. ·Zbl 1405.62101号
[50] Iannario,M.和Piccolo,D.(2016b)。序数数据回归模型的综合框架。麦德龙,74(2),233-252·Zbl 1365.62295号
[51] Iannario,M.、Piccolo,D.和Simone,R.(2018年)。CUB:有序数据的一类混合模型。R包版本1.1.2http://CRAN.R-project.org/package=CUB。
[52] Iannario,M.&Simone,R.(2017)。评级数据的混合模型:基于Gröbner基的矩量法。J.Algebr。统计人员。,8(2), 1-28. ·Zbl 06834676号
[53] 卡特里,M.(2014)。列联表分析:使用R.NewYork:Birkäuser/Springer的方法和实现·兹比尔1291.62012
[54] Lang,J.B.(1996)。广义对数线性模型类的最大似然方法。Ann.统计师。,24(2), 726-752. ·Zbl 0859.62061号
[55] Long,J.和Freese,J.(2014)。基于STATA的分类相关变量回归模型。德克萨斯州大学城:Stata出版社·Zbl 1298.62004号
[56] Manisera,M.和Zuccolotto,P.(2014a)。使用非线性CUB模型建模评级数据。计算。统计师。数据分析。,78, 100-118. ·Zbl 1506.62123号
[57] Manisera,M.和Zuccolotto,P.(2014b)。在评分量表中模拟“不知道”的回答。模式识别。莱特。,45, 226-234.
[58] Manski,C.F.和Molinari,F.(2010年)。调查中的概率期望四舍五入。J.公交车。经济。统计人员。,28, 219-231. ·Zbl 1198.62009号
[59] McCullagh,P.(1980)。有序数据的回归模型(含讨论)。J.R.统计社会服务。B、 第42109-142页·Zbl 0483.62056号
[60] McCullagh,P.&Nelder,J.A.(1989年)。广义线性模型,第二版,伦敦:查普曼和霍尔出版社·Zbl 0744.62098号
[61] McFadden,K.(1978年)。模拟住宅位置的选择。《空间相互作用理论与居住位置》,Eds.Karlqvist,A.(ed.)等人,《阿姆斯特丹:北荷兰》,第75-76页。
[62] McKenzie,D.P.、MacKinnon,A.J.、Péladeau,N.、Onghenza,P.C.、Clarke,D.M.、Harrigan,S.和McGorry,P.D.(1996)。通过重采样比较相关kappas:一个水平的一致性与另一个水平显著不同吗?《精神病学研究杂志》,30,483-492。
[63] 莫里森·D.G.(1979)。购买意向和购买行为。《市场营销杂志》,43,65-74。
[64] Peterson,B.&Harrell,F.E.(1990年)。顺序响应变量的部分比例优势模型。申请。统计人员。,39, 205-217. ·Zbl 0707.62154号
[65] Piccolo,D.(2003年)。关于均匀二项式随机变量和移位二项式变量的混合矩。四边形。统计人员。,5, 85-104.
[66] Piccolo,D.(2006年)。MUB模型中的观测信息矩阵。方庭。统计人员。,8, 33-78.
[67] Piccolo,D.(2015)。具有协变量的立方模型的推理问题。通信统计。理论方法,445023-5036·Zbl 1381.62036号
[68] Piccolo,D.和D'Elia,A.(2008)。建模消费者偏好的新方法。食品质量。首选项,19,247-259。
[69] Pregibon,D.(1981)。逻辑回归诊断。Ann.统计师。,9, 705-724. ·Zbl 0478.62053号
[70] Schwarz,G.E.(1978年)。估算模型的维度。《Ann.Statist》杂志。,6, 461-464. ·Zbl 0379.62005年
[71] Simone,R.&Tutz,G.(2018年)。对有序数据中的不确定性和响应方式进行建模。统计师。尼尔兰迪卡,72,224-245。
[72] 斯内尔,E.J.(1964)。有序分类数据的缩放过程。生物统计学,20592-607·Zbl 0126.16501号
[73] Spitzer,R.L.,Cohen,J.,Fleiss,J.L.和Endicott,J.(1967年)。精神病诊断一致性的量化。架构(architecture)。《精神病学杂志》,第17期,第83-87页。
[74] Taverne,C.&Lambert,P.(2014)。Likert和离散评级量表结果的膨胀离散贝塔回归模型。arXiv:1405.4637v12014年5月19日。
[75] Tutz,G.(2012)。分类数据的回归。剑桥:剑桥大学出版社。
[76] Tutz,G.&Berger,M.(2017年)。在有序回归模型中分离位置和分散。经济。统计人员。,2, 131-148.
[77] Tutz,G.和Schauberger,G.(2010年)。分类反应模型的可视化:从数据图示符到参数图示符。J.计算。图表。统计人员。,22, 156-177.
[78] Tutz,G.、Schneider,M.、Iannario,M.和Piccolo,D.(2016)。序数响应的混合模型,用于解释选择的不确定性。高级数据分析。分类,11(2),281-305·Zbl 1414.62019年
[79] Ursino,M.和Gasparini,M.(2018年)。一种新的有序纵向数据简约模型,用于胃肠疾病的主观评估。《统计方法医学研究》,27(5),1376-1393。
[80] Vanbelle,S.和Albert,A.(2008年)。用于比较相关kappa系数的自举方法。J.统计计算。模拟。,78, 1009-1015. ·Zbl 1431.62510号
[81] Veall,M.R.和Zimmermann,K.F.(1992年)。预测实现表中的性能度量。经济。莱特。,39(2), 129-134. ·Zbl 0850.62881号
[82] Veall,M.R.和Zimmermann,K.F.(1996年)。一些常见的有限因变量模型的伪R^2测度。《经济学杂志》。调查。,10, 241-259.
[83] Vermunt,J.K.和Magidson,J.(2013)。潜在黄金5.0技术指南:基本、高级和Sintax。贝尔蒙特:统计创新公司。。
[84] Vuong,Q.H.(1989)。模型选择和非嵌套假设的似然比测试。《计量经济学》,57,307-333·Zbl 0701.62106号
[85] Walker,S.H.&Duncan,D.B.(1967年)。事件概率作为几个独立变量的函数的估计。《生物统计学》,54,167-179·Zbl 0159.47604号
[86] Wedel,M.和DeSarbo,W.S.(1995)。广义线性模型的混合似然方法。J.分类,12,21-55·Zbl 0825.62611号
[87] Williams,O.D.和Grizzle,J.E.(1972年)。分析具有有序响应类别的列联表。J.Amer。统计师。协会,67,55-63。
[88] Winship,C.&Mare,R.D.(1984年)。序数变量回归模型。阿默尔。社会学。修订版,49,512-525。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。