×

混合数据的因子copula模型。 (英语) Zbl 1534.62203号

总结:我们开发了因子copula模型来分析混合连续和离散响应之间的相关性。因子连接模型是包含观测变量和潜在变量的典型藤连接模型,因此它们允许尾部、不对称和非线性依赖。它们可以解释为具有潜在变量的条件独立模型,这些潜在变量不一定具有加性潜在结构。我们关注社会数据分析师感兴趣的重要问题,例如模型选择和拟合优度。我们的通用方法通过广泛的模拟研究进行了验证,并通过重新分析三个混合响应数据集进行了说明。我们的研究表明,与混合数据的标准因子模型相比,可以有实质性的改进,并有理由转向因子copula模型。
©2020作者。英国数学与统计心理学杂志由John Wiley&Sons Ltd代表英国心理学会出版

MSC公司:

第62页,共15页 统计学在心理学中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Agresti,A.(2010年)。有序分类数据分析,《概率统计中的威利级数》,第2版,新泽西州霍博肯:约翰·威利父子公司。https://onlinelibrary.wiley.com/doi/book/10.1002/9780470594001 ·Zbl 1263.62007年
[2] Brechmann,E.C.、Czado,C.和Aas,K.(2012年)。截断了高维度的规则葡萄藤,并将其应用于财务数据。加拿大统计杂志,40(1),68-85。https://doi.org/10.1002/cjs.10141 ·Zbl 1274.62381号 ·doi:10.1002/cjs.10141
[3] Genest,C.、Ghoudi,K.和Rivest,L.‐P。(1995). 多元分布族中相依参数的半参数估计过程。《生物统计学》,82,543-552。https://doi.org/10.1093/biomet/82.3.543 ·Zbl 0831.62030号 ·doi:10.1093/biomet/82.3543
[4] Genest,C.和Nešlehová,J.(2007)。copula上用于计数数据的引物。阿斯汀公报,37,475-515。https://doi.org/10.2143/AST.37.2.2024077 ·兹比尔1274.62398 ·doi:10.2143/AST.37.2.2024077
[5] Gruhl,J.、Erosheva,E.A.和Crane,P.K.(2013)。混合结果潜在变量模型的半参数方法:估计认知与区域脑容量之间的关联。应用统计年鉴,72361-2383。https://doi.org/10.1214/13AOAS675标准·Zbl 1283.62218号 ·doi:10.1214/13‐AOAS675
[6] He,J.、Li,H.、Edmondson,A.C.、Rader,D.J.和Li,M.(2012)。病例对照遗传关联研究中次级表型分析的高斯copula方法。生物统计学,13497-508。https://doi.org/10.1093/biostatistics/kxr025 ·Zbl 1244.62156号 ·doi:10.1093/biostatistics/kxr025
[7] Hoff,P.D.(2007)。扩展了半参数copula估计的秩似然。应用统计年鉴,1(1),265-283。https://doi.org/10.1214/07AOAS107标准·邮编1129.62050 ·doi:10.1214/07‐AOAS107
[8] Hua,L.和Joe,H.(2011)。多元copula的尾序和中间尾依赖性。多元分析杂志,1021454-1471。https://doi.org/10.1016/j.jmva.2011.05.011 ·Zbl 1221.62079号 ·doi:10.1016/j.jmva.2011.05.011
[9] Huber,P.、Ronchetti,E.和Victoria‐Feser,M.‐P。(2004). 广义线性潜变量模型的估计。英国皇家统计学会杂志,B辑,66893-908。https://doi.org/10.1111/j.1467‐9868.2004.05627.x·Zbl 1060.62077号 ·doi:10.1111/j.1467‐9868.2004.05627.x
[10] Irincheeva,I.、Cantoni,E.和Genton,M.(2012a)。非高斯空间广义线性潜变量模型。农业、生物和环境统计杂志,17,332-353。https://doi.org/10.1007/s13253‐012‐0099‐5 ·Zbl 1302.62264号 ·doi:10.1007/s13253‐012‐0099‐5
[11] Irincheeva,I.、Cantoni,E.和Genton,M.G.(2012b)。潜在变量分布灵活的广义线性潜在变量模型。《斯堪的纳维亚统计杂志》,39,663-680。https://doi.org/10.1111/j.1467‐9469.2011.00777.x·Zbl 1253.62051号 ·doi:10.1111/j.1467‐9469.2011.00777.x
[12] Jiryaie,F.、WithManage,N.、Wu,B.和deLeon,A.(2016年)。混合数据的高斯copula分布及其在判别中的应用。统计计算与模拟杂志,861643-1659。https://doi.org/101080/00949655.2015.1077386 ·Zbl 1510.62252号 ·doi:10.1080/00949655.2015.1077386
[13] Joe,H.(1993)。具有给定边距的多元分布的参数族。多元分析杂志,46(2),262-282。https://doi.org/10.1006/jmva.1993.1061 ·Zbl 0778.62045号 ·doi:10.1006/jmva.1993.1061
[14] Joe,H.(1997)。多元模型和相关性概念。英国伦敦:查普曼和霍尔·Zbl 0990.62517号
[15] Joe,H.(2005)。基于copula模型的两阶段估计方法的渐近效率。多元分析杂志,94401-419。https://doi.org/10.1016/j.jmva.2004.06.003 ·Zbl 1066.62061号 ·doi:10.1016/j.jmva.2004.06.003
[16] Joe,H.(2011)。藤蔓结合部的尾依赖性。D.Kurowicka(编辑)和H.Joe(编辑),《依赖建模:藤蔓连接手册》(第165-187页)。新加坡:世界科学。
[17] Joe,H.(2014)。用连接函数进行依赖建模。佛罗里达州博卡拉顿:查普曼和霍尔/CRC。
[18] Joe,H.、Li,H.和Nikoloulopoulos,A.K.(2010年)。尾巴依赖功能和藤蔓交配。多元分析杂志,101(1),252-270。https://doi.org/10.1016/j.jmva.2009.08.002 ·Zbl 1177.62072号 ·doi:10.1016/j.jmva.2009.08.002
[19] Kadhem,S.H.和Nikoloulopoulos,A.K.(2020年)。FactorCopula:用于混合连续和离散数据的因子copula模型。R包版本0.5。检索自http://CRAN.R网站‐project.org/package=FactorCopula公司
[20] Kaiser,H.F.(1958年)。因子分析中解析旋转的方差最大准则。《心理测量学》,23(3),187-200。https://doi.org/10.1007/BF02289233 ·Zbl 0095.33603号 ·doi:10.1007/BF02289233
[21] Katsikatsou,M.、Moustaki,I.、Yang‐Wallentin,F.和Jöreskog,K.G.(2012)。有序数据因子分析模型的成对似然估计。计算统计与数据分析,56,4243-4258。https://doi.org/10.1016/j.jmva.2016.10.006 ·Zbl 1255.62172号 ·doi:10.1016/j.jmva.2016.10.006
[22] Kelava,A.、Kohler,M.、Krzyżak,A.和Schaffland,T.F.(2017)。潜在变量模型的非参数估计。多元分析杂志,154112-134。https://doi.org/10.1016/j.jmva.2016.10.006 ·Zbl 1352.62057号 ·doi:10.1016/j.jmva.2016.10.006
[23] Kim,G.、Silvapulle,M.J.和Silvapelle,P.(2007)。估计连接函数的半参数和参数方法的比较。计算统计学和数据分析,512836-2850。https://doi.org/10.1016/j.csda.2006.10.009 ·Zbl 1161.62364号 ·doi:10.1016/j.csda.2006.10.009
[24] Krupskii,P.和Joe,H.(2013)。多元数据的因子copula模型。多元分析杂志,120,85-101。https://doi.org/10.1016/j.jmva.2013.05.001 ·Zbl 1280.62070号 ·doi:10.1016/j.jmva.2013.05.001
[25] Lawless,J.F.(1987年)。负二项和混合泊松回归。加拿大统计杂志,15(3),209-225。https://doi.org/10.2307/3314912 ·Zbl 0632.62060号 ·doi:10.2307/3314912
[26] Lee,S.‐Y。,Poon,W.Y.和Bentler,P.M.(1992)。具有连续变量和多变量的结构方程模型。《心理测量学》,57(1),89-105。https://doi.org/10.1007/BF02294660 ·Zbl 0760.62099号 ·doi:10.1007/BF02294660
[27] Ma,Y.和Genton,M.G.(2010年)。半参数广义线性潜变量模型的显式估计方程。英国皇家统计学会杂志,B辑,72,475-495。https://doi.org/10.1111/j.1467‐9868.2010.00741.x·Zbl 1411.62219号 ·doi:10.1111/j.1467‐9868.2010.00741.x
[28] Martin,A.D.、Quinn,K.M.和Park,J.H.(2011年)。MCMCpack:R.统计软件杂志中的马尔可夫链蒙特卡罗,42(9),22。
[29] Maydeu‐Olivares,A.和Joe,H.(2006年)。多维列联表中的有限信息拟合优度测试。《心理测量学》,第71、713-732页。https://doi.org/10.1007/s11336‐005‐1295‐9 ·兹比尔1306.62477 ·doi:10.1007/s11336‐005‐1295‐9
[30] Maydeu‐Olivares,A.和Joe,H.(2014)。在分类数据分析中评估近似拟合。多元行为研究,49,305-328。https://doi.org/10.1080/00273171.2014.911075 ·doi:10.1080/00273171.2014.911075
[31] Montanari,A.和Viroli,C.(2010年)。用于分析学生对大学课程满意度的偏正态因子模型。应用统计学杂志,37,473-487。https://doi.org/10.1080/0264760902736737 ·Zbl 1511.62401号 ·网址:10.1080/02664760902736737
[32] 穆斯塔基,I.(1996)。混合观测变量的潜在特征和潜在类模型。英国数学与统计心理学杂志,49,313-334。https://doi.org/10.1111/j.2044‐8317.1996.tb01091.x·Zbl 0904.62137号 ·doi:10.1111/j.2044‐8317.1996.tb01091.x
[33] Moustaki,I.和Knott,M.(2000年)。广义潜在特征模型。《心理测量学》,65,391-411。https://doi.org/10.1007/BF02296153 ·Zbl 1291.62236号 ·doi:10.1007/BF02296153
[34] Moustaki,I.和Victoria‐Feser,M.‐P。(2006). 广义线性潜在变量模型中的有界影响稳健估计。美国统计协会杂志,101644-653。https://doi.org/10.1198/01621450000001320 ·Zbl 1119.62323号 ·doi:10.1198/01621450000001320
[35] Murray,J.S.、Dunson,D.B.、Carin,L.和Lucas,J.E.(2013)。混合数据的贝叶斯-高斯copula因子模型。美国统计协会杂志,108656-665。https://doi.org/10.1080/01621459.2012.762328 ·Zbl 06195968号 ·doi:10.1080/01621459.2012.762328
[36] Muthén,B.(1984年)。具有二分法、有序分类和连续潜在变量指标的一般结构方程模型。《心理测量学》,49(1),115-132。https://doi.org/10.1007/BF02294210 ·doi:10.1007/BF02294210
[37] Nash,J.(1990年)。计算机的紧凑数值方法:线性代数和函数最小化(第二版)。布里斯托尔和纽约:亚当·希尔格·Zbl 0697.68004号
[38] Nikoloulopoulos,A.K.(2013)。关于使用连续扩展和模拟似然的正态copula离散回归模型的估计。《统计规划与推断杂志》,1431923-1937年。https://doi.org/10.1016/j.jspi.2013.06.015 ·Zbl 1279.62116号 ·doi:10.1016/j.jspi.2013.06.015
[39] Nikoloulopoulos,A.K.(2016)。具有离散空间响应的高维多元正态copula模型的有效估计。随机环境研究和风险评估,30(2),493-505。https://doi.org/10.1007/s00477‐015‐1060‐2 ·doi:10.1007/s00477‐015‐1060‐2
[40] Nikoloulopoulos,A.K.(2017年)。用于解释疾病流行率的诊断测试准确性研究的三变量荟萃分析的藤蔓-系谱混合效应模型。医学研究中的统计方法,262270-2286。https://doi.org/10.1177/0962280215596769 ·doi:10.1177/0962280215596769
[41] Nikoloulopoulos,A.K.和Joe,H.(2015)。项目响应数据的因子copula模型。《心理测量学》,80(1),126-150。https://doi.org/10.1007/s11336‐013‐9387‐4 ·Zbl 1314.62276号 ·doi:10.1007/s11336‐013‐9387‐4
[42] Nikololopoulos,A.K.、Joe,H.和Li,H.(2012年)。具有不对称尾部依赖的藤蔓连接函数及其在金融收益数据中的应用。计算统计与数据分析,56,3659-3673。https://doi.org/10.1016/j.csda.2010.07.016 ·Zbl 1254.91613号 ·doi:10.1016/j.csda.2010.07.016
[43] Nikoloulopoulos,A.K.和Karlis,D.(2008)。基于参数引导的Copula模型评估。计算统计与数据分析,52,3342-3353。https://doi.org/10.1016/j.csda.2007.10.028 ·Zbl 1452.62352号 ·doi:10.1016/j.csda.2007.10.028
[44] North,D.C.和Weingast,B.R.(1989)。宪法与承诺:十七世纪英国公共选择制度的演变。《经济史杂志》,49,803-832。https://doi.org/10.1017/S0022050700009451 ·doi:10.1017/S0022050700009451
[45] Panagiotelis,A.、Czado,C.、Joe,H.和Stöber,J.(2017)。离散正则藤蔓连接的模型选择。计算统计与数据分析,106138-152。https://doi.org/10.1016/j.csda.2016.09.007 ·Zbl 1466.62171号 ·doi:10.1016/j.csda.2016.09.007
[46] Quinn,K.M.(2004)。混合有序和连续反应的贝叶斯因子分析。政治分析,12338-353。https://doi.org/10.1093/pan/mph022 ·doi:10.1093/pan/mph022
[47] R核心团队(2020年)。R: 用于统计计算的语言和环境。奥地利维也纳:R统计计算基金会。检索自https://www.R‐项目.org/
[48] Rabe‐Hesketh,S.、Pickles,A.和Skrondal,A.(2003)。使用非参数最大似然估计修正逻辑回归中的协变量测量误差。统计建模,3,215-232。https://doi.org/10.1191/1471082X03st056oa ·Zbl 1070.62024号 ·doi:10.1191/1471082X03st056oa
[49] Rabe‐Hesketh,S.和Skrondal,A.(2001)。分类数据的多变量随机效应模型的参数化。生物统计学,571256-1263。https://doi.org/10.1111/j.0006‐341X.20011.256_1.x·Zbl 1209.62136号 ·doi:10.1111/j.0006‐341X.2001.1256_1.x
[50] Rabe‐Hesketh,S.和Skrondal,A.(2004)。广义潜在变量建模:多级、纵向和结构方程模型。佛罗里达州博卡拉顿:CRC出版社·Zbl 1097.62001
[51] Rizopoulos,D.和Moustaki,I.(2008)。具有非线性效应的广义潜在变量模型。英国数学与统计心理学杂志,61(2),415-438。https://doi.org/10.1348/000711007X213963 ·doi:10.1348/000711007X213963
[52] Shen,C.和Weissfeld,L.(2006)。具有不可忽略非单调缺失结果的重复测量的copula模型。医学统计学,252427-2440。https://doi.org/10.1002/sim.2355 ·doi:10.1002/sim.2355
[53] Shih,J.H.和Louis,T.A.(1995年)。双变量生存数据的copula模型中关联参数的推断。生物统计学,511384-1399。https://doi.org/10.2307/2533269 ·Zbl 0869.62083号 ·doi:10.2307/2533269
[54] Sklar,A.(1959年)。维度和边界的划分函数。巴黎大学统计研究所出版物,8229-231·Zbl 0100.14202号
[55] Smith,M.S.和Khaled,M.A.(2012年)。基于贝叶斯数据增强的离散余量copula模型估计。美国统计协会杂志,107,290-303。https://doi.org/10.1080/01621459.2011.644501 ·Zbl 1261.62051号 ·doi:10.1080/01621459.2011.644501
[56] 宋,P.‐X.‐K.,Li,M.,&Yuan,Y.(2009)。使用高斯连接函数对相关数据进行联合回归分析。生物统计学,65(1),60-68。https://doi.org/10.1111/j.1541‐0420.2008.01058.x·Zbl 1159.62049号 ·doi:10.1111/j.1541‐0420.2008.01058.x
[57] Stöber,J.、Hong,H.G.、Czado,C.和Ghosh,P.(2015)。老年人慢性病合并症:通过交配设计确定的混合反应模式。计算统计与数据分析,88,28-39。https://doi.org/10.1016/j.csda.2015.02.001 ·Zbl 1468.62182号 ·doi:10.1016/j.csda.2015.02.001
[58] Stroud,A.和Secrest,D.(1966年)。高斯求积公式。新泽西州恩格尔伍德悬崖:普伦蒂斯·霍尔·Zbl 0156.17002号
[59] Takane,Y.,de Leeuw,J.(1987)。关于项目反应理论与离散变量的因子分析之间的关系。《心理测量学》,52,393-408。https://doi.org/10.1007/BF02294363 ·Zbl 0628.62104号 ·doi:10.1007/BF02294363
[60] Vuong,Q.H.(1989)。模型选择和非嵌套假设的似然比测试。《计量经济学》,57(2),307-333。https://doi.org/10.2307/1912557 ·Zbl 0701.62106号 ·doi:10.2307/1912557
[61] Wedel,M.和Kamakura,W.A.(2001年)。指数族中(混合)观测变量和潜在变量的因子分析。《心理测量学》,66,515-530。https://doi.org/10.1007/BF02296193 ·Zbl 1293.62261号 ·doi:10.1007/BF02296193
[62] Zilko,A.A.和Kurowicka,D.(2016)。多元混合离散连续模型中的Copula。计算统计与数据分析,103,28-55。https://doi.org/10.1016/j.csda.2016.02.017 ·Zbl 1466.62235号 ·doi:10.1016/j.csda.2016.02.017
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。