×

用于建模高维二进制数据的一系列块状单因子分布。 (英语) Zbl 1464.62126号

摘要:介绍了一种新的用于建模高维二进制数据的单因子分布族。该模型为每个事件提供了明确的概率,从而避免了现有方法经常进行的数值近似。模型解释很容易,因为每个变量由两个连续参数(对应于边际概率和与其他变量的相关性强度)和一个二进制参数(定义相关性是正的还是负的)描述。该模型通过将变量拆分为独立的块来扩展,每个块都遵循新的单因子分布。最后,提出了该模型的简约版本,强制在依赖参数之间施加一些相等约束。参数估计是通过推理余量过程进行的,其中第二步是通过期望最大化算法实现的。模型选择是通过确定性方法进行的,这大大减少了竞争模型的数量。这种一致性方法使用了变量的分层上升分类,该分类选择了模型的窄子集。该选择基于Cramer V的经验版本。新模型通过数值实验和实际数据集进行评估。该过程在R包MvBinary中实现。

理学硕士:

62-08 统计问题的计算方法
62H10型 统计的多元分布
62小时05 多元概率分布的表征与结构理论;连接线
62H20个 关联度量(相关性、典型相关性等)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bellman,R.,《动态编程》(1957),普林斯顿大学出版社·Zbl 0077.13605号
[2] Billingsley,P.,概率测度的收敛性,(2013),John Wiley&Sons·兹标0172.21201
[3] 布鲁斯科,M。;Steinley,D.,《使用序列化程序归纳双模二进制数据的块模型结构》,J.Math。心理学,50,5468-477,(2006)·Zbl 1151.91730号
[4] Celeux,G。;Govaert,G.,离散数据和潜在类模型的聚类标准,J.分类,8,2,157-176,(1991)·Zbl 0775.62150号
[5] Chow,C。;Liu,C.,用依赖树逼近离散概率分布,IEEE Trans。通知。理论,14,3462-467,(1968)·Zbl 0165.22305号
[6] Collett,D.,《二进制数据建模》(2002),CRC出版社·Zbl 0431.62020号
[7] Cox,D.R.,多元二元数据分析,J.R.Stat.Soc.Ser。C.申请。Stat.,21,2,113-120,(1972)
[8] 考克斯·D·R。;Snell,E.J.,《二进制数据分析》,第32卷,(1989),CRC出版社·Zbl 0729.62004号
[9] 考克斯·D·R。;Wermuth,N.,关于二次指数二元分布的注记,Biometrika,81,2,403-408,(1994)·Zbl 0825.62363号
[10] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法从不完整数据中获得最大似然》,J.R.Stat.Soc.Ser。B统计方法。,39, 1, 1-38, (1977) ·Zbl 0364.62022号
[11] 丁·W。;Song,P.X.-K.,缺失数据高斯连接函数中的EM算法,计算。统计师。数据分析。,101, 1-11, (2016) ·Zbl 1466.62056号
[12] 加伊坦,C。;盖恩,X。;Bleakley,K.,《空间统计与建模》,第271卷,(2010年),施普林格出版社·Zbl 1271.62214号
[13] 高,X。;Song,P.X.-K.,高维数据中模型选择的复合似然贝叶斯信息标准,J.Amer。统计师。协会,105,492,1531-1540,(2010)·Zbl 1388.62034号
[14] Genest,C。;Nešlehová,J.,计数数据的连接线引物,Astin Bull。,37, 02, 475-515, (2007) ·Zbl 1274.62398号
[15] Genest,C。;Nikoloulopoulos,A.K。;铆钉,L.-P。;Fortin,M.,通过逻辑回归和超椭圆连接预测依赖性二元结果,Braz。J.概率。统计,27,3,265-284,(2013)·Zbl 1298.62080号
[16] Genest,C。;Rivest,L.-P.,《二元阿基米德连接函数的统计推断程序》,J.Amer。统计师。协会,88,423,1034-1043,(1993)·Zbl 0785.62032号
[17] Glonek,G.F。;McCullagh,P.,多元逻辑模型,J.R.Stat.Soc.Ser。B统计方法。,57, 3, 533-546, (1995) ·兹比尔0827.62059
[18] Goodman,L.,使用可识别和不可识别模型进行探索性潜在结构分析,Biometrika,61,2,215-231,(1974)·Zbl 0281.62057号
[19] 赫尔南德斯·洛巴托,J.M。;苏亚雷斯,A.,《半参数二元阿基米德连接函数》,计算。统计师。数据分析。,55, 6, 2038-2058, (2011) ·兹比尔1328.62367
[20] 霍德林,S。;Sherman,R.,相关随机系数二元响应模型中的识别和估计,《计量经济学》,188,1135-149,(2015)·Zbl 1337.62055号
[21] 休伯特,L。;Arabie,P.,比较分区,J.分类,2,1,193-218,(1985)
[22] Joe,H.,多元模型和多元相关性概念,(1997),CRC出版社·Zbl 0990.62517号
[23] Joe,H.,基于copula模型的两阶段估计方法的渐近效率,J.多元分析。,94, 2, 401-419, (2005) ·Zbl 1066.62061号
[24] 约翰逊,N.L。;Kott,S.,关于一些广义farlie-Gumbel-morgenstern分布,Comm.Statist。理论方法,4,5,415-427,(1975)·Zbl 0342.62006号
[25] Knott,M。;Bartholomew,D.J.,潜在变量模型和因子分析。爱德华·阿诺德(2002),第7号·Zbl 1066.62528号
[26] Krupskii,P。;Joe,H.,《结构因子copula模型:理论、推理和计算》,《多元分析杂志》。,138,53-73,(2015)·Zbl 1320.62139号
[27] Kruskal,J.B.,关于图的最短生成子树和旅行商问题,Proc。阿默尔。数学。Soc.,7,1,48-50,(1956年)·Zbl 0070.18404号
[28] Kurowicka,D.,《依赖建模:藤蔓系谱手册》(2011),《世界科学》
[29] 马尔巴克,M。;Tubert-Bitter,P。;Sedki,M.,检测药物不良反应的逻辑回归中的贝叶斯模型选择,Biom。J.,(2016)·Zbl 1353.62121号
[30] Mazo,G。;Girard,S。;Forbes,F.,一类灵活且易于处理的单因子连接函数,《统计计算》。,1-15, (2015)
[31] McLachlan,G.J。;Krishnan,T.,(《EM算法与扩展》,《概率与统计中的威利级数》,(2008),威利-国际科学霍博肯,新泽西州)·兹比尔1165.62019
[32] 麦克尼尔,A.J。;Nešlehová,J.,多元阿基米德copula,d-单调函数和(ell_1)-范数对称分布,Ann.Statist。,3059-3097, (2009) ·Zbl 1173.62044号
[33] 尼斯,A.A。;Cavanaugh,J.E.,《贝叶斯信息标准:背景、推导和应用》,威利互斥。版次计算。统计,4,2,199-203,(2012)
[34] Nelsen,R.B.,(Copulas简介,Springer Series in Statistics,(2006),Springer-Verlag New York,Inc.Secaucus,NJ,USA)·Zbl 1152.62030
[35] Nikoloulopoulos,A.K.,多元离散响应数据的基于Copula的模型,(数学和定量金融中的Copula,统计学课堂讲稿,(2013),柏林斯普林格大学,海德堡)·Zbl 06210183号
[36] Nikoloulopoulos,A.K。;Joe,H.,项目反应数据的因子copula模型,《心理测量学》,80,1,126-150,(2013)·Zbl 1314.62276号
[37] Nikoloulopoulos,A.K。;Joe,H。;Li,H.,多元t连接函数的极值性质,极值,12,2,129-148,(2009)·Zbl 1223.62081号
[38] Nikoloulopoulos,A.K。;Joe,H。;Li,H.,Vine连接函数与非对称尾部相关性及其在金融收益数据中的应用,计算。统计师。数据分析。,56, 11, 3659-3673, (2012) ·Zbl 1254.91613号
[39] Nikoloulopoulos,A.K。;Karlis,D.,多元logit copula模型及其在牙科数据中的应用,Stat.Med.,27,30,6393-6406,(2008)
[40] Nikoloulopoulos,A.K。;Karlis,D.,《多元离散数据建模的有限正态混合连接函数》,J.Statist。计划。推理,139,11,3878-3890,(2009)·Zbl 1169.62044号
[41] Panagiotelis,A。;Czado,C.公司。;Joe,H.,多元离散数据的配对copula构造,J.Amer。统计师。协会,107,499,1063-1072,(2012)·Zbl 1395.62114号
[42] 佩雷斯,M.F。;Shkilko,A。;Sokolov,K.,二元金融数据的因子模型,J.Banking Finance,61,增补2,S177-S188,(2015),金融计量学和应用的最新发展
[43] Pettitt,A.N。;堰,I.S。;Hart,A.G.,《不规则间距多元数据的条件自回归高斯过程及其在建模大型二进制数据集中的应用》,《统计计算》。,12, 4, 353-367, (2002)
[44] 罗伯特·C。;Casella,G.,Monte Carlo统计方法,(2004),Springer Verlag·Zbl 1096.62003年
[45] Schwarz,G.,估算模型的维数,Ann.Statist。,6, 2, 461-464, (1978) ·Zbl 0379.62005年
[46] Song,P.,由高斯copula生成的多元离散模型,Scand。J.统计。,27, 2, 305-320, (2000) ·Zbl 0955.62054号
[47] Song,P.,相关数据分析:建模、分析和应用,(2007年),Springer Science&Business Media·Zbl 1132.62002号
[48] Sorensen,A.L.,具有正溢出效应的二元选择实验中的不对称性、不确定性和极限,J.Econ。行为。器官。,116, 43-55, (2015)
[49] 堰,I.S。;Pettitt,A.N.,《使用隐式条件自回归高斯过程的二进制概率图》,J.Roy。统计师。Soc.序列号。C、 49,4473-484,(2000年)·Zbl 0965.62099号
[50] 《关于多元高斯连接函数》,J.Statist。计划。推断,139,11,3942-3946,(2009)·Zbl 1169.62055号
[51] Zilko,A.A。;Kurowicka,D.,多元混合离散连续模型中的Copula,计算。统计师。数据分析。,103, 28-55, (2016) ·Zbl 1466.62235号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。