×

贝叶斯模型选择用于高维伊辛模型,并应用于教育数据。 (英语) Zbl 07422851号

摘要:双不可处理的后验分布出现在涉及离散和相关数据的统计的许多应用中,包括物理、空间统计、机器学习、社会科学和其他领域。一个具体的例子是心理测量学,它采用了机器学习的高维伊辛模型,以研究教育评估中二进制项目反应之间的相互作用。为了从教育评估数据中估计高维Ising模型,使用了(ell_1)惩罚的逐点logistic回归。高维统计的理论结果表明,在满足某些假设的情况下,(ell_1)惩罚的节点逻辑回归能够以较高的概率恢复真实的交互结构。这些假设在实践中很难验证,并且可能会被违反,量化估计的交互结构和参数估值器的不确定性具有挑战性。我们提出了一种贝叶斯方法,该方法有助于量化交互结构和参数的不确定性,而不需要强有力的假设,并且可以应用于具有数千个参数的伊辛模型。通过对多达2485个参数的大小教育数据集的模拟研究和应用,我们证明了所提出的贝叶斯方法与惩罚节点逻辑回归相比的优势。除其他外,模拟研究表明,贝叶斯方法对因遗漏协变量而导致的模型错误指定比惩罚的节点逻辑回归更为稳健。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Agresti,A.,《分类数据分析》(2002),John Wiley&Sons:John Willey&Sons Hoboken·Zbl 1018.6202号
[2] 阿尔基尔,P。;弗里尔,N。;埃弗里特,R。;Boland,A.,Noisy Monte Carlo:具有近似转移核的马尔可夫链的收敛性,统计计算。,26, 1-2, 29-47 (2016) ·Zbl 1342.60122号
[3] 阿南德库马尔,A。;Tan,V.Y.F。;黄,F。;Willsky,A.S.,《伊辛模型中的高维结构估计:局部分离准则》,《Ann.Stat.》,第40期,第1346-1375页(2012年)·Zbl 1297.62124号
[4] Atchadé,Y.F.,具有截断漂移的Metropolis调整Langevin算法的自适应版本Methodol。计算。申请。概率。,8, 2, 235-254 (2006) ·Zbl 1104.65004号
[5] Atchade,Y.F。;北拉蒂洛。;Robert,C.,具有难处理归一化常数的统计模型的贝叶斯计算,Braz。J.概率。Stat.,27,4,416-436(2013)·Zbl 1298.62046号
[6] 博蒙特,医学硕士。;张伟。;Balding,D.J.,《群体遗传学中的近似贝叶斯计算》,遗传学,162,42025-2035(2002)
[7] Besag,J.,《晶格系统的空间相互作用和统计分析》,J.R.Stat.Soc.,Ser。B、 Methodol.方法。,36, 192-236 (1974) ·Zbl 0327.60067号
[8] Borsboom,D.,《诊断系统的心理测量学观点》,J.Clin。心理医生。,64, 9, 1089-1108 (2008)
[9] Bouranis,L。;弗里尔,N。;Maire,F.,通过修正伪后验分布对指数随机图模型进行有效贝叶斯推断,Soc.Netw。,50, 98-108 (2017)
[10] Bouranis,L。;弗里尔,N。;Maire,F.,通过调整伪似然选择指数随机图模型的贝叶斯模型,J.Compute。图表。统计,27,3,516-528(2018)·Zbl 07498929号
[11] Bresler,G。;Karzand,M.,《学习树结构伊辛模型以进行预测》,《Ann.Stat.》,48,713-737(2020)·Zbl 1469.62334号
[12] Bühlmann,P。;van de Geer,S.,《高维数据统计:方法、理论和应用》(2011),Springer-Verlag:Springer-Verlag纽约·Zbl 1273.62015年
[13] Butts,C.T.,指数族随机图模型的完美抽样方法,J.Math。社会学。,42, 1, 17-36 (2018) ·Zbl 1485.91179号
[14] Caimo,A。;Friel,N.,指数随机图模型的贝叶斯推断,Soc.Netw。,33, 1, 41-55 (2011)
[15] Caimo,A。;Friel,N.,指数随机图模型的贝叶斯模型选择,Soc.Netw。,35, 1, 11-24 (2013)
[16] Caimo,A。;Friel,N.,Bergm:R,J.Stat.Softw.中的贝叶斯指数随机图。,61, 1-25 (2014)
[17] Caimo,A。;Gollini,I.,加权网络的多层指数随机图建模方法,计算。统计数据分析。,142106-125(2020)·Zbl 1507.62021号
[18] 卡瓦略,C.M。;新几内亚波尔森。;Scott,J.G.,《稀疏信号的马蹄形估计器》,Biometrika,97,2,465-480(2010)·Zbl 1406.62021号
[19] Chatterjee,S.,Stein的集中不等式方法,Probab。理论关联。菲尔德,138,305-321(2007)·Zbl 1116.60056号
[20] 陈,J。;Chen,Z.,《大模型空间模型选择的扩展贝叶斯信息准则》,Biometrika,95759-771(2008)·Zbl 1437.62415号
[21] Eddelbuettel,D。;弗朗索瓦,R。;Allaire,J。;钱伯斯,J。;贝茨,D。;Ushey,K.,Rcpp:无缝R和C++集成,J.Stat.Softw。,40, 8, 1-18 (2011)
[22] 爱普斯卡姆,S。;Borsboom,D。;Fried,E.I.,《估算心理网络及其准确性:辅导论文》,Behav。研究方法,50,195-212(2018)
[23] Everitt,R.G.,潜在马尔可夫随机场和社交网络的贝叶斯参数估计,J.Compute。图表。统计,21940-960(2012)
[24] Flegal,J.M。;哈兰,M。;Jones,G.L.,马尔可夫链蒙特卡罗:我们能相信第三个重要数字吗?,统计科学。,23, 250-260 (2008) ·Zbl 1327.62017年
[25] O·弗兰克。;斯特劳斯,D.,马尔可夫图,美国统计协会,81,832-842(1986)·Zbl 0607.05057号
[26] 弗里尔,N。;米拉,A。;Oates,C.J.,《利用多核架构进行难以处理的可能性的降维估计》,贝叶斯分析。,11, 1, 215-245 (2016) ·兹比尔1357.62112
[27] 乔治·E。;McCulloch,R.,《通过吉布斯抽样选择变量》,美国统计协会,88,881-889(1993)
[28] Ghosal,P。;Mukherjee,S.,《伊辛模型中参数的联合估计》,《Ann.Stat.》,48,785-810(2020)·Zbl 1452.62372号
[29] Goldstein,J.,传染病的隔室、空间和点过程模型(2015),宾夕法尼亚州立大学博士论文
[30] 京畿道教育厅,2012年。创新学校管理计划。大韩民国京畿道。
[31] 亨特·D·R。;Handcock,M.S.,《网络弯曲指数族模型的推断》,J.Compute。图表。《统计》,第15卷,第565-583页(2006年)
[32] 亨特·D·R。;Krivitsky,P.N。;Schweinberger,M.,《社交网络模型的计算统计方法》,J.Compute。图表。统计,21,856-882(2012)
[33] Ishwaran,H。;Rao,J.S.,《尖峰和平板变量选择:频率学家和贝叶斯策略》,《Ann.Stat.》,第33期,第730-773页(2005年)·Zbl 1068.62079号
[34] Ising,E.,Beitrac zur Ferrometrismus理论,Z.Phys。A、 31253-258(1925)·Zbl 1439.82056号
[35] Jeon,M。;Jin,I.H。;施温伯格,M。;Baugh,S.,《绘制未观察到的项目反应交互:带有交互图的潜在空间项目反应模型》,《心理测量学》,86,2,378-403(2021)·兹比尔1477.62342
[36] Jin,I.H。;Jeon,M.,项目反应数据分析中局部项目和个人依赖的双潜空间联合模型,《心理测量学》,84,1,236-260(2019)·Zbl 1431.62540号
[37] Jin,I.H。;袁,Y。;Liang,F.,使用自适应交换采样器对指数随机图模型进行贝叶斯分析,Stat.Interface,6559-576(2013)·Zbl 1326.05142号
[38] Jones,G.L。;哈兰,M。;Caffo,B.S。;Neath,R.,《马尔可夫链蒙特卡罗的固定宽度输出分析》,美国统计协会,101,476,1537-1547(2006)·Zbl 1171.62316号
[39] Koskinen,J.,《关于社会网络贝叶斯推断的论文》(2004),斯德哥尔摩大学统计系:斯德哥尔曼大学,瑞典统计系,博士论文
[40] Koskinen,J.H。;罗宾斯,G.L。;Pattison,P.E.,使用贝叶斯数据扩充分析具有缺失数据的指数随机图(P-star)模型,Stat.Methol。,7, 366-384 (2010) ·Zbl 1233.62206号
[41] Lauritzen,S.,《图形模型》(1996),牛津大学出版社:牛津大学出版社,英国牛津·Zbl 0907.62001
[42] Lederer,J.,《高维统计基础——带练习和R实验室》,Springer Texts in Statistics(2021),Springer:Springer Heidelberg·Zbl 1499.62005号
[43] Liang,F.,《具有难以处理的归一化常数的空间模型的双Metropolis-Hastings采样器》,J.Stat.Compute。模拟。,2010年10月9日至22日·兹比尔1233.62117
[44] 梁,F。;Jin,I.H.,从具有难以处理的归一化常数的分布中采样的蒙特卡罗大都会-黑斯廷斯算法,神经计算。,25, 8, 2199-2234 (2013) ·Zbl 1448.62040号
[45] 梁,F。;Jin,I.H。;宋,Q。;Liu,J.S.,从具有难以处理的归一化常数的分布中采样的自适应交换算法,美国统计协会,111,377-393(2016)
[46] Lusher,D。;Koskinen,J。;Robins,G.,《社交网络的指数随机图模型》(2013),剑桥大学出版社:英国剑桥大学出版社
[47] Lyne,A。;Girolma,M。;阿查德,Y。;斯特拉赫曼,H。;Simpson,D.,《关于具有双重棘手可能性的贝叶斯推断的俄罗斯轮盘赌估计》,Stat.Sci。,30, 1-26 (2015) ·Zbl 1426.62092号
[48] Maathuis,M。;德顿,M。;Lauritzen,S。;Wainwright,M.,《图形模型手册》(2019),CRC出版社:佛罗里达州博卡拉顿CRC出版社·Zbl 1410.62001号
[49] Marin,J.M。;Pudlo,P。;罗伯特·C·P。;Ryder,R.J.,近似贝叶斯计算方法,统计计算。,22, 6, 1167-1180 (2012) ·Zbl 1252.62022号
[50] 马约拉姆,P。;莫利托,J。;Plagnol,V.公司。;Tavare,S.,《无可能性的马尔可夫链蒙特卡罗》,Proc。国家。阿卡德。科学。美国,10015324-15328(2003)
[51] 马斯曼,M。;Borsboom,D。;Kruis,J。;Epskamp,S.公司。;范博克,R。;Waldorp,L.J。;范德马斯,H.L.J。;Maris,G.K.J.,《网络心理测量学导论:将伊辛网络模型与项目反应理论模型联系起来》,Multivar。行为。决议,53,15-35(2018)
[52] 明绍森,N。;Bühlmann,P.,《LASSO的高维图和变量选择》,Ann.Stat.,341436-1462(2006)·Zbl 1113.62082号
[53] 莫勒,J。;Pettitt,A.N。;里夫斯,R。;Berthelsen,K.K.,《具有难以处理的归一化常数的分布的有效马尔可夫链蒙特卡罗方法》,《生物统计学》,93,2,451-458(2006)·Zbl 1158.62020号
[54] 我·穆雷。;加赫拉马尼,Z。;MacKay,D.J.C.,MCMC,双难处理分布,(第22届人工智能不确定性年会论文集(2006),AUAI出版社:AUAI Press Corvallis),359-366
[55] 奥哈拉,R.B。;Sillanpää,M.J.,《贝叶斯变量选择方法综述:什么、如何以及是什么,贝叶斯分析》。,4, 1, 85-117 (2009) ·Zbl 1330.62291号
[56] Park,J。;Haran,M.,《存在难以处理的归一化函数时的贝叶斯推断》,美国统计协会,113,523,1372-1390(2018)·Zbl 1402.62046号
[57] Park,J。;Haran,M.,《双重棘手分布的函数仿真方法》,J.Compute。图表。统计,29,1,66-77(2020)·Zbl 07499272号
[58] 帕克,T。;Casella,G.,《贝叶斯套索》,J.Am.Stat.Assoc.,103,482,681-686(2008)·Zbl 1330.62292号
[59] Piaget,J.,《生物学与知识》(1971),芝加哥大学出版社:芝加哥大学出版社
[60] 普里查德,J。;塞尔斯塔德,麻省理工。;Perez-Lezaun,A。;Feldman,M.W.,《人类Y染色体的群体增长:Y染色体微卫星的研究》,《分子生物学》。演变。,16, 1791-1798 (1999)
[61] Propp,J.G。;Wilson,D.B.,耦合马尔可夫链的精确抽样及其在统计力学中的应用,随机结构。算法,9,1-2,223-252(1996)·Zbl 0859.60067号
[62] Rand,W.M.,聚类方法评估的客观标准,J.Am.Stat.Assoc.,66846-850(1971)
[63] 拉维库马尔,P。;Wainwright,M.J。;Lafferty,J.,使用(ell_1)正则化逻辑回归的高维Ising模型选择,《Ann.Stat.》,38,1287-1319(2010)·Zbl 1189.62115号
[64] 罗伯特·C·P。;科努特,J.M。;马林,J.M。;Pillai,N.S.,对近似贝叶斯计算模型选择缺乏信心,Proc。国家。阿卡德。科学。,108, 37, 15112-15117 (2011)
[65] 罗宾斯,G。;帕蒂森,P。;Kalish,Y。;Lusher,D.,《社交网络指数随机图(p*)模型简介》,Soc.Netw。,29, 2, 173-191 (2007)
[66] 施温伯格,M。;Handcock,M.S.,《随机图模型中的局部依赖:特征、性质和统计推断》,J.R.Stat.Soc.,Ser。B、 77、647-676(2015)·Zbl 1414.62096号
[67] 施温伯格,M。;Krivitsky,P.N。;巴特斯,C.T。;Stewart,J.R.,随机图的指数族模型:有限、超级和无限总体场景中的推理,统计科学。,35, 627-662 (2020) ·Zbl 07307194号
[68] 邵,J.,《数理统计》(2003),施普林格出版社:纽约施普林格·Zbl 1018.62001号
[69] Sisson,S.A。;范,Y。;Tanaka,M.M.,《无可能性序贯蒙特卡罗》,Proc。国家。阿卡德。科学。,104, 1760-1765 (2007) ·Zbl 1160.65005号
[70] 《社会和社区规划研究》,《英国社会态度》,1987年报告(1987),高尔出版社
[71] 斯皮尔,C。;Gluck,J.,演绎推理能力剖面和能力水平的基于模型的测试,(Hartig,J.;Klieme,E.;Leutner,D.,《教育背景下的能力评估:现状和未来展望》(2008),霍格利夫:霍格利夫·戈廷根),41-60
[72] 斯皮尔,C。;Gluck,J。;Gossler,H.,《单向性的稳定性和变化:演绎推理的样本案例》,J.Adolesc。第16号决议,第150-168页(2001年)
[73] 斯图尔特,J.R。;施温伯格,M。;博亚诺夫斯基,M。;Morris,M.,多层网络数据促进了具有几何加权项的曲线ERGM的统计推断,Soc.Netw。,59, 98-119 (2019)
[74] Stoehr,J。;Benson,A。;Friel,N.,双重棘手分布的噪声哈密顿蒙特卡罗(2017),Arxiv预印本
[75] Strauss,D.J.,聚类模型,Biometrika,62,2466-475(1975)·Zbl 0313.62044号
[76] Sundberg,R.,《指数族统计建模》(2019),剑桥大学出版社:剑桥大学出版社,英国剑桥·Zbl 1454.62003年
[77] Thiemichen,S。;弗里尔,N。;Caimo,A。;Kauermann,G.,具有节点随机效应的贝叶斯指数随机图模型,Soc.Netw。,46, 11-28 (2016)
[78] Toni,T。;韦尔奇,D。;斯特雷尔科瓦,N。;艾普森。;Stumpf,M.P.H.,动力学系统中参数推断和模型选择的近似贝叶斯计算方案,J.R.Soc.Interface,6187-202(2009)
[79] van Borkulo,C。;爱普斯卡姆,S。;Robitzsch,A.,《IsingFit:使用ELasso方法拟合Ising模型》(2016),R包版本0.3.1
[80] van Borkulo,C.D。;Borsboom,D。;爱普斯卡姆,S。;布兰肯,T.F。;Boschloo,L。;Schoevers,R.A。;Waldorp,L.J.,《从二进制数据构建网络的新方法》,科学。代表4(2014年)
[81] Wainwright,M.J.,《高维统计》。《非症状观点》(2019),剑桥大学出版社:剑桥大学出版社,英国剑桥·Zbl 1457.62011年
[82] Whittaker,J.,《应用多元统计中的图形模型》(2009),John Wiley&Sons:John Willey&Sons New York
[83] 薛,L。;邹,H。;Cai,T.,稀疏Ising模型的非凹陷惩罚复合条件似然估计,Ann.Stat.,40,1403-1429(2012)·Zbl 1284.62451号
[84] Yi,N。;Xu,S.,Bayesian LASSO用于数量性状位点定位,遗传学,179,2,1045-1055(2008)
[85] 尹,F。;Butts,C.T.,基于核的指数族随机图模型近似贝叶斯推断(2020)
[86] 赵,P。;Yu,B.,关于Lasso,J.Mach的模型选择一致性。学习。第72541-2563号决议(2006年)·Zbl 1222.62008年
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。