×

线性混合模型中的并行计算。 (英语) Zbl 1505.62432号

摘要:在本研究中,我们提出了一种基于大数据生成的线性混合模型(LMM)的并行编程方法。一种常用的算法,期望最大化(EM),由于其使用的是最大似然估计,所以更受欢迎,因为估计是稳定且简单的。然而,EM具有较高的计算成本。在我们提出的方法中,我们使用除法和重组将数据拆分为较小的子集,在多个局部核上并行运行算法步骤并合并结果。所提出的方法用于拟合具有密集和稀疏参数的LMM,并用于大量观测。它比经典方法更快,并且适用于大数据。R包中提供了建议方法的补充来源1兆帕.

MSC公司:

62-08 统计问题的计算方法
62J05型 线性回归;混合模型
10层62层 点估计
62兰特 大数据和数据科学的统计方面
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Broderick T、Boyd N、Wibisono A、Wilson AC、Jordan MI(2013)《流媒体变化贝叶斯》。第26届神经信息处理系统国际会议记录第2卷,NIPS’13。纽约Curran Associates Inc,第1727-1735页
[2] 阿联酋登普斯特;新墨西哥州莱尔德;Rubin,DB,通过EM算法从不完整数据中获得最大似然,J Roy Stat Soc B,39,1,1-38(1977)·Zbl 0364.62022号
[3] Gokalp Yavuz F,Schloerke B(2017)平行线性混合模型https://CRAN.R-project.org/package=lmmpar,R包版本0.1.0
[4] 郭刚,《统计推断的并行统计计算》,《统计理论与实践》,2012年第6期,第3期,第536-565页·Zbl 1425.62060号 ·doi:10.1080/15598608.2012.695705
[5] 郭,G。;你,W。;钱,G。;Shao,W.,多元线性回归模型的并行最大似然估计,J Comput Appl Math,273,251-263(2015)·Zbl 1429.62290号 ·doi:10.1016/j.cam.2014.06.005
[6] 凯恩,MJ;艾默生,J。;Weston,S.,《海量数据计算的可扩展策略》,J Stat Softw,55,14,1-19(2013)·doi:10.18637/jss.v055.i14
[7] Kontoghiorghes,EJ,并行计算和统计手册(统计学、教科书和专著)(2005年),博卡拉顿:查普曼和霍尔/CRC,博卡拉顿
[8] 新墨西哥州莱尔德;Ware,JH,纵向数据的随机效应模型,生物统计学,38,4,963-74(1982)·Zbl 0512.62107号 ·doi:10.2307/2529876
[9] 刘,C。;Rubin,DB,The ECME algorithm:EM和ECM的简单扩展,具有更快的单调收敛性,Biometrika,81,4,633(1994)·Zbl 0812.62028号 ·doi:10.1093/biomet/81.4.633
[10] Maclaurin D,Adams RP(2014)《萤火虫蒙特卡罗:具有数据子集的精确MCMC》。第三十届人工智能不确定性会议论文集,UAI'14。阿灵顿AUAI出版社,第543-552页
[11] Nagel,K。;Rickert,M.,transims微模拟的并行实现,并行计算,271611-1639(2001)·Zbl 0982.68020号 ·doi:10.1016/S0167-8191(01)00106-5
[12] Neiswanger W,Wang C,Xing EP(2014)渐进精确,令人尴尬的平行MCMC。在第三十届人工智能不确定性会议记录中,UAI’14。阿灵顿AUAI出版社,第623-632页
[13] Ooi H、Microsoft Corporation、Weston S、Tenenbaum D(2019a)doParallel:foreach并行适配器,用于“并行”软件包。R软件包版本1.0.15。https://cran.r-project.org/web/packages/doParallel/index.html
[14] Ooi H,Microsoft Corporation,Weston S(2019b)Foreach:提供Foreach循环结构。R包版本1.4.7。https://cran.r-project.org/web/packages/foreach/index.html
[15] 皮涅罗,JC;刘,C。;Wu,YN,使用多元t分布的线性混合效应模型中稳健估计的有效算法,J计算图统计,10,2,249-276(2001)·doi:10.1198/10618600152628059
[16] R核心团队(2017)R:统计计算的语言和环境。R统计计算基金会,维也纳
[17] Renaut,RA,最小二乘问题的并行多分裂解,数值线性代数应用,5,1,11-31(1998)·Zbl 0937.65049号 ·doi:10.1002/(SICI)1099-1506(199801/02)5:1<11::AID-NLA123>3.0.CO;2楼
[18] Schafer JL(1998)线性混合模型的一些改进程序。宾夕法尼亚州立大学统计系技术报告
[19] 事务,M-N;诺特,DJ;库克,AYC;Kohn,R.,《大型数据集的并行变分贝叶斯及其在广义线性混合模型中的应用》,《计算图统计杂志》,25,2,626-646(2016)·doi:10.1080/10618600.2015.1012293
[20] Wickham,H.,《数据分析的拆分-应用-合并策略》,J Stat Softw,40,1,1-29(2011)·doi:10.18637/jss.v040.i01
[21] Wolfe J、Haghighi A、Klein D(2008)针对超大数据集的完全分布式EM。摘自:第25届机器学习国际会议论文集,ICML'08。ACM,纽约,第1184-1191页
[22] 雅武兹,FG;Arslan,O.,拉普拉斯分布线性混合模型(LLMM),Stat Pap,59,1,271-289(2018)·Zbl 1416.62401号 ·文件编号:10.1007/s00362-016-0763-x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。