×

包括二次曲线规划在内的对数二项回归优化求解器的比较。 (英语) Zbl 1505.62364号

小结:相对风险评估是为了评估关联性和影响,因为它们易于解释,例如在流行病学研究中。拟合对数回归模型可以使用估计的回归系数直接推断相对风险。然而,由于必须施加在参数空间上的约束,这些模型的估计是复杂的。本文系统地比较了不同的优化算法,以获得对数回归中回归系数的最大似然估计。我们首先确定在什么条件下最大似然估计是有限的和唯一的,这允许识别和排除有问题的情况。在使用人工数据进行的仿真研究中,我们比较了不同优化器的性能,包括基于增广拉格朗日方法的求解器、包括圆锥优化器在内的内点方法、优化最小化算法、迭代重加权最小二乘和期望最大化算法变体。我们证明了二次曲线优化器由于其可靠性、不需要调整超参数和速度而成为首选。

MSC公司:

62-08 统计问题的计算方法
10层62层 点估计
62J12型 广义线性模型(逻辑模型)
90C25型 凸面编程
90摄氏51度 内部点方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿尔伯特。;JA Anderson,关于逻辑回归模型中最大似然估计的存在性,Biometrika,71,1,1-10(1984)·Zbl 0543.62020号 ·doi:10.1093/biomet/71.1.1
[2] 暴雪,L。;Hosmer,W.,《对数二项回归中的参数估计和拟合优度》,Biom J,48,1,5-22(2006)·Zbl 1442.62274号 ·doi:10.1002/bimj.200410165
[3] 博伊德,S。;Vandenberghe,L.,《凸优化》(2004),纽约:剑桥大学出版社,纽约·Zbl 1058.90049号 ·doi:10.1017/CBO9780511804441
[4] 卡拉菲尔,GC;El Ghaoui,L.,优化模型(2014),剑桥:剑桥大学出版社,剑桥·Zbl 1342.90001号 ·doi:10.1017/CBO9781107279667
[5] Chares PR(2009)涉及幂和指数的结构化凸优化的锥和内点算法。卢万天主教大学博士论文。http://dial.uclouvain.be/pr/boreal/en/object/boreal
[6] Davies,HT;克朗比,IK;Tavakoli,M.,优势比何时会误导?,BMJ(临床研究版),316,7136,989-991(1998)·doi:10.136/bmj.316.7136.989
[7] 德安德拉德,BB;Carabin,H.,《通过对数二项回归估计相对风险》,巴西生物研究所,29,1-15(2011)
[8] 德安德拉德,BB;de Leon Andrade,JM,调整后相对风险的最大似然估计的一些结果,公共统计理论方法,47,23,5750-5769(2018)·Zbl 1508.62179号 ·doi:10.1080/03610926.2017.1402045
[9] De Leeuw J,Heiser W(1977)多维标度校正矩阵算法的收敛性。In:Lingoes J(ed)关系数据的几何表示。数学出版社,安阿伯,第32章,第735-753页。http://deleeuwpdx.net/janspubs/1977/chapters/deleeuw_heiser_C_77.pdf
[10] Domahidi A(2013)嵌入式优化和控制的方法和工具。苏黎世理工大学博士论文。doi:10.3929/ethz-a-010010483
[11] Domahidi A、Chu E、Boyd S(2013)《ECOS:嵌入式系统的SOCP求解器》。在:欧洲控制会议(ECC),第3071-3076页。https://web.stanford.edu/boyd/papers/pdf/ecos-ecc.pdf
[12] 多诺霍,M。;Marschner,I.,logbin:使用对数模型进行相对风险回归的R包,J Stat Softw,86,9,1-22(2018)·doi:10.18637/jss.v086.i09
[13] 菲亚科,AV;McCormick,GP,《非线性规划:序列无约束最小化技术》(1968),纽约:威利出版社·Zbl 0193.18805号
[14] Holcomb WL、Chaiworapongsa T、Luke DA、Burgdorf KD(2001)《风险的奇怪度量:优势比的使用和滥用》。妇产科学98(4)。https://journals.lww.com/greenjournal/Fulltext/2001/10000/An_Add_Measure_of_Risk__Use_and_Misuse_of_the_Adds.28.aspx
[15] 喇叭,RA;Johnson,CR,矩阵分析(2012),剑桥:剑桥大学出版社,剑桥·doi:10.1017/CBO9781139020411
[16] Hornik K、Meyer D、Schwendinger F、Theussl S(2020)《投资回报率:R优化基础设施》。R包版本1.0-0。https://CRAN.R-project.org/package=投资回报率
[17] 亨特博士;Lange,K.,《MM算法教程》,《美国统计》,58,1,30-37(2004)·doi:10.1198/0003130042836
[18] Karmarkar,N.,线性规划的新多项式时间算法,组合数学,4,4,373-395(1984)·兹伯利0557.90065 ·doi:10.1007/BF02579150
[19] Kaufmann,H.,关于量子和序数响应模型中最大似然估计的存在性和唯一性,Metrika,35,1,291-313(1988)·Zbl 0671.62053号 ·doi:10.1007/bf02613318
[20] Konis K(2007)检测二元逻辑回归模型中分离数据的线性规划算法。牛津大学博士论文。https://ora.ox.ac.uk/objects/uuid:8f9ee0d0-d78e-4101-9ab4-f9cbceed2a2a
[21] Konis,K。;Fokianos,K.,安全密度比建模,Stat Probab Lett,79,18,1915-1920(2009)·Zbl 1170.62049号 ·doi:10.1016/j.spl.2009.05.020
[22] Lange,K.,凸规划的自适应屏障方法,方法应用分析,1,4,392-402(1994)·Zbl 0835.90068号
[23] Lange,K.,MM优化算法,Soc Ind Appl Math,101137-19781611974409(2016)·Zbl 1357.90002号
[24] Lumley T、Kronmal R、Ma S(2006)《医学研究中的相对风险回归:模型、对比、估计和算法》。工作文件293,华盛顿大学生物统计学工作文件系列
[25] 罗,J。;张杰。;Sun,H.,使用带约束的对数模型估计相对风险,计算统计,29,5,981-1003(2014)·Zbl 1306.65093号 ·doi:10.1007/s00180-013-0476-8
[26] Madsen K,Nielsen HB,Tingleff O(2004)《约束优化》,第二版
[27] Makhorin A(2011)GNU线性编程工具包参考手册4.47版。网址:http://www.gnu.org/software/glpk
[28] Marschner,IC,glm2:用收敛问题拟合广义线性模型,R J,3,12-15(2011)·doi:10.32614/RJ-2011-012
[29] Marschner,IC,二元结果的相对风险回归:方法和建议,Aust N Z J Stat,57,4,437-462(2015)·Zbl 1373.62383号 ·doi:10.1111/anzs.12131
[30] MOSEK ApS(2017)介绍MOSEK优化套件。8.1版(第27版)。http://docs.mosek.com/8.1/intro/index.html
[31] Nemirovski A(2006)凸优化进展:圆锥规划。摘自:《国际数学家大会论文集》,第413-444页。doi:10.4171/022·Zbl 1135.90379号
[32] Nesterov Y,Nemirovskii A(1994)凸规划中的内点多项式算法。费城工业和应用数学学会SIAM应用数学研究·兹比尔0824.90112
[33] Nocedal,J。;Wright,SJ,《数值优化》(2006),柏林:施普林格出版社,柏林·Zbl 1104.65059号 ·doi:10.1007/978-0-387-40065-5
[34] O’Donoghue B(2015)SCS-(分裂圆锥解算器)。网址:https://github.com/cvxgrp/scs.git
[35] O'Donoghue B,Chu E,Parikh N,Boyd S(2016)通过算子分裂和齐次自对偶嵌入实现二次曲线优化。最优化理论应用杂志1-27。doi:10.1007/s10957-016-0892-3
[36] Ortega JM,Rheinboldt WC(1970)多变量非线性方程的迭代解,第30卷。工业和应用数学学会·Zbl 0241.65046号
[37] R核心团队(2020)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。https://www.R-project.org/
[38] 萨武,A。;刘,Q。;Yasui,Y.,《相对风险和患病率估算》,《Stat Med》,29,22,2269-2281(2010)·doi:10.1002/sim.3989
[39] Serrano SA(2015)非对称锥优化算法和指数锥问题的实现。斯坦福大学博士论文。https://web.stanford.edu/group/SOL/desertations/ThesisAkleAdobe-augmented.pdf
[40] Silvapulle,MJ,关于二项式响应模型的最大似然估计的存在性,J Roy Stat Soc Ser B(Methodol),43,3,310-313(1981)·Zbl 0475.62053号
[41] Theußl,S。;Schwendinger,F。;Hornik,K.,《投资回报率:可扩展的R优化基础设施》,J Stat Softw,94,15,1-64(2020)·doi:10.18637/jss.v094.i15
[42] Varadhan R(2015)阿拉巴马州:约束非线性优化。R包版本2015.3-1。https://CRAN.R-project.org/package=阿拉巴马州
[43] Wächter A(2009)简短教程:90分钟内开始使用Ipopt。收录人:Naumann U、Schenk O、Simon HD、Toledo S(编辑)《组合科学计算》,德国达格斯图尔-莱布尼茨-泽特鲁姆-富尔信息技术学院,德国达格斯图尔,第09061号,达格斯图尔研讨会论文集。http://drops.dagstuhl.de/opus/volltexte/2009/2089
[44] 瓦希特,A。;Biegler,LT,《关于大规模非线性规划中点内滤波线性搜索算法的实现》,《数学程序》,106,1,25-57(2006)·Zbl 1134.90542号 ·doi:10.1007/s10107-004-0559-y
[45] 威廉姆森,T。;Eliasziw,M。;Fick,GH,对数模型:探索失败的收敛,《新兴主题流行病学》,2013年第10期,第14期·doi:10.1186/1742-7622-10-14
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。