×

集群上的稀疏回归:SparClur。 (英语) Zbl 1487.90480号

摘要:个性化医学中的预测任务需要结合准确性和可解释性的模型。我们提出了一种整数优化方法,利用预测树中叶片之间的数据分区,构建具有强制协调的稀疏回归模型。我们表明,该方法可以在几秒钟内恢复大规模合成数据中观测值和目标变量之间的真正潜在关系。我们将我们的方法应用于几个现实世界中的医学预测问题,并观察到附加的结构在可解释性方面提供了实质性的提高,同时降低了准确性的成本。

MSC公司:

90立方厘米 整数编程
90 C90 数学规划的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] EJ本杰明;利维,D。;瓦齐里,SM;D'agostino,苏格兰皇家银行;贝朗格,AJ;Wolf,PA,以人群为基础的队列中心房颤动的独立危险因素:Framingham心脏研究,JAMA,271,11840-844(1994)·doi:10.1001/牙买加.1994.03510350050036
[2] Bertsimas,D。;Copenhaver,MS,线性和矩阵回归中稳健化和正则化等价性的表征,欧洲期刊Oper。Res.,270931-942(2018)·兹比尔1403.62040 ·doi:10.1016/j.ejor.2017.03.051
[3] Bertsimas,D.,Dunn,J.:现代优化视角下的机器学习。动态创意(2019)
[4] Bertsimas,D。;Van Parys,B.,《稀疏高维回归:精确可缩放算法和相变》,《Ann.Stat.》,48,1,300-323(2020)·Zbl 1444.62094号 ·doi:10.1214/18-AOS1804
[5] Bertsimas,D。;金·A。;Mazumder,R.,《通过现代优化透镜选择最佳子集》,《Ann.Stat.》,44,2813-852(2016)·Zbl 1335.62115号 ·doi:10.1214/15-AOS1388
[6] Bertsimas,D。;北卡罗来纳州卡卢斯。;韦恩斯坦,AM;Zhuo,YD,使用电子病历进行个性化糖尿病管理,糖尿病护理,40,2,210-217(2017)·doi:10.2337/dc16-0826
[7] Bertsimas,D.、Pauphilet,J.、Van Parys,B.:稀疏分类和相变:离散优化视角(2017)。arXiv预打印arXiv:1710.01352·Zbl 07465779号
[8] Bezanson,J。;Edelman,A。;卡宾斯基,S。;Shah,VB,Julia:数值计算的新方法,SIAM Rev.,59,1,65-98(2017)·兹比尔1356.68030 ·数字对象标识代码:10.1137/141000671
[9] Breiman,L.、Friedman,J.、Stone,C.J.、Olshen,R.A.:分类和回归树。CRC出版社(1984)·Zbl 0541.62042号
[10] Dunn,J.:预测和处方的最佳树。麻省理工学院博士论文(2018)
[11] 邓宁,I。;哈切特,J。;Lubin,M.,Jump:数学优化建模语言,SIAM Rev.,59,2,295-320(2017)·Zbl 1368.90002号 ·doi:10.1137/15M1020575
[12] 马萨诸塞州杜兰;Grossmann,IE,一类混合整数非线性程序的外近似算法,数学。程序。,36, 3, 307-339 (1986) ·Zbl 0619.90052号 ·doi:10.1007/BF02592064
[13] 卡格尔:美国金县的房屋销售。https://www.kaggle.com/harlfoxem/housesalesprediction。访问时间:2020-12-05(2016)
[14] Kapelevich,L.,Zhang,R.:Sparclur/Sparclur.jl:v0.1(2020)。doi:10.5281/zenodo.4308537
[15] Kornblith,S.,贡献者:GLMNet.jl:Julia wrapper for fitting Lasso/ElasticNet GLM models using GLMNet(2013)。https://github.com/JuliaStats/GLMNet.jl
[16] Tibshirani,R.,《通过套索进行回归收缩和选择》,J.R.Stat.Soc.Ser。B(Methodol.),58267-288(1996)·Zbl 0850.62538号
[17] Tikhonov,AN,关于反问题的稳定性,Dokl。阿卡德。诺克SSSR,39,195-198(1943)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。