×

兹马思-数学第一资源

树组合优化。(英语) Zbl 1457.90098
摘要:树集成模型,如随机森林和增强树,是应用机器学习和业务分析中应用最广泛和实际成功的预测模型之一。虽然这类模型已被用于基于外生、不可控制的自变量进行预测,但它们越来越多地被用于预测自变量是可控的,同时也是决策变量。本文研究了树集成优化问题:给定一个用可控自变量预测某个因变量的树集成,如何设置这些变量使预测值最大化?我们将整数问题表述为混合优化问题。我们从理论上检验了我们公式的强度,提供了一个具有近似质量边界的近似公式的层次结构,并利用问题的结构开发了两个大规模的求解方法,一个基于Benders分解,另一个基于迭代生成树分裂约束。我们在真实的数据集上测试了我们的方法,包括两个药物设计和定制定价的案例研究,结果表明我们的方法可以有效地解决大规模实例的接近或完全最优,并优于启发式方法得到的解。
电子伴侣可在https://doi.org/10.1287/opre.2019.1928.

理学硕士:
90摄氏度 混合整数规划
90度90度 数学规划的应用
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Atomwise Inc.(2017)Atomwise Better medicines faster.阿托姆维斯公司(Atomwise Better medicines faster)。2017年5月27日访问,http://www.atomwise.com.Google学者
[2] Bajari P,Nekipelov D,Ryan SP,Yang M(2015)需求估计的机器学习方法。阿默尔。经济。版次。105(5):481-485.Crossref,谷歌学者
[3] Bertsimas D,Dunn J(2017)最优分类树。机器学习。106(7):1039-1082.Crossref,谷歌学者·Zbl 1455.68159
[4] Bertsimas D,Kallus N(2016)《观测数据驱动优化预测方法的能力和限制》。工作论文,麻省理工学院,剑桥,谷歌学者
[5] Bertsimas D,King A(2015)或论坛:线性回归的算法方法。操作。物件。64(1):2-16.Link,谷歌学者·Zbl 1338.90272
[6] Bertsimas D,MišićVV(2019)精确首选产品线优化。操作。物件。67(3):651-670.Link,谷歌学者·Zbl 1444.90071
[7] Bertsimas D,Lulli G,Odoni A(2011)《大规模空中交通流量管理的整数优化方法》。操作。物件。59(1):211-227.Link,谷歌学者·Zbl 1218.90119
[8] Bertsimas D,O'Hair A,Relyea S,Silberholz J(2016)《癌症联合化疗方案设计的分析方法》。管理科学。62(5):1511-1531.Link,谷歌学者
[9] Besbes O,Phillips R,Zeevi A(2010)测试需求模型的有效性:运营视角。制造服务运营商。管理12(1):162-183.Link,谷歌学者
[10] Bezanson J,Karpinski S,Shah VB,Edelman A(2012)Julia:技术计算的快速动态语言。工作论文,麻省理工学院,剑桥,谷歌学者
[11] Biau G,Scornet E(2016)随机森林导游。试验25(2):197-227.Crossref,谷歌学者·Zbl 1402.62133
[12] Biau G,Devroye L,Lugosi G(2008)随机森林和其他平均分类器的一致性。J、 机器学习。物件。9月9日:2015-2033.谷歌学者·Zbl 1225.62081
[13] Breiman L(1996)装袋预测因子。机器学习。24(2):123-140.Crossref,谷歌学者·Zbl 0858.68080
[14] 布雷曼L(2001)随机森林。机器学习。45(1):5-32.Crossref,谷歌学者·Zbl 1007.68152号
[15] Breiman L、Friedman J、Stone CJ、Olshen RA(1984年)分类和回归树(CRC出版社,博卡拉顿,佛罗里达州)。谷歌学者
[16] Chen T,Guestrin C(2016)XGBoost:一个可扩展的树提升系统。程序。第22届ACM SIGKDD Internat。Conf.知识发现数据挖掘(ACM,纽约),785-794.谷歌学者
[17] 《2017年促进线性规划》(The promotion of The linear Improvement of The linear Companization of MC-Perang,2017年),班克朗·科昂(Kisa-Perang)对线性规划的影响。操作。物件。65(2):446-468.Link,谷歌学者·Zbl 1366.90140
[18] Cortez P,Cerdeira A,Almeida F,Matos T,Reis J(2009)通过从物理化学特性中挖掘数据来建模葡萄酒偏好。决策支持系统47(4):547-553.Crossref,谷歌学者
[19] cramay(1993)非线性0-1最大化问题的凹扩张。数学。编程61(1-3):53-60。交叉引用,谷歌学者·Zbl 0796.90040
[20] Díaz Uriarte R,De Andres SA(2006)使用随机森林对微阵列数据进行基因选择和分类。BMC生物信息学7(1):第3条。交叉引用,谷歌学者
[21] Fernández Delgado M,Cernadas E,Barro S,Amorim D(2014)我们是否需要数百个分类器来解决现实世界的分类问题。J、 机器学习。物件。15(1):3133-3181.谷歌学者·Zbl 1319.62005
[22] Ferreira KJ,Lee BHA,Simchi Levi D(2015)《在线零售商分析:需求预测和价格优化》。制造服务运营商。管理18(1):69-88.Link,谷歌学者
[23] Gurobi Optimization,Inc.(2015)Gurobi Optimizer参考手册。http://www.gurobi.com.Google学者
[24] hotk(1998)构造决策森林的随机子空间方法。IEEE传输。肛门模式。机器智能20(8):832-844.Crossref,谷歌学者
[25] Huuskonen J(2000)基于分子拓扑的不同有机化合物水溶性的估计。J、 化学信息。计算机。科学。40(3):773-777.Crossref,谷歌学者
[26] Kallus N(2017)使用观测数据进行个性化递归划分。程序。第34期实习生。机器学习,第70卷,1789-1798。谷歌学者
[27] Kansy M,Senner F,Gubernator K(1998)物理化学高通量筛选:描述被动吸收过程的平行人工膜渗透试验。J、 药物化学41(7):1007-1010.Crossref,谷歌学者
[28] Kuhn M,Johnson K(2014)AppliedPredictiveModeling:“应用预测建模”的函数和数据集。R软件包版本1.1-6。https://cran.r-project.org/web/packages/AppliedPredictiveModeling/index.html.Google学者
[29] Lemmens A,Croux C(2006)装袋和提升分类树以预测流失。J、 营销资源。43(2):276-286.Crossref,谷歌学者
[30] Liaw A,Wiener M(2002)randomForest分类和回归。R新闻2(3):18-22.谷歌学者
[31] Lichman M(2013)UCI机器学习知识库。机器学习和智能系统中心。访问日期:2019年10月9日,http://archive.ics.uci.edu/ml.Google学者
[32] Lubin M,Dunning I(2015)使用Julia进行运筹学计算。通知J.Comput。27(2):238-248.Link,谷歌学者·Zbl 1331.90001号
[33] Ma J,Sheridan RP,Liaw A,Dahl GE,Svetnik V(2015)作为定量结构-活性关系方法的深度神经网络。J、 化学信息。建模55(2):263-274.Crossref,谷歌学者
[34] MišićVV(2016)大规模随机优化问题的数据、模型和决策。未发表博士论文,麻省理工学院,剑桥。谷歌学者
[35] Montgomery AL(1997)利用超市扫描仪数据创建微观营销定价策略。市场科学。16(4):315-337.Link,谷歌学者
[36] Quinlan JR(1986)决策树的归纳法。机器学习. 1(1):81-106.Crossref,谷歌学者
[37] Ridgeway G(2006)gbm:广义增强回归模型。R包版本1.5-7.Google Scholar
[38] Scannell JW,Blanckley A,Boldon H,Warrington B(2012)诊断药物研发效率下降。国家版税。药物发现11(3):191-200.Crossref,谷歌学者
[39] Schapire RE,Freund Y(2012年)Boosting:基础和算法(麻省理工学院出版社,剑桥,马萨诸塞州)。谷歌学者
[40] Scornet E,Biau G,Vert J-P(2015)随机森林的一致性。安。统计学家。43(4):1716-1741.Crossref,谷歌学者·Zbl 1317.62028
[41] Svetnik V,Liaw A,Tong C,Culberson JC,Sheridan RP,Feuston BP(2003)《随机森林:用于复合分类和qsar建模的分类和回归工具》。J、 化学信息。计算机。科学。谷歌参考文献43-1946年:学者
[42] Tetko IV,Tanchuk VY,Kasheva TN,Villa AEP(2001)使用e状态指数估算化合物的水溶性。J、 化学信息。计算机。科学。41(6):1488-1493.Crossref,谷歌学者
[43] 瓦里安HR(2014)《大数据:计量经济学的新技巧》。J、 经济。透视图。28(2):3-27.Crossref,谷歌学者
[44] Vielma JP(2015)混合整数线性规划公式化技术。暹罗版次。57(1):3-57.Crossref,谷歌学者·Zbl 1338.90277号
[45] Willett P,Barnard JM,Downs GM(1998)化学相似性搜索。J、 化学信息。计算机。科学。38(6):983-996.Crossref,谷歌学者
[46] Wright MN,Ziegler A(2017)ranger:在C++和R中快速实现高维数据的随机森林。J、 统计学家。软件77(1):1-17.Crossref,谷歌学者
[47] Yeh I-C(1998)高性能混凝土强度的人工神经网络建模。水泥混凝土住宅。28(12):1797-1808。交叉引用,
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。