×

具有保证的快速贪婪(mathcal{C})界最小化。 (英语) Zbl 1525.68110号

摘要:(mathcal{C})界是一个紧界,它取决于多数票分类器的真实风险,该分类器依赖于投票者的个人素质和成对分歧,并提供了PAC-Bayesian泛化保证。基于这个界,MinCq是一种分类算法,它通过最小化来返回有限投票人集上的稠密分布。CqBoost后来引入并受到boosting的启发,它使用列生成方法在可能无限的投票人集中构建稀疏(mathcal{C})界最优分布。然而,这两种方法都有很高的计算学习时间,因为它们通过求解二次规划来最小化(mathcal{C})界。然而,CqBoost的一个优点是其提供稀疏解决方案的实验能力。在这项工作中,我们解决了加速(mathcal{C})界极小化过程的问题,同时保持解的稀疏性并且不损失精度。我们提出了CB-Boost,这是一种基于贪婪boosting-based-(mathcal{C})-界优化的高效分类算法。深入分析证明了贪婪最小化过程的最优性,并量化了该算法所操作的(mathcal{C})-界的减少。然后根据已有的PAC-Baysian定理得出泛化保证。此外,与MinCq、CqBoost、Adaboost和其他集成方法相比,我们通过实验评估了CB-Boost的三个主要特性的相关性:准确性、稀疏性和计算效率。正如在这些实验中观察到的那样,CB-Boost不仅获得了与现有技术相当的结果,而且还提供了(mathcal{C})界次优权重,计算需求很少,同时保持了CqBoost的稀疏性。

MSC公司:

68T05型 人工智能中的学习和自适应系统
2015年1月62日 贝叶斯推断
62H30型 分类和区分;聚类分析(统计方面)
90 C90 数学规划的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Breiman,L.,打包预测,机器学习,24,2,123-140(1996)·Zbl 0858.68080号
[2] Breiman,L.,《随机森林,机器学习》,45,1,5-32(2001)·Zbl 1007.68152号
[3] Catoni,O.(2007)。PAC-Baysian监督分类:统计学习的热力学。arXiv预打印arXiv:0712.0248·Zbl 1277.62015年
[4] Cortes,C.、Mohri,M.和Syed,U.(2014)。深度提升。摘自:第三十一届机器学习国际会议(ICML)会议记录(2014年)。
[5] Demiriz,A。;贝内特,KP;Shawe-Taylor,J.,通过列生成提升线性规划,机器学习,46,1,225-254(2002)·兹比尔0998.68105
[6] Dua,D.和Graff,C.(2017年)。UCI机器学习库。
[7] Dziugaite,G.K.和Roy,D.M.(2018年)。数据相关的PAC-Bayes通过不同的隐私保护提供了先验信息。摘自:《神经信息处理系统的进展》,第8440-8450页。
[8] 弗伦德,Y。;Schapire,RE,《在线学习的决策理论推广及其在助推中的应用》,《计算机与系统科学杂志》,55,1,119-139(1997)·Zbl 0880.68103号
[9] Friedman,JH,《贪婪函数近似:梯度提升机》,《统计年鉴》,29,5,1189-1232(2001)·Zbl 1043.62034号
[10] Germain,P.、Lacasse,A.、Laviolette,F.和Marchand,M.(2009年)。线性分类器的PAC-Baysian学习。摘自:第26届ICML会议记录,第353-360页。ACM公司。
[11] Germain,P。;拉卡斯,A。;Laviolette,F。;Marchand,M。;Roy,JF,《多数投票的风险界限:从PAC-Baysian分析到学习算法》,《机器学习研究杂志》,16,1787-860(2015)·Zbl 1337.68223号
[12] Lacasse,A.、Laviolette,F.、Marchand,M.、Germain,P.和Usunier,N.(2006年)。PAC-Bayes是多数票风险和Gibbs分类器方差的界。摘自:B.Schölkopf,J.C.Platt,T.Hoffman(编辑)《神经信息处理系统进展》19,第769-776页。麻省理工学院出版社。
[13] Lampert,C.H.、Nickisch,H.和Harmeling,S.(2009年)。学习通过类之间的属性转移来检测看不见的对象类。2009年IEEE计算机视觉和模式识别会议,第951-958页。电气与电子工程师协会。
[14] 柳叶刀,GRG;北卡罗来纳州克里斯蒂亚尼尼。;Bartlett,P。;LE Ghaoui;Jordan,MI,用半定规划学习核矩阵,机器学习研究杂志,5,27-72(2004)·Zbl 1222.68241号
[15] Langford,J.和Shawe-Taylor,J.(2003)。PAC Bayes和利润率。摘自:《神经信息处理系统的进展》,第439-446页。
[16] LeCun,Y.和Cortes,C.(2010年)。MNIST手写数字数据库。
[17] Marchand,M。;Taylor,JS,《集合覆盖机器》,《机器学习研究杂志》,3723-746(2003)·Zbl 1112.68392号
[18] McAllester,DA,一些PAC贝叶斯定理,机器学习,37,3355-363(1999)·Zbl 0945.68157号
[19] McAllester,DA,PAC-Baysian随机模型选择,机器学习,51,1,5-21(2003)·Zbl 1056.68122号
[20] 帕拉多·埃尔南德斯,E。;Ambroladze,A。;肖-泰勒,J。;Sun,S.,具有数据相关先验的PAC Bayes边界,《机器学习研究杂志》,133507-3531(2012)·Zbl 1433.68373号
[21] Roy,J.F.、Marchand,M.和Laviolette,F.(2016)具有PAC-Bayesian泛化保证的列生成边界最小化方法。摘自:A.Gretton,C.C.Robert(编辑)《第19届人工智能和统计国际会议论文集》,机器学习研究论文集,第51卷,第1241-1249页。西班牙加的斯PMLR。http://proceedings.mlr.press/v51/roy16.html。
[22] 夏皮雷,RE;Freund,Y.,《Boosting:基础与算法》(2012),剑桥:麻省理工学院出版社,剑桥·Zbl 1278.68021号
[23] Seeger,M.,PAC-高斯过程分类的贝叶斯泛化误差界,机器学习研究杂志,3,233-269(2002)·Zbl 1088.68745号
[24] 塞尔丁,Y。;塞萨·比安奇,N。;奥尔,P。;Laviolette,F。;Shawe-Taylor,J.,PAC-Bayes-bernstein鞅不等式及其在多武装匪徒中的应用,勘探与开发在线交易研讨会论文集,298-111(2012)
[25] Sonnenburg,S。;Rätsch,G。;Schäfer,C。;Schölkopf,B.,《大规模多核学习》,《机器学习研究杂志》,第7期,第1531-1565页(2006年)·Zbl 1222.90072号
[26] LG Valiant,《可学习理论》,《ACM通信》,第27、11、1134-1142页(1984年)·Zbl 0587.68077号
[27] 朱,J。;Rosset,S。;邹,H。;Hastie,T.,多类adaboost,统计学及其接口(2006)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。