×

在机器学习中具有证明的最优性的聚合和迭代分解算法。 (英语) Zbl 1454.68127号

摘要:我们提出了一种基于聚类的迭代算法来解决机器学习中的某些优化问题,在该算法中,我们首先聚合原始数据,解决聚合数据上的问题,然后在后续步骤中逐步分解聚合数据。我们将该算法应用于常见的机器学习问题,如最小绝对偏差回归问题、支持向量机和半监督支持向量机。我们推导了特定于模型的数据聚合和分解过程。我们还展示了每次迭代中近似解的最优性、收敛性和最优性缺口。提供了计算研究。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62G08号 非参数回归和分位数回归
62H30型 分类和区分;聚类分析(统计方面)
90立方 非线性规划
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Balas,E.(1965年)。通过聚合解决大规模运输问题。运筹学,13(1),82-93·Zbl 0137.38502号 ·doi:10.1287/opre.13.1.82
[2] Bärmann,A.、Liers,F.、Martin,A.,Merkert,M.、Thurner,C.和Weninger,D.(2013)。通过迭代聚合解决网络设计问题。www.mso.math.fau.de/uploads/tx_sibibtex/Aggregation-Preprint.pdf·Zbl 1327.90347号
[3] Bennett,K.P.和Demiriz,A.(1999)。半监督支持向量机。1998年神经信息处理系统进展会议论文集II(第368-374页)。
[4] Chang,C.-C.和Lin,C.-J.(2011)。LIBSVM:支持向量机库。ACM智能系统与技术汇刊,2011年2月1日至27日。网址:http://www.csie.ntu.edu.tw/cjlin/libsvm。
[5] Chapelle,O.、Schölkopf,B.和Zien,A.(2010年)。半监督学习。剑桥:麻省理工学院出版社。
[6] Chapelle,O.、Sindhwani,V.和Keerthi,S.(2007年)。分支和绑定为半监督支持向量机。神经信息处理系统进展(第217-224页)·Zbl 1225.68158号
[7] Chapelle,O.、Sindhwani,V.和Keerthi,S.(2008)。半监督支持向量机的优化技术。机器学习研究杂志,9203-233·Zbl 1225.68158号
[8] Chvátal,V.和Hammer,P.(1977年)。整数规划中不等式的聚合。离散数学年鉴,1145-162·Zbl 0384.90091号 ·doi:10.1016/S0167-5060(08)70731-3
[9] Doppa,J.R.、Yu,J.、Tadepalli,P.和Getoor,L.(2010)。基于机会约束的链路预测学习算法。在2010年欧洲会议关于数据库中的机器学习和知识发现的会议记录:第一部分,ECML PKDD’10,(第344-360页)。柏林:斯普林格·Zbl 1280.68189号
[10] Evans,J.R.(1983年)。一类多商品运输问题的网络分解/聚合过程。网络,13(2),197-205·doi:10.1002/net.3230130205
[11] Evgeniou,T.和Pontil,M.(2002年)。支持具有集群的向量机,用于使用非常大的数据集进行训练。《人工智能的方法和应用》,计算机科学系列讲座笔记第2308卷(第346-354页)·Zbl 1065.68600号
[12] Fan,R.-E.,Chang,K.-W.,Hsieh,C.-J.,Wang,X.-R.和Lin,C.-J.(2008)。LIBLINEAR:大型线性分类库。机器学习研究杂志,91871-1874·Zbl 1225.68175号
[13] 奥利桑那州哈利夫乔德Storöy,S.(1990年)。整数规划问题中的聚合和分解。运筹学,38(4),619-623·Zbl 0724.90045号 ·doi:10.1287/opre.38.4.619
[14] Koenker,R.(2013)。quantreg:分位数回归。R包版本,5,05。
[15] Li,Y.-F.,&Zhou,Z.-H.(2015)。让未标记的数据永不受损。IEEE模式分析和机器智能汇刊,37(1),175-188·doi:10.1109/TPAMI.2014.2299812
[16] Litvinchev,I.和Tsurkov,V.(2003)。大规模优化中的聚合(第83卷)。柏林:斯普林格·Zbl 1029.90042号
[17] Mendelssohn,R.(1980)。技术说明——改进了聚合线性程序的边界。运筹学,28(6),1450-1453·Zbl 0447.90054号 ·doi:10.1287/opre.28.6.1450
[18] Mercer,J.(1909)。正负型函数及其与积分方程理论的联系。《皇家学会哲学学报》A,209415-446·doi:10.1098/rsta.1909.0016
[19] Nath,J.S.、Bhattacharyya,C.和Murty,M.N.(2006年)。基于聚类的大幅度分类:一种使用socp公式的可扩展方法。《第十二届ACM SIGKDD知识发现和数据挖掘国际会议论文集》,KDD’06,(第674-679页)。纽约州纽约市:ACM·Zbl 0724.90045号
[20] Pedregosa,F.、Varoqueux,G.、Gramfort,A.、Michel,V.、Thirion,B.、Grisel,O.等人(2011年)。Scikit-learn:Python中的机器学习。机器学习研究杂志,12,2825-2830·Zbl 1280.68189号
[21] R核心团队。(2014). R: 一种用于统计计算的语言和环境。维也纳:R统计计算基金会·兹比尔062690057
[22] Rogers,D.F.、Plante,R.D.、Wong,R.T.和Evans,J.R.(1991)。优化中的聚合和分解技术和方法。运筹学,39(4),553-582·Zbl 0729.90738号 ·doi:10.1287/opre.39.4.553
[23] Schölkopf,B.、Smola,A.和Müller,K.-R(1998)。非线性分量分析是一个核心特征值问题。神经计算,10(5),1299-1319·doi:10.1162/08997669830017467
[24] Shetty,C.和Taylor,R.W.(1987年)。通过聚合求解大规模线性规划。计算机与运筹学,14(5),385-393·兹比尔062690057 ·doi:10.1016/0305-0548(87)90035-9
[25] Vakhutinsky,I.、Dudkin,L.和Ryvkin,A.(1979年)。迭代聚合——解决大规模问题的新方法。《计量经济学》,47(4),821-841·Zbl 0429.90037号 ·doi:10.2307/1914133
[26] Wang,J.、Wonka,P.和Ye,J.(2014)。通过精确数据缩减缩放svm和最小绝对偏差。第31届机器学习国际会议论文集(第523-531页)。
[27] Yang,X.,Song,Q.,&Cao,A.(2005)。用于数据分类的加权支持向量机。2005年,IEEE神经网络国际联合会议,2005年。IJCNN’05会议记录(第2卷,第859-864页),2005年7月·Zbl 0429.90037号
[28] Yu,H.、Yang,J.和Han,J.(2003)。使用带有层次聚类的支持向量机对大型数据集进行分类。第九届ACM SIGKDD国际知识发现和数据挖掘会议记录(第306-315页)·兹比尔062690057
[29] Yu,H.、Yang,J.、Han,J.和Li,X.(2005)。使用分层集群索引使SVM可扩展到大型数据集。数据挖掘和知识发现,11(3),295-321·doi:10.1007/s10618-005-0005-7
[30] Zhang,T.、Ramakrishnan,R.和Livny,M.(1996)。Birch:一种用于超大数据库的高效数据聚类方法。1996年ACM SIGMOD国际数据管理会议记录,SIGMOD'96,(第103-114页)。纽约州纽约市:ACM。
[31] Zipkin,P.(1997)。线性规划中的聚合。耶鲁大学博士论文·Zbl 0429.90037号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。