×

多类别复合最小二乘分类器。 (英语) Zbl 07260249号

摘要:分类是一种非常有用的信息提取统计工具。特别是,多类别分类在各种应用中很常见。虽然二进制分类问题得到了大量研究,但对多类别问题的扩展却少得多。鉴于现代统计问题的复杂性和数量不断增加,需要有能够处理高维和大量类的问题的多类别分类器。此外,多类别分类器必须具有良好的理论性质。在文献中,存在几种不同版本的同步多类别支持向量机(SVM)。然而,对于大规模问题,特别是对于具有大量类的问题,SVM的计算可能很困难。此外,SVM不能直接产生类概率估计。在本文中,我们提出了一种新的高效的多类别复合最小二乘分类器(CLS分类器),该分类器利用了一种新型的复合平方损失函数。所提出的CLS分类器具有以下几个重要优点:对具有大量类的问题进行有效计算,渐近一致性,处理高维数据的能力,以及简单的条件类概率估计。我们的模拟和实际例子证明了该方法的竞争性能。

MSC公司:

62至XX 统计
68倍 计算机科学
PDF格式BibTeX公司 XML格式引用
全文: DOI程序 链接

参考文献:

[1] K.V.Mardia、J.M.Bibby和J.T.Kent,多变量>负γPj(x)(fj)+(1负γ)(1负Pj(x))(负fj)。这与(20)相矛盾。《分析》,伦敦,纽约,学术出版社,1979年。因此,当argmaxjPj(x)=1时,我们得出anyj=1的ef1>fj。这个
[2] B.E.Boser、I.M.Guyon和V.N.Vapnik,《最佳边缘分类器的训练完成证明算法》,《第五届美国计算机学会计算学习理论研讨会论文集》,宾夕法尼亚州匹兹堡,美国计算机学会出版社,1992年,第144-152页。
[3] V.Vapnik,《统计学习理论》,威利出版社,1998年·Zbl 0935.62007号
[4] L.Breiman,《随机森林》,Mach Learn 45(2001),第5C32页·Zbl 1007.68152号
[5] T.Hastie、R.Tibshirani和J.H.Friedman,《统计学习的要素》,纽约,斯普林格出版社,2003年·Zbl 0973.62007号
[6] N.Cristianini和J.Shawe Taylor,《=γkj=1{k−1−fj(x)}2Pj(x)+(1−γ)kl=1支持向量机导论》,剑桥,剑桥大学
[7] K.Crammer和Y.Singer,《算法实现论》,出版社,2000年。
[8] Y.Lee、Y.Lin和G.Wahba,多类别支持向量机,理论及其在分类中的应用·Zbl 1089.62511号
[9] J.A.K.Suykens和J.Vandewalle,最小二乘支持·Zbl 0958.93042号
[10] G.Fung和O.L.Mangasarian,近端支持向量机分类器,收录于《KDD-2001:知识》·Zbl 1101.68758号
[11] 唐永华,张海华,多类近端支持向量机,《计算机图形统计杂志》第15期(2006年),第339-355页。
[12] 刘彦,多类支持向量机的Fisher一致性,第十一届国际人工智能与统计会议,波多黎各圣胡安,2007,289-296。
[13] Y.Liu和X.Shen,多类别ψ-学习,美国统计协会期刊101(2006),500-509·Zbl 1119.62341号
[14] G.Kimeldorf和G.Wahba,关于切比雪夫样条函数的一些结果,《数学分析应用杂志》33(1971),82-95·Zbl 0201.39702号
[15] T.Golub、D.Slonim、P.Tamayo、C.Huard、M.Gaasenbeek、J.Mesirov、H.Coller、M.Loh、J.Downing和M.Caligiuri,
[16] S.Dudoit、J.Fridly和T.P.Speed,《利用基因表达数据对肿瘤进行分类的鉴别方法比较》,《美国统计学会杂志》97(2002),77-87·Zbl 1073.62576号
[17] J.Zhu、S.Rosset、T.Hastie和R.Tibshirani,1-范数支持向量机,神经信息处理系统(2004),第16页·Zbl 1222.68213号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。