×

基于马氏距离的有偏最小二乘支持向量机用于PU学习。 (英语) Zbl 1514.62112号

摘要:在许多领域,正面和负面示例的存在都不令人满意,只有一类示例可用。这种特殊的二进制分类称为PU(积极和未标记)学习。目前,已有许多分类算法被引入到PU学习中,如BLSSVM、BSVM等。然而,所有这些经典方法都是用欧氏距离来衡量的,没有考虑到每个类的相关信息和各种属性的波动。为了反映这一信息,我们提出了一种新的基于马氏距离的最小二乘支持向量机(MD-BLSSVM)分类器,其中根据两类数据的协方差矩阵构造两个马氏距离,以优化超平面。实际上,当协方差矩阵退化为单位矩阵时,MD-BLSSVM具有BLSSVM的特殊情况;(2) 巧妙地进行线性变换后,可以在再生核Hilbert空间中引入优秀的核技术;(3) 通过求解线性方程组,可以简单地得到一个解。总之,MD-BLSSVM适用于许多实际问题,特别是对于两类数据的分布和相关性明显不同的情况。在多个人工和基准数据集上的实验结果表明,MD-BLSSVM不仅具有更快的学习速度,而且比BLSSVM和其他方法具有更好的泛化能力。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)

软件:

UCI-毫升
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] A.藤野。;Ueda,N。;Nagata,M.,对具有不同分布的标记和未标记数据的自适应半监督学习,Knowl。信息系统。,37, 1, 129-154 (2013)
[2] Denis,F.,《从积极的统计查询中学习PAC》,《计算机课堂讲稿》。科学。,1501, 112-126 (1998) ·Zbl 0932.68083号
[3] Muggleton,S.,从正面数据中学习。机器学习归纳逻辑编程,计算机课堂讲稿。科学。,1314, 358-376 (1997)
[4] Yu,H。;Han,J。;Chang,K.C.C.,PEBL:没有负面示例的网页分类,IEEE Trans。知识。数据工程,16,1,70-81(2004)
[5] Vapnik,V.N.,《统计学习理论的本质》(1995年),施普林格出版社:柏林施普林格·Zbl 0833.62008号
[6] M.克里斯托夫。;普莱西斯,D。;Sugiyama,M.,基于分布匹配的类前效应变化下的班级平衡半监督学习,神经网络。,50, 110-119 (2014) ·Zbl 1298.68268号
[7] X.L.Li,B.Liu,《学习使用阳性和未标记数据对文本进行分类》,载于《第18届国际人工智能联合会议论文集》,墨西哥阿卡普尔科,2003年,第587-594页。
[8] Fung,G.P.C。;于建新。;Lu,H.等人。;Yu,P.S.,《无反例文本分类重访》,IEEE Trans。知识。数据工程,18,1,6-20(2006)
[9] M.N.Nguyen,X.L.Li,S.K.Ng,时间序列分类的积极无标记学习,摘自:《国际人工智能联合会议论文集》,IJCAI,2011年,第1421-1426页。
[10] 伊恩科,D。;Pensa,R.G.,分类数据中的积极和未标记学习,神经计算,196113-124(2016)
[11] B.Liu,W.S.Lee,P.S.Yu,et al.文本文档的部分监督分类,载于:《第19届机器学习国际会议论文集》,2002年,第387-394页。
[12] D.Zhang,W.S.Lee,《从正面和未标记示例中学习的简单概率方法》,载于:《第五届英国计算智能研讨会论文集》,英国计算机学会,2005年,第83-87页。
[13] C.Elkan,K.Noto,《仅从正面和未标记数据学习分类器》,载于:《第十四届知识发现和数据挖掘国际会议论文集》,美国内华达州拉斯维加斯,2008年,第213-220页。
[14] Luigi,C。;Charles,E。;Michele,C.,仅从阳性和未标记数据学习基因调控网络,生物信息学,11,1,228-240(2010)
[15] Schkopf,B。;约翰·C·P。;约翰·S。;亚历克斯·J。;罗伯特·C。;威廉姆森,估计高维分布的支持,神经计算。,13, 7, 1443-1471 (2001) ·Zbl 1009.62029号
[16] 朱,F。;叶,N。;于伟(Yu,W.)。;徐,S。;Li,G.B.,一类支持向量机的边界检测和样本缩减,神经计算,123,166-173(2014)
[17] B.Liu,Y.Dai,X.L.Li,W.S.Lee,P.S.Yu,使用阳性和未标记的例子构建文本分类器,载于:第三届IEEE国际数据挖掘会议论文集,美国佛罗里达州墨尔本,2003年,第179-188页。
[18] W.S.Lee,B.Liu,《使用加权逻辑回归学习积极和未标记的示例》,载于:《第20届机器学习国际会议论文集》,美国华盛顿特区,2003年,第448-455页。
[19] Ke,T。;杨,B。;Tan,J.Y。;Jing,L.,在文本分类的正面和未标记示例上构建高性能分类器,(神经网络进展ISNN 2012。神经网络进展ISNN 2012,计算机科学讲稿,第7368卷(2012),187-195
[20] Ke,T。;宋立杰,杨斌。;赵,X.B。;Jing,L.,构建有偏最小二乘支持向量机分类器用于正向和无标记学习,J.Softw。,1494-1502年9月6日(2014年)
[21] Shao,Y.H。;陈伟杰。;Liu,L.M。;邓,纽约,拉普拉斯单位超平面学习积极和未标记的例子,Inform。科学。,314, 152-1687 (2015) ·Zbl 1387.68199号
[22] 周,K。;桂蓉,X。;杨琼。;Yu,Y.,使用话题敏感的积极和未标记示例学习。plsa,IEEE传输。知识。数据工程,146-58(2010)
[23] 邓,纽约。;田永杰。;Zhang,C.H.,《支持向量机:基于优化的理论、算法和扩展》(2013),CRC出版社·Zbl 1278.68011号
[24] Shao,Y.H。;陈伟杰。;邓,纽约,非并行超平面支持向量机用于二进制分类问题,Inform。科学。,263, 22-35 (2014) ·Zbl 1328.68173号
[25] 马哈拉诺比斯,普拉桑塔·钱德拉,《论统计学中的广义距离》,Proc。国家。科学研究所。印度,2,1,49-55(1936)·Zbl 0015.03302号
[26] Maesschalck,R.D。;Jouan-Rimbaud,D。;马萨特,D.L.,《马氏距离》,《化学计量学情报》。实验室系统。,50, 1-18 (2000)
[27] 查塔塔纳西里,R。;Korsrilabutr,T。;Tangchanachaianan,P。;Kijsirikul,B.,《马氏远程学习算法的新内核化框架》,神经计算,73,10-12,1570-1579(2010)
[28] Haasdonk,B。;Pekalska,E.,《使用核马氏距离分类器进行分类》,(《分类、数据分析和知识组织中的数据分析、数据处理和商业智能研究进展》,2010年,第5部分(2010年)),351-361
[29] 黄,K。;Yang,H。;国王一世。;Lyu,M.R.,Maxi-min margin机器学习本地和全球大幅度分类器,IEEE Trans。神经网络。,19260-272(2008年)
[30] 张,C。;聂,F。;Xiang,S.,基于核PCA的学习算法的通用核化框架,神经计算,4,6959-967(2010)
[31] 彭晓杰。;Xu,D.,用于模式识别的双马氏距离支持向量机,Inform。科学。,16, 10, 2551-2564 (2007)
[32] Dariusz Dereniowski,Marek Kubale,平行矩阵的Cholesky因式分解和图的排序,收录于:第五届平行处理和应用数学国际会议,第3019卷,2004年,第985-992页·Zbl 1128.68544号
[33] 苏肯斯,J.A.K。;Vandewalle,J.,最小二乘支持向量机分类器,神经过程。莱特。,9, 3, 293-300 (1999)
[34] Suykens,J.A.K.,分类和非线性建模的最小二乘支持向量机,神经网络。世界,10,1-2,29-47(2000)
[35] 苏肯斯,J.A.K。;Gestel,T.V.公司。;Brabanter,J.D。;摩尔,B.D。;Vandewalle,J.,最小二乘支持向量机(2002),《世界科学:世界科学新加坡》·Zbl 1017.93004号
[36] C.L.Blake,C.J.Merz,UCI机器学习数据库库,1998年。http://www.ics.uci.edu/mlearn/MLRepository.html。
[37] Z.R.Lin,LIBSVM,2016年。网址:http://www.csie.ntu.edu.tw/cjlin/libsvm。
[38] B.Liu,LPU包,2008年。网址:http://www.cs.uic.edu/liub/LPU/LPU-download.html。
[39] 美国药典,1998年。USPS数据库。http://www.cs.nyu.edu/roweis/data.html。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。