×

利用编码理论进行分类:一种基于LDPC的多类到二进制分解策略。 (英语) Zbl 1427.68270号

摘要:多类分类的一个强大策略是创建一个分类器集成,将多色性分解为几个二分法。设计多类到二进制分解方案时的核心问题是编码矩阵和解码算法的定义。在本研究中,我们提出了一种新的基于低密度校验码的分类系统,这是一种非常有效的二进制分组码。其主要思想是利用代码的代数特性来生成编码矩阵的码字,并定义两种解码方法,使我们能够检测和恢复二分法产生的可能错误或拒绝。基于基准数据集的实验表明,与最新的分解策略相比,该方法在分类性能方面具有统计显著的改进。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
94B05型 线性码(一般理论)
94B35码 解码

软件:

ECOC公司;SVM灯
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Allwein,E.L。;夏皮雷,R.E。;Singer,Y.,《将多类还原为二进制:边缘分类器的统一方法》,J.Mach。学习。第113-141号决议(2000年)·兹比尔1013.68175
[2] Alpaydin,E。;Mayoraz,E.,《从数据中学习纠错输出代码》,第九届国际人工神经网络会议(ICANN’99)(Conf.Publ.No.470),第2卷,743-748(1999),IET
[3] 阿马尔,B。;荣誉学士。;寇,Y。;徐,J。;Lin,S.,基于平衡不完全块设计的低密度校验码的构造,IEEE Trans。通知。理论。,50,61257-1269(2004年)·Zbl 1247.94056号
[4] Bagheri,医学硕士。;高奇。;Escalera,S.,用于改进纠错输出编码的基于遗传的子空间分析方法,模式记录。,46, 10, 2830-2839 (2013)
[5] Bautista,M.á。;Escalera,S。;巴罗,X。;Pujol,O.,关于ECOC兼容遗传算法的设计,Pattern Recog。,47, 2, 865-884 (2014)
[6] Bautista,M.á。;Escalera,S。;巴罗,X。;Radeva,P。;维特里,J。;Pujol,O.,纠错输出码的最小设计,模式记录。莱特。,33, 6, 693-702 (2012)
[7] Burshtein,D.,《使用翻转算法对常规LDPC码进行纠错》,IEEE Trans。通知。理论。,54, 2, 517-530 (2008) ·Zbl 1304.94118号
[8] 克拉默,K。;Singer,Y.,《关于多类问题输出码的可学习性和设计》,马赫。学习。,47, 2-3, 201-233 (2002) ·Zbl 1012.68155号
[9] Demšar,J.,多数据集上分类器的统计比较,J.Mach。学习。第7,1-30号决议(2006年)·Zbl 1222.68184号
[10] Dietterich,T.G。;Bakiri,G.,《通过纠错输出代码解决多类学习问题》,J.Artif。智力。第263-286号决议(1995年)·Zbl 0900.68358号
[11] Escalera,S。;普约尔,O。;Radeva,P.,Boosted marks of contextual descriptors and forest-ECOC:一种新的框架,用于检测和分类杂乱场景中的对象,Pattern Recog。莱特。,28, 13, 1759-1768 (2007)
[12] Escalera,S。;普约尔,O。;Radeva,P.,纠错输出码稀疏设计中三元码的可分性,模式记录。莱特。,30, 3, 285-297 (2009)
[13] 埃斯卡莱拉,S。;普约尔,O。;Radeva,P.,纠错输出代码库,J.Mach。学习。第11661-664号决议(2010年)
[14] Escalera,S。;普约尔,O。;Radeva,P.,《关于三值纠错输出码的解码过程》,IEEE Trans。模式分析。机器。智力。,32, 1, 120-134 (2010)
[15] Escalera,S。;税务,D.M.J。;普约尔,O。;Radeva,P。;Duin,R.P.W.,纠错输出码的子类问题相关设计,IEEE Trans。模式分析。机器。智力。,30, 6, 1041-1054 (2008)
[16] 弗里德曼,M.,《(M)排名问题重要性替代测试的比较》,《数学年鉴》。《统计》,第11卷,第86-92页(1940年)
[17] 加拉尔,M。;费尔南德斯,A。;Tartas,E.B。;苏拉·H·B。;Herrera,F.,《多类问题中二进制分类器集成方法概述:一对一和一对所有方案的实验研究》,模式识别。,44, 8, 1761-1776 (2011)
[18] 加拉尔,M。;费尔南德斯,A。;Tartas,E.B。;索拉,H.B。;Herrera,F.,《一对一策略的动态分类器选择:避免非胜任分类器》,模式记录。,46, 12, 3412-3424 (2013)
[19] Gallager,R.G.,《低密度奇偶校验码》(1963),麻省理工学院出版社·Zbl 0156.40701号
[20] 北卡罗来纳州加西亚·佩德拉哈斯。;Fyfe,C.,多类问题的进化输出代码,IEEE Trans。进化。计算。,12, 1, 93-106 (2008)
[21] 哈斯蒂,T。;Tibshirani,R.,《两两耦合分类》(Jordan,M.I.;Kearns,M.J.;Solla,S.A.,《神经信息处理系统进展》,第10卷(1998),麻省理工学院出版社),507-513
[22] Hatami,N.,基于序列代码收缩的精简ECOC集成,专家系统。申请。,39, 1, 936-947 (2012)
[23] Holm,S.,一个简单的顺序拒绝多重测试程序,Scand。《J Stat.》,第6卷,第65-70页(1979年)·Zbl 0402.62058号
[24] Joachims,T.,使大规模SVM学习实用化,(Schlkopf,B.;Burges,C.;Smola,A.,核方法支持向量学习进展(1999),麻省理工学院出版社:麻省理工学院出版社,马萨诸塞州剑桥),41-56
[25] Klautau,A。;Jevtic,N。;Orlitsky,A.,《应用于全对多类支持向量机的最近邻纠错输出码》,J.Mach。学习。第4号决议,1-15(2003年)·Zbl 1084.68653号
[26] 寇,Y。;Lin,S。;Fossorier,M.,《基于有限几何的低密度校验码:重新发现和新结果》,IEEE Trans。通知。理论。,47, 7, 2711-2736 (2001) ·Zbl 1015.94015号
[27] Kschichang,F.R。;弗雷,B.J。;Loeliger,H.A.,因子图和和积算法,IEEE Trans。信息理论。,47, 2, 498-519 (2001) ·Zbl 0998.68234号
[28] Kuncheva,L.I.,《使用多样性措施在分类器集合中生成纠错输出代码》,模式识别。莱特。,26, 1, 83-90 (2005)
[29] M.Lichman,加州大学欧文分校信息与计算机科学学院UCI机器学习库,2013年<http://archive.ics.uci.edu/mlM.Lichman,加州大学欧文分校信息与计算机科学学院UCI机器学习库,2013年<http://archive.ics.uci.edu/ml
[30] 鲁比,M。;Mitzenmacher,M。;Shokrollahi,医学硕士。;Spielman,D.A.,《高效擦除校正码》,IEEE Trans。通知。理论。,47, 2, 569-584 (2001) ·Zbl 1019.94032号
[31] 麦凯,D.J.C.,基于极稀疏矩阵的良好纠错码,IEEE Trans。通知。理论。,45, 2, 399-431 (1999) ·Zbl 0946.94030号
[32] Marrocco,C.公司。;西蒙,P。;Tortorella,F.,《用于改进ECOC系统中识别性能的编码理论工具》,(Zhou,Z.;Roli,F.;Kittler,J.,《多分类器系统》,《计算机科学讲义》,第7872卷(2013),Springer),201-211
[33] 马拉科,C。;Tortorella,F.,《通过LDPC码在ECOC系统中恢复比特错误》,第22届国际模式识别会议(ICPR’14),瑞典斯德哥尔摩,2014年8月24-28日,1454-1459(2014)
[34] Moreira,J.C。;Farrell,P.G.,《差错控制编码要点》(2006),John Wiley&Sons:John Willey&Sons Chichester
[35] Nilsson,N.J.,《学习机器:可训练模式分类系统的基础》(1965),麦格劳-希尔出版社,纽约·Zbl 0132.12005号
[36] Passerini,A。;庞蒂尔,M。;Frasconi,P.,《内核机器纠错输出代码的新结果》,IEEE Trans。神经网络。,15, 1, 45-54 (2004)
[37] Pietraszek,T.,《使用ROC分析优化弃权分类器》,马赫。学习。,68, 2, 137-169 (2007) ·Zbl 1470.62091号
[38] Pishro-Nik,H。;Fekri,F.,《关于二进制擦除信道上低密度校验码的解码》,IEEE Trans。通知。理论。,50, 3, 439-454 (2006) ·Zbl 1288.94114号
[39] 普约尔,O。;Escalera,S。;Radeva,P.,用于纠错输出代码的增量节点嵌入技术,模式记录。,41, 2, 713-725 (2008) ·Zbl 1131.68516号
[40] 普约尔,O。;Radeva,P。;Vitriá,J.,判别ECOC:纠错输出码的应用相关设计的启发式方法。,IEEE传输。模式分析。机器。智力。,28, 6, 1007-1012 (2006)
[41] 理查德森·T·J。;Urbanke,R.,《现代编码理论》(2008),剑桥大学出版社·Zbl 1188.94001号
[42] 里夫金,R。;Klautau,A.,为一对所有分类辩护,J.Mach。学习。第5101-141号决议(2004年)·Zbl 1222.68287号
[43] 罗查,A。;Goldenstein,S.K.,《二进制的多类:扩展一对所有、一对一和基于ECOC的方法》,IEEE Trans。神经网络。学习。系统。,25289-302(2014)
[44] Shokrollahi,A.,《计算机科学的理论方面》,175-197(2002),Springer-Verrag纽约公司:Springer-Verlag纽约公司,美国纽约州纽约市·Zbl 0989.00013号
[45] 西蒙,P。;马拉科,C。;Tortorella,F.,《利用系统知识改进ECOC拒绝规则》,ICPR,4340-4343(2010),IEEE
[46] 西蒙,P。;Marrocco,C.公司。;Tortorella,F.,ECOC分类系统拒绝规则的设计,模式记录。,45, 2, 863-875 (2012)
[47] Tang,H。;徐,J。;寇,Y。;Lin,S。;Abdel-Ghaffar,K.,《关于gallager和循环低密度校验码的代数构造》,IEEE Trans。通知。理论。,50, 6, 1269-1279 (2004) ·Zbl 1287.94121号
[48] Tanner,R.M.,《低复杂度代码的递归方法》,IEEE Trans。通知。理论。,27, 5, 533-547 (1981) ·Zbl 0474.94029号
[49] 塔皮亚,E。;布拉西奥,P。;Angelone,L.,递归ECOC分类,模式记录。莱特。,31, 3, 210-215 (2010)
[50] Utschick,W。;Weichselberger,W.,多类学习问题中输出代码的随机组织,神经计算。,13, 5, 1065-1102 (2001) ·Zbl 0983.68159号
[51] 温迪特,T。;Ghaderi,R.,《多类学习问题的编码和解码策略》,Inform。融合,4,1,11-21(2003)
[52] Zhang,X.,通过权重优化和基于分层聚类方法的启发式三值纠错输出代码,IEEE Trans。网络。,45, 2, 289-301 (2015)
[53] 钟,G。;Liu,C.,基于纠错输出码的集成特征提取,模式记录。,461091-1100(2013年)·兹比尔1255.68145
[54] 周,J。;彭,H。;Suen,C.Y.,多类分类的数据驱动分解,模式记录。,41, 67-76 (2008) ·Zbl 1122.68578号
[55] 兹亚布洛夫,V.V。;Pinsker,M.S.,在具有擦除的信道中传输的低密度码的解码复杂性,问题。通知。传输。,10, 1, 10-21 (1974) ·Zbl 0326.94011号
[56] 兹亚布洛夫,V.V。;Pinsker,M.S.,Gallager低密度码纠错复杂度的估计,Probl。信息。Transm公司。,11, 1, 18-28 (1975) ·Zbl 0358.94017号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。