×

用于解耦学习的动态辅助软标签。 (英语) Zbl 07751310号

摘要:数据集中的长尾分布是深度学习的主要挑战之一。卷积神经网络在识别样本较少的类时性能较差。针对这个问题,已经证明将特征学习阶段和分类器学习阶段分离可以有效地提高模型的性能,这就是解耦学习。我们通过提出一种动态辅助软标签(DaSL)方法,使用软标签来提高解耦学习框架的性能。具体来说,我们设计了一个专用的辅助网络来为两个不同的训练阶段生成辅助软标签。在特征学习阶段,它有助于学习类内方差较小的特征,在分类器学习阶段,有助于缓解模型预测的过度自信。我们还引入了一种用于特征学习的特征级提取方法,并通过多尺度特征融合改进了一般特征的学习。我们在三个长尾识别基准数据集上进行了广泛的实验,以证明我们的DaSL的有效性。

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 布达,M。;Maki,A。;Mazurowski,M.A.,卷积神经网络中类不平衡问题的系统研究,神经网络,106,249-259(2018)
[2] Byrd,J。;Lipton,Z.C.,深度学习中重要性加权的效果是什么?,(Chaudhuri,K.;Salakhuttinov,R.,《2019年国际机器学习大会》,2019年6月9日至15日,美国加利福尼亚州长滩。《2019年国际机器学习大会》,2019年6月9日至15日,美国加利福尼亚州长滩,机器学习研究院刊,第97卷(2019),PMLR),872-881
[3] 曹,K。;魏,C。;A.盖登。;北卡罗来纳州阿雷奇加。;Ma,T.,《学习具有标签分布感知边际损失的不平衡数据集》,(Wallach,H.M.;Larochelle,H.;Beygelzimer,A.;d'Alché-Buc,F.;Fox,E.B.;Garnett,R.,Neurips 2019年12月8日至14日,加拿大不列颠哥伦比亚省温哥华(2019年),1565-1576
[4] 查拉,N.V。;鲍耶,K.W。;洛杉矶霍尔。;Kegelmeyer,W.P.,SMOTE:人工智能研究杂志,321-357(2002)·Zbl 0994.68128号
[5] Chou,H。;Chang,S。;潘,J。;魏伟(Wei,W.)。;Juan,D.,Remix:Rebalanced mixup,(Bartoli,A.;Fusiello,A.,《计算机视觉-ECCV 2020研讨会》,英国格拉斯哥,2020年8月23日至28日,会议记录,第六部分。《计算机视觉–ECCV 2020研讨会》,英国格拉斯哥,2020年8月23-28日,会议录,第六部,计算机科学讲稿,第12540卷(2020),斯普林格),95-110
[6] 楚,P。;卞,X。;刘,S。;Ling,H.,长尾数据的特征空间增强,(Vedaldi,A.;Bischof,H.;Brox,T.;Frahm,J.,Eccv 2020,英国格拉斯哥,2020年8月23日至28日,会议记录,第二十九部分。Eccv 2020,英国格拉斯哥夫,2020年八月23日至二十八日,会议录,第二十X部分,计算机科学讲义,第12374卷(2020),施普林格),694-710
[7] 楚,P。;卞,X。;刘,S。;Ling,H.,长尾数据的特征空间增强,(Vedaldi,A.;Bischof,H.;Brox,T.;Frahm,J.,Eccv 2020,英国格拉斯哥,2020年8月23日至28日,会议记录,第二十九部分。Eccv 2020,英国格拉斯哥夫,2020年八月23日至二十八日,会议录,第二十X部分,计算机科学讲义,第12374卷(2020),施普林格),694-710
[8] 崔,Y。;贾,M。;Lin,T。;Song,Y。;Belongie,S.J.,基于有效样本数的分类平衡损失,(IEEE计算机视觉和模式识别会议,CVPR 2019,美国加利福尼亚州长滩,2019年6月16-20日(2019),计算机视觉基金会),9268-9277
[9] 崔,Y。;Song,Y。;Sun,C。;A.霍华德。;Belongie,S.J.,《大规模细粒度分类和特定领域的迁移学习》,(CVPR 2018,美国犹他州盐湖城,2018年6月18日至22日(2018),IEEE计算机学会),4109-4118
[10] Dong,Q。;龚,S。;朱,X.,《不平衡深度学习的课堂纠偏硬挖掘》(Iccv 2017,意大利威尼斯,2017年10月22-29日(2017),IEEE计算机学会),1869-1878
[11] Furlanello,T。;利普顿,Z.C。;Tschannen先生。;Itti,L。;Anandkumar,A.,Born-reach神经网络,(Dy,J.G.;Krause,A.,Icml 2018,StockholmsmäSsan,瑞典斯德哥尔摩,2018年7月10-15日。Icml 2018,StockholmsmäSsan,瑞典斯德哥尔摩,2018年7月10日至15日,机器学习研究论文集,第80卷(2018),PMLR,1602-1611
[12] 古普塔,A。;多拉,P。;Girshick,R.B.,LVIS:用于大型词汇实例分割的数据集,(IEEE计算机视觉和模式识别会议,2019年CVPR,美国加利福尼亚州长滩,2019(2019)年6月16日至20日,计算机视觉基金会),5356-5364
[13] He,H。;Garcia,E.A.,从不平衡数据中学习,IEEE知识与数据工程汇刊,21,9,1263-1284(2009)
[14] 何毅。;吴杰。;Wei,X.,提取长尾识别的虚拟示例(2021),CoRR 2103.15042arXiv:2103.15042
[15] 辛顿,G.E。;葡萄酒,O。;Dean,J.,《在神经网络中提取知识》(2015),CoRR 1503.02531arXiv:1503.02531
[16] Jamal,医学硕士。;布朗,M。;Yang,M。;Wang,L。;Gong,B.,从领域适应的角度重新思考基于类的长尾视觉识别方法,(Cvpr 2020,西雅图,华盛顿州,美国,2020年6月13日至19日(2020年),IEEE),7607-7616
[17] 贾普科维奇,N。;Stephen,S.,《阶级失衡问题:一项系统研究》,《情报数据分析》,6,5429-449(2002)·兹比尔1085.68628
[18] Kang,B。;谢S。;罗尔巴赫,M。;严,Z。;A.戈多。;Feng,J.,长尾识别的解耦表示和分类器,(Iclr 2020,埃塞俄比亚亚的斯亚贝巴,2020年4月26日至30日(2020),OpenReview.net)
[19] Kim,J。;Jeong,J。;Shin,J.,M2m:通过主次翻译实现的不平衡分类,(Cvpr 2020,美国华盛顿州西雅图,2020年6月13日至19日(2020年),IEEE),13893-13902
[20] Kim,K。;吉,B。;Yoon,D。;Hwang,S.,《自我知识蒸馏:更好概括的简单方法》(2020),CoRR 2006.12000arXiv:2006.12000
[21] Lee,H。;Lee,H。;纳·D。;Kim,S。;帕克,M。;Yang,E.,《学会平衡:不平衡和分布外任务的贝叶斯元学习》(Iclr 2020,埃塞俄比亚亚的斯亚贝巴,2020年4月26日至30日(2020))
[22] 李,S。;龚,K。;Liu,C.H。;Wang,Y。;乔·F。;Cheng,X.,Metasaug:长尾视觉识别的元语义增强(2021),CoRR 2103.12579arXiv:2103.12579
[23] Li,B。;刘,Y。;Wang,X.,梯度协调单级探测器,(Aaai 2019,美国夏威夷火奴鲁鲁,2019年1月27日至2月1日(2019),Aaai出版社),8577-8584
[24] 李·T。;Wang,L。;Wu,G.,长尾视觉识别蒸馏的自我监督(2021),CoRR abs/2109.0407arXiv:2109.04075
[25] Lin,T。;多尔,P。;Girshick,R.B。;He,K。;哈里哈兰,B。;Belongie,S.J.,《用于物体检测的特征金字塔网络》(Cvpr 2017,夏威夷州火奴鲁鲁,美国,2017年7月21日至26日(2017),IEEE计算机学会),936-944
[26] Lin,T。;戈亚尔,P。;Girshick,R.B。;He,K。;Dollár,P.,稠密目标检测的焦点损失,(2017年国际计算机会议,意大利威尼斯,2017年10月22-29日(2017年),IEEE计算机学会),2999-3007
[27] Lin,T.-Y。;戈亚尔,P。;Girshick,R.B。;He,K。;Dollár,P.,密集目标检测的焦点丢失,IEEE模式分析和机器智能汇刊,42,2,318-327(2020)
[28] Lin,T。;Maire,M。;Belongie,S.J。;海斯,J。;佩罗纳,P。;Ramanan,D.,Microsoft COCO:common objects in context,(Fleet,D.J.;Pajdla,T.;Schiele,B.;Tuytelaars,T.,ECCV 2014,苏黎世,瑞士,2014年9月6日至12日,会议记录,第五部分,计算机科学讲义,卷8693(2014),施普林格),740-755
[29] 刘,B。;李,H。;Kang,H。;Hua,G。;Vasconcelos,N.,Gistnet:长尾识别的几何结构传输网络(2021),CoRR abs/2105.00131arXiv:2105.0131
[30] 刘,Z。;苗,Z。;詹,X。;Wang,J。;龚,B。;Yu,S.X.,《开放世界中的大尺度长尾识别》(Cvpr 2019,美国加利福尼亚州长滩,2019年6月16日至20日(2019年),计算机视觉基金会/IEEE),2537-2546
[31] 刘,S。;齐,L。;秦,H。;史J。;Jia,J.,路径聚合网络,例如分段,(Cvpr 2018,美国犹他州盐湖城,2018年6月18日至22日(2018),IEEE计算机协会),8759-8768
[32] 刘杰。;孙,Y。;Han,C。;窦,Z。;Li,W.,《长尾数据的深度表征学习:可学习的嵌入增强视角》(Cvpr 2020,西雅图,美国华盛顿州,2020年6月13日至19日,IEEE),2967-2976
[33] 穆勒,R。;Kornblith,S。;Hinton,G.E.,标签平滑何时起作用?,(Wallach,H.M.;Larochelle,H.;Beygelzimer,A.;d'Alché-Buc,F.;Fox,E.B.;Garnett,R.,Neurips 2019年12月8日至14日,加拿大不列颠哥伦比亚省温哥华(2019)),4696-4705
[34] Ren,J。;Yu,C。;Sheng,S。;马,X。;赵,H。;Yi,S.,用于长尾视觉识别的平衡元软件,(Neurips 2020,2020年12月6日至12日,虚拟(2020))
[35] 俄勒冈州Russakovsky。;邓,J。;苏,H。;克劳斯,J。;Satheesh,S。;Ma,S.,Imagenet大规模视觉识别挑战,(115(2015)),211-252
[36] 沈,L。;林,Z。;黄,Q.,用于深度卷积神经网络有效学习的中继反向传播,(Leibe,B.;Matas,J.;Sebe,N。;Welling,M.,Eccv 2016,荷兰阿姆斯特丹,2016年10月11-14日,诉讼,第七部分。Eccv 2016,荷兰阿姆斯特丹,2016年10月11日至14日,会议记录,第七部分,计算机科学讲稿,第9911卷(2016),施普林格出版社,467-482
[37] 沈,Z。;刘,Z。;徐,D。;陈,Z。;Cheng,K。;Savvides,M.,标签平滑真的与知识提炼不兼容吗:一项实证研究(2021),CoRR 2104.00676arXiv:2140.00676
[38] 舒,J。;谢奇。;Yi,L。;赵(Q.Zhao)。;周,S。;Xu,Z.,Meta-weight-net:学习样本权重的显式映射,(Neurips 2019,2019年12月8-14日,加拿大不列颠哥伦比亚省温哥华(2019)),1917-1928
[39] 塞格迪,C。;Vanhoucke,V。;洛夫,S。;Shlens,J。;Wojna,Z.,《重新思考计算机视觉的初始架构》(CVPR 2016,美国内华达州拉斯维加斯,2016年6月27日至30日(2016),IEEE计算机学会),2818-2826
[40] Tan,M。;庞,R。;Le,Q.V.,Efficientdet:可扩展和高效的目标检测,(Cvpr 2020,西雅图,华盛顿州,美国,2020年6月13日至19日(2020),IEEE),10778-10787
[41] Tan,J。;王,C。;Li,B。;李强。;欧阳,W。;Yin,C.,长尾物体识别的均衡损失,(Cvpr 2020,西雅图,华盛顿州,美国,2020年6月13-19日(2020),IEEE),11659-11668
[42] Tang,K。;Huang,J。;Zhang,H.,通过保持良好势头和消除不良势头因果效应进行长期分类,(Larochelle,H.;Ranzato,M.;Hadsell,R.;Balcan,M.);Lin,H,Neurips 2020,2020年12月6日至12日,虚拟(2020)
[43] Wang,T。;李毅。;Kang,B。;李,J。;Liew,J.H。;Tang,S.,(Vedaldi,A.;Bischof,H.;Brox,T.;Frahm,J.,《魔鬼在分类中:长尾实例分割的简单框架》,《计算机科学讲义》,第12359卷(2020),施普林格),728-744
[44] Wang,Y。;拉马南,D。;Hebert,M.,《学习建模尾巴》(Guyon,I.;von Luxburg,U.;Bengio,S.;Wallach,H.M.;Fergus,R.;Vishwanathan,S.V.N.;Garnett,R.,Neurips,2017年12月4日至9日,美国加利福尼亚州长滩(2017)),7029-7039
[45] Wang,J。;张伟。;臧,Y。;曹毅。;彭,J。;Gong,T.,《长尾实例分段的Seesaw损失》(2020),CoRR abs/2008.10032arXiv:2008.10032
[46] 向,L。;丁,G。;Han,J.,向多位专家学习:长尾分类的自定步知识提炼,(Vedaldi,A.;Bischof,H.;Brox,T.;Frahm,J.,Eccv 2020,英国格拉斯哥,2020年8月23日至28日,会议记录,第五部分。Eccv 2020,英国格拉斯哥,2020年8月23日至28日,会议记录,第五部分,计算机科学讲义,第12350卷(2020),施普林格), 247-263
[47] 尹,X。;Yu,X。;Sohn,K。;刘,X。;Chandraker,M.,《利用低分辨率数据进行人脸识别的特征转移学习》(Cvpr 2019,美国加州长滩,2019年6月16日至20日(2019年),计算机视觉基金会),5704-5713
[48] 尹,X。;Yu,X。;Sohn,K。;刘,X。;Chandraker,M.,《利用低分辨率数据进行人脸识别的特征转移学习》(Cvpr 2019,美国加州长滩,2019年6月16日至20日(2019年),计算机视觉基金会),5704-5713
[49] Zagoruyko,S。;Komodakis,N.,《更加关注注意力:通过注意力转移提高卷积神经网络的性能》(Iclr 2017,法国土伦,2017年4月24日至26日,会议跟踪记录(2017),OpenReview.net)
[50] 张,X。;方,Z。;温,Y。;李,Z。;Qiao,Y.,用长尾训练数据进行深度人脸识别的范围损失,(2017年10月22日至29日,意大利威尼斯,2017年(2017年),IEEE计算机学会),5419-5428
[51] 张,C。;江,P。;侯,Q。;Wei,Y。;韩,Q。;Li,Z.,深入研究标签平滑(2020),CoRR 2011.12562arXiv:2011.12562
[52] 张,S。;李,Z。;Yan,S。;何,X。;Sun,J.,《分布对齐:长尾视觉识别的统一框架》,(IEEE计算机视觉和模式识别会议,CVPR 2021,虚拟,2021年6月19日至25日(2021年),计算机视觉基金会/IEEE),2361-2370
[53] Zhang,Y。;魏,X。;周,B。;Wu,J.,利用深度卷积神经网络进行长尾视觉识别的技巧包,(Aaai(2021))
[54] 钟,Z。;崔,J。;刘,S。;Jia,J.,改进长尾识别的校准,(IEEE计算机视觉和模式识别会议,CVPR 2021,虚拟,2021年6月19-25日(2021),计算机视觉基金会/IEEE),16489-16498,URLhttps://openaccess.thecvf.com/content/CVPR2021/html/Zhong_Improving_Calibration_for_Long-Tailed_Recognition_CVPR_2021_paper.html
[55] 周,B。;崔,Q。;魏,X。;Chen,Z.,BBN:具有长尾视觉识别累积学习的双边分支网络,(Cvpr 2020,美国西雅图,2020年6月13日至19日(2020),IEEE),9716-9725
[56] 周,B。;Lapedriza,A。;科斯拉,A。;奥利瓦,A。;Torralba,A.,《位置:用于场景识别的1000万图像数据库》,(IEEE模式分析和机器智能汇刊,40(2018)),1452-1464
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。