×

基于潜在相关估计的深度低秩矩阵分解用于微视频多标签分类。 (英语) Zbl 1528.62034号

摘要:目前,微视频正在成为各种社交平台上日益流行的用户生成内容(UGC)形式。已经进行了几项研究,以探索微视频的语义和个人在各种任务中的行为,例如场地分类、人气预测和个性化推荐。然而,很少有研究致力于解决微视频多标签分类问题。更重要的是,学习微视频的内在和健壮的特征表示仍然是一个复杂而富有挑战性的问题。在本文中,我们提出了一种用于微视频多标签分类的具有潜在相关估计的深度矩阵分解(DMFLCE)。在DMFLCE中,我们开发了一个受低秩约束的深度矩阵分解组件,以同时学习微视频的低秩表示和潜在属性的内在特征。为了明确显示学习到的潜在属性和标签之间的依赖关系以提高分类性能,我们构造了两个逆协方差估计组件来自动编码与潜在属性和标记相关的模式。在一个公开的大规模微视频数据集上进行的实验表明,与最新的方法相比,我们提出的方法是有效的。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
15A23型 矩阵的因式分解
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 张杰。;聂,L。;王,X。;何,X。;黄,X。;Chua,T.S.,《Shorter-is-better:从微视频中估计场馆类别》,(2016年《ACM多媒体国际会议论文集》),1415-1424
[2] 刘,W。;黄,X。;曹,G。;张杰。;Song,G。;Yang,L.,《Nextvlad、cnn和微视频场馆分类上下文门控联合学习》,IEEE Access,77091-77099(2019)
[3] 景,P。;苏,Y。;聂,L。;白,X。;刘,J。;Wang,M.,用于微视频流行预测的低秩多视图嵌入学习,IEEE知识与数据工程汇刊,30,8,1519-1532(2017)
[4] 陈,J。;宋,X。;聂,L。;王,X。;张,H。;Chua,T.-S.,Micro告诉macro:通过传导性模型预测微视频的流行,(《ACM多媒体国际会议论文集》(2016)),898-907
[5] 魏毅。;郑,Z。;Yu,X。;赵,Z。;朱,L。;Nie,L.,针对微视频的个性化哈希标签建议,(ACM多媒体国际会议(2019)论文集),1446-1454
[6] 陈,J。;彭杰。;齐,L。;陈,G。;Zhang,W.,基于类别兴趣偏好的微视频推荐隐含评级方法,(国际知识科学、工程与管理会议论文集(2019)),371-381
[7] 聂,L。;王,X。;张杰。;何,X。;张,H。;R·洪。;Tian,Q.,《利用外部声音增强微视频理解》,(2017年ACM国际多媒体会议论文集),1192-1200
[8] 谢军。;Zhu,Y。;张,Z。;彭杰。;Yi,J。;胡,Y。;刘,H。;Chen,Z.,一种用于微视频流行预测的多模式变分编解码框架,(国际万维网会议论文集(2020)),2542-2548
[9] 刘,M。;聂,L。;王,X。;田强。;Chen,B.,在线数据组织者:基于结构引导的多模态词典学习的微视频分类,IEEE图像处理学报,28,3,1235-1247(2018)
[10] 魏毅。;王,X。;关,W。;聂,L。;Lin,Z。;Chen,B.,面向微视频理解的神经多模态合作学习,IEEE图像处理汇刊,29,1-14(2020)·Zbl 07585855号
[11] 陈,X。;刘,D。;查,Z.-J。;周,W。;熊,Z。;Li,Y.,微视频点击预测的类别和项目级时间层次关注,(ACM多媒体国际会议论文集(2018)),1146-1153
[12] 刘,S。;陈,Z。;刘,H。;Hu,X.,个性化微视频推荐的用户-视频共同关注网络,国际万维网会议论文集,3020-3026(2019)
[13] 李,Z。;Tang,J.,用于社会图像理解的弱监督深度矩阵分解,IEEE图像处理汇刊,26,1,276-288(2016)·Zbl 1409.94410号
[14] 薛海杰。;戴,X。;张杰。;黄,S。;Chen,J.,推荐系统的深度矩阵分解模型,(国际人工智能联合会议论文集(2017)),3203-3209
[15] 赵,H。;丁,Z。;Fu,Y.,基于深度矩阵分解的多视图聚类,in,(AAAI人工智能会议论文集(2017)),2921-2927
[16] Lee,D.D。;Seung,H.S.,通过非负矩阵分解学习对象的各个部分,《自然》,401,6755,788-791(1999)·Zbl 1369.68285号
[17] 丁·C·H。;Li,T.等人。;Jordan,M.I.,凸矩阵和半非负矩阵分解,IEEE模式分析和机器智能汇刊,32,1,45-55(2008)
[18] Trigeorgis,G。;Bousmalis,K。;Zafeiriou,S。;Schuller,B.W.,用于学习属性表示的深度矩阵分解方法,IEEE模式分析和机器智能学报,39,3,417-429(2016)
[19] 艾哈迈德,E.H。;萨米,E。;El-Beltagy,Samhaa R.,《用于多标签情感检测的上下文集成模型》,《Procedia Computer Science》,142,1,61-71(2018)
[20] N.O.-S.X.Oramas S,Barbieri F,音乐类型分类的多模式深度学习,国际音乐信息检索学会学报1(1)(2018)4-21。
[21] 唐,C。;刘,X。;王,P。;张,C。;李,M。;Wang,L.,自适应超图嵌入半监督多标签图像标注,IEEE多媒体汇刊,21,11,2837-2849(2019)
[22] Boutel,M.R。;罗,J。;沈,X。;Brown,C.M.,学习多标签场景分类,模式识别,37,9,1757-1771(2004)
[23] Fürnkranz,J。;Hüllermier,E。;Mencía,E.L。;Brinker,K.,通过校准标签排名进行多标签分类,机器学习,73,2,133-153(2008)·Zbl 1470.68108号
[24] 齐国杰。;华,X.-S。;Rui,Y。;Tang,J。;梅,T。;张海杰,相关多标签视频注释,(2007年ACM多媒体国际会议论文集),17-26
[25] 里德·J。;普法林格,B。;霍姆斯,G。;Frank,E.,多标签分类的分类器链,机器学习,85,3,333(2011)
[26] Shi,M。;Tang,Y。;Zhu,X.,Mlne:多标签网络嵌入,IEEE神经网络和学习系统汇刊,31,9,3682-3695(2020)
[27] 刘,G。;Lin,Z。;Yan,S。;Sun,J。;Yu,Y。;Ma,Y.,通过低秩表示实现子空间结构的稳健恢复,IEEE模式分析和机器智能汇刊,35,1,171-184(2012)
[28] 李,S。;李凯。;Fu,Y.,《视觉学习的自学低阶编码》,IEEE神经网络和学习系统汇刊,29,3,645-656(2018)
[29] Xu,Y。;方,X。;吴杰。;李,X。;Zhang,D.,通过低秩和稀疏表示的鉴别转移子空间学习,IEEE图像处理学报,25,2,850-863(2015)·Zbl 1408.94876号
[30] 刘,G。;Lin,Z。;Yu,Y.,基于低秩表示的稳健子空间分割。,年(2010年国际机器学习会议论文集),663-670
[31] Torralba,A.,《物体检测的背景启动》,《国际计算机视觉杂志》,53,2,169-191(2003)·Zbl 1477.68431号
[32] 郑S。;程,M.-M。;沃雷尔,J。;斯特吉斯,P。;维尼特,V。;罗瑟,C。;Torr,P.H.,带对象和属性的稠密语义图像分割,(IEEE计算机视觉和模式识别会议论文集(2014)),3214-3221
[33] S.Bengio,J.Dean,D.Erhan,E.Ie,Q.Le,A.Rabinovich,J.Shlens,Y.Singer,《使用网络共现统计改善图像分类》,arXiv预印本arXiv:1312.5697(2013)。
[34] 莫迪里·阿萨里,S。;Roshan Zamir,A。;Shah,M.,《使用语义概念共现进行视频分类》,in,(IEEE计算机视觉和模式识别会议论文集(2014)),2529-2536
[35] 江,Y.-G。;吴,Z。;Wang,J。;薛,X。;Chang,S.-F.,利用正则化深度神经网络挖掘视频分类中的特征和类关系,IEEE模式分析和机器智能汇刊,40,2,352-364(2017)
[36] 蒋玉刚。;戴奇。;Wang,J。;恩戈,C.-W。;薛,X。;Chang,S.-F.,《大规模基于上下文的图像和视频注释的快速语义扩散》,IEEE图像处理汇刊,21,6,3080-3091(2012)·Zbl 1373.94190号
[37] Mensink,T。;Gavves,E。;Snoek,C.G.,Costa:零快照分类的共现统计,(IEEE计算机视觉和模式识别会议论文集(2014)),2441-2448
[38] Zhang,Y。;Yeung,D.-Y.,《多任务学习中学习任务关系的凸公式》,in,(《人工智能不确定性会议论文集》(2010)),733-742
[39] 蔡J.-F。;坎迪斯,E.J。;Shen,Z.,矩阵补全的奇异值阈值算法,SIAM优化杂志,20,41956-1982(2010)·Zbl 1201.90155号
[40] 塞格迪,C。;Vanhoucke,V。;洛夫,S。;Shlens,J。;Wojna,Z.,《重新思考计算机视觉的初始架构》,in,(IEEE计算机视觉和模式识别会议论文集(2016)),2818-2826
[41] 张,M.-L。;Zhou,Z.-H.,Ml-knn:多标签学习的惰性学习方法,模式识别,40,7,2038-2048(2007)·Zbl 1111.68629号
[42] Tran,D。;Boudev,L。;弗格斯,R。;托雷萨尼,L。;Paluri,M.,《利用三维卷积网络学习时空特征》(IEEE国际计算机视觉会议论文集(2015)),4489-4497
[43] Yeh,C.-K。;Wu,W.C。;Ko,W.-J。;Wang,Y.-C.F.,学习多标签分类的深层潜在空间,(AAAI人工智能会议论文集(2017)),2838-2844
[44] 李,S。;Fu,Y.,具有低秩约束的学习鲁棒和判别子空间,IEEE神经网络和学习系统汇刊,27,112160-2173(2015)
[45] 刘,G。;Yan,S.,子空间分割和特征提取的潜在低阶表示,(IEEE国际计算机视觉会议论文集(2011)),1615-1622
[46] Chang,C.-C。;Lin,C.-J.,Libsvm:支持向量机库,ACM智能系统与技术汇刊,2,3,1-27(2011)
[47] 张敏玲,V.R。;Peña,JoséM.,多标签朴素贝叶斯分类的特征选择,信息科学,1793218-3229(2009)·Zbl 1193.68219号
[48] Zhu,Y。;郭敬通(Kwok,J.T.)。;Zhou,Z.,具有全球和本地标签相关性的多标签学习,IEEE知识与数据工程汇刊,30,6,1081-1094(2018)
[49] Sun,L。;Kudo,M。;Kimura,K.,一种基于可扩展聚类的局部多标签分类方法,(欧洲人工智能会议论文集(2016)),261-268
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。