×

面向可统计证明的几何3D人体姿势恢复。 (英语) 兹比尔1492.68140

本文考虑了从单个图像中恢复三维姿态和关键点的问题。这个问题通常可能是不适定的,但如果给定3D点可以表示为一些已知形状的线性组合的先验知识,则可能不是这样。有了这样的先验知识,并从压缩感知中得到启发,本文使用凸L1正则化或非凸正则化对优化问题进行了统计分析。分析表明,相关算法以较高的概率减少了每次迭代的恢复误差。然后,本文进行了实验,验证了恢复算法的收敛速度,并对人体姿态恢复进行了真实数据实验,并进一步扩展了目前流行的展开神经网络的非凸正则化子。总之,本文对三维姿态恢复问题的理论和实践都做出了有趣的贡献。

MSC公司:

68单位10 图像处理的计算方法
68T07型 人工神经网络与深度学习
68单位05 计算机图形;计算几何(数字和算法方面)
90C26型 非凸规划,全局优化
90 C90 数学规划的应用
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] MOCAP:卡内基梅隆大学运动捕捉数据库,http://mocap.cs.cmu.edu。
[2] M.Andriluka、L.Pishchulin、P.Gehler和B.Schiele,《2D人体姿势估计:新基准和最新分析》,摘自《IEEE计算机视觉和模式识别会议论文集》,IEEE,2014年,第3686-3693页。
[3] F.Bogo、A.Kanazawa、C.Lassner、P.Gehler、J.Romero和M.J.Black,《保持SMPL:从单个图像自动估计3D人体姿势和形状》,《欧洲计算机视觉会议》,Springer,2016年,第561-578页。
[4] S.Boyd、N.Parikh、E.Chu、B.Peleato和J.Eckstein,通过乘数交替方向方法进行分布式优化和统计学习,Found。趋势马赫数。学习。,3(2011年),第1-122页·兹比尔1229.90122
[5] P.Buöhlmann和S.van de Geer,《高维数据统计:方法、理论和应用》,Springer Ser。统计人员。,施普林格,海德堡,2011年·Zbl 1273.62015年
[6] E.J.Candès,《受限等距特性及其对压缩传感的影响》,C.R.Math。阿卡德。科学。巴黎,346(2008),第589-592页·Zbl 1153.94002号
[7] E.J.Candès、J.Romberg和T.Tao,《鲁棒不确定性原理:从高度不完整的频率信息精确重建信号》,IEEE Trans。通知。《理论》,52(2006),第489-509页·Zbl 1231.94017号
[8] E.J.Candès和M.B.Wakin,压缩采样简介,IEEE信号处理。Mag.,25(2008),第21-30页。
[9] J.Chen、J.Zhou和J.Ye,《整合低阶和群解析结构以实现稳健的多任务学习》,载《第17届ACM SIGKDD国际知识发现和数据挖掘会议论文集》,ACM,2011年,第42-50页。
[10] X.Chen、J.Liu、Z.Wang和W.Yin,未展开ISTA的理论线性收敛及其实际权重和阈值,《神经信息处理系统进展》,2018,第9061-9071页。
[11] X.Chu、W.Ouyang、H.Li和X.Wang,用于姿势估计的结构化特征学习,《IEEE计算机视觉和模式识别会议论文集》,2016年,第4715-4723页。
[12] T.F.Cootes、C.J.Taylor、D.H.Cooper和J.Graham,《主动形状模型及其训练和应用》,计算。视觉。图像下划线。,61(1995),第38-59页。
[13] Y.Du、Y.Wong、Y.Liu、F.Han、Y.Gui、Z.Wang、M.Kankanhalli和W.Geng,《使用单目图像序列和高度标记的无标记三维人体运动捕捉》,欧洲计算机视觉会议,Springer,2016年,第20-36页。
[14] H.Gao、F.Nie、W.Cai和H.Huang,鲁棒封顶范数非负矩阵分解:封顶范数NMF,载于第24届美国计算机学会信息与知识管理国际会议论文集,美国计算机学会,2015,第871-880页。
[15] P.Gong,J.Ye和C.-S.Zhang,多阶段多任务特征学习,《神经信息处理系统进展》,2012年,第1988-1996页。
[16] K.Gregor和Y.LeCun,学习稀疏编码的快速近似,第27届机器学习国际会议论文集,ICML 2010年,2010年,第399-406页。
[17] L.Han和Y.Zhang,降低等级的多阶段多任务学习,载《第三十届AAAI人工智能会议论文集》,AAAI,2016年,第1638-1644页。
[18] R.Hartley和A.Zisserman,《计算机视觉中的多视图几何》,剑桥大学出版社,2003年·Zbl 0956.68149号
[19] Y.He,R.Yan,K.Fraggiadaki,and S.-I.Yu,外极变压器,《IEEE/CVF计算机视觉和模式识别会议论文集》,2020年,第7779-7788页。
[20] M.Hejrati和D.Ramanan,《分析杂乱图像中的3D物体》,《神经信息处理系统进展》,2012年,第593-601页。
[21] J.R.Hershey、J.L.Roux和F.Weninger,《深度展开:新型深度建筑的基于模型的灵感》,预印本,https://arxiv.org/abs/1409.2574, 2014.
[22] 胡永华,张德良,叶杰,李晓霞,何晓霞,通过截断核范数正则化快速准确地完成矩阵,IEEE Trans。模式分析。马赫。智力。,35(2013),第2117-2130页。
[23] C.Ionescu、D.Papava、V.Olaru和C.Sminchisescu,Human3.6M:自然环境中三维人体传感的大规模数据集和预测方法,IEEE Trans。模式分析。马赫。智力。,36(2014),第1325-1339页。
[24] K.Iskakov、E.Burkov、V.Lempitsky和Y.Malkov,人类姿势的可学习三角测量,《IEEE计算机视觉国际会议论文集》,IEEE,2019年,第7718-7727页。
[25] W.Jiang,F.Nie,和H.Huang,《使用封顶l1规范的稳健词典学习》,第24届国际人工智能会议论文集,2015年,第3590-3596页。
[26] M.Journeáe、Y.Nesterov、P.Richtaárik和R.Sepulchre,稀疏主成分分析的广义幂法,J.Mach。学习。第11号决议(2010年),第517-553页·Zbl 1242.62048号
[27] Y.Kim、H.Choi和H.-S.Oh,《平滑剪裁高维绝对偏差》,J.Amer。统计师。协会,103(2008),第1665-1673页·Zbl 1286.62062号
[28] S.Li、W.Zhang和A.B.Chan,基于深度网络的最大边缘结构化学习用于三维人体姿势估计,《IEEE计算机视觉国际会议论文集》,2015年,第2848-2856页。
[29] T.-Y.Lin、M.Maire、S.Belongie、J.Hays、P.Perona、D.Ramanan、P.Dollaír和C.L.Zitnick,《微软COCO:上下文中的通用对象》,摘自《欧洲计算机视觉会议,计算机课堂讲稿》。科学。8693,施普林格,查姆,2014年,第740-755页。
[30] J.Martinez、R.Hossain、J.Romero和J.J.Little,《3D人体姿势估计的简单而有效的基线》,《2017年IEEE计算机视觉国际会议论文集》,2017年,第2640-2649页。
[31] V.Monga、Y.Li和Y.C.Eldar,《算法展开:信号和图像处理的可解释高效深度学习》,预印本,https://arxiv.org/abs/1912.10557, 2019.
[32] A.Newell、K.Yang和J.Deng,用于人体姿势估计的堆积沙漏网络,2016年欧洲计算机视觉会议,计算机课堂讲稿。科学。9912,Springer,Cham,2016年,第483-499页。
[33] N.Parikh和S.P.Boyd,发现近似算法。趋势优化。,1(2014年),第127-239页。
[34] S.Park、J.Hwang和N.Kwak,《利用卷积神经网络和2D姿势信息进行3D人体姿势估计》,2016年欧洲计算机视觉会议,《计算讲义》。科学。9912,施普林格,商会,第156-169页。
[35] G.Pavlakos、X.Zhou和K.Danilidis,三维人体姿势估计的顺序深度监督,预印本,https://arxiv.org/abs/1805.04095, 2018.
[36] G.Pavlakos、X.Zhou、K.G.Derpanis和K.Danilidis,单图像3D人体姿势的粗略到精细体积预测,载于2017年IEEE计算机视觉和模式识别会议(CVPR)论文集,IEEE,2017,第1263-1272页。
[37] L.Pishchulin、E.Insafutdinov、S.Tang、B.Andres、M.Andriluka、P.V.Gehler和B.Schiele,《深度切割:多人姿势估计的联合子集划分和标记》,摘自《IEEE计算机视觉和模式识别会议论文集》,IEEE,2016年,第4929-4937页。
[38] H.Qiu,C.Wang,J.Wang,N.Wang和W.Zeng,用于三维人体姿势估计的交叉视图融合,《IEEE计算机视觉国际会议论文集》,IEEE,2019年,第4342-4351页。
[39] V.Ramakrishna、T.Kanade和Y.Sheikh,《从2D图像地标重建3D人体姿势》,欧洲计算机视觉会议,施普林格,商会,2012年,第573-586页。
[40] Q.Sun、S.Xiang和J.Ye,基于上限范数的稳健主成分分析,载《第19届ACM SIGKDD国际知识发现和数据挖掘会议论文集》,ACM,2013年,第311-319页。
[41] X.Sun,B.Xiao,F.Wei,S.Liang,Y.Wei,整体人体姿势回归,《欧洲计算机视觉会议论文集》,2018年,第529-545页。
[42] R.Szeliski,《计算机视觉:算法和应用》,施普林格出版社,伦敦,2010年·Zbl 1219.68009号
[43] M.Tang、F.Nie和R.Jain,Capped(lp)-用于照片聚类的范数图嵌入,载《2016年ACM多媒体国际会议论文集》,ACM,2016年,第431-435页。
[44] B.Tekin、A.Rozantsev、V.Lepetit和P.Fua,从运动补偿序列直接预测3D身体姿势,《IEEE计算机视觉和模式识别会议论文集》,IEEE,2016年,第991-1000页。
[45] M.J.Wainwright,《高维统计:非共鸣观点》,剑桥。序列号。统计概率。数学。48,剑桥大学出版社,剑桥,2019年·Zbl 1457.62011年
[46] C.Wang、Y.Wang、Z.Lin、A.L.Yuille和W.Gao,从单个图像稳健估计3D人体姿势,《IEEE计算机视觉和模式识别会议论文集》,IEEE,2014年,第2361-2368页。
[47] S.-E.Wei、V.Ramakrishna、T.Kanade和Y.Sheikh,卷积姿势机器,《IEEE计算机视觉和模式识别会议论文集》,IEEE,2016年,第4724-4732页。
[48] J.Wu、T.Xue、J.J.Lim、Y.Tian、J.B.Tenenbaum、A.Torralba和W.T.Freeman,《单幅图像3D解释器网络》,2016年欧洲计算机视觉会议,查姆施普林格,2016年,第365-382页。
[49] D.Zhang、Y.Hu、J.Ye、X.Li和X.He,通过截断核规范正则化完成矩阵,《2012年IEEE计算机视觉和模式识别会议论文集》,IEEE,2012年,第2192-2199页。
[50] 张涛,稀疏正则化的多级凸松弛分析,J.Mach。学习。第11号决议(2010年),第1081-1107页·Zbl 1242.68262号
[51] T.Zhang,用于特征选择的多级凸松弛,伯努利,19(2013),第2277-2293页·Zbl 1359.62293号
[52] L.Zhao、X.Peng、Y.Tian、M.Kapadia和D.N.Metaxas,三维人体姿势回归的语义图卷积网络,《IEEE计算机视觉和模式识别会议论文集》,IEEE,2019年,第3425-3435页。
[53] X.Zhou,X.Sun,W.Zhang,S.Liang,Y.Wei,深度运动姿势回归,欧洲计算机视觉会议,Springer,Cham,2016年,第186-201页。
[54] X.Zhou、M.Zhu、S.Leonardos和K.Danilidis,三维形状估计的稀疏表示:凸松弛方法,IEEE Trans。模式分析。马赫。智力。,39(2017),第1648-1661页。
[55] X.Zhou、M.Zhu、S.Leonardos、K.G.Derpanis和K.Danilidis,《稀疏满足深度:单目视频中的3D人体姿势估计》,《IEEE计算机视觉和模式识别会议论文集》,IEEE,2016年,第4966-4975页。
[56] X.Zhou、M.Zhu、G.Pavlakos、S.Leonardos、K.G.Derpanis和K.Danilidis,《MonoCap:使用CNN结合几何先验的单目人体运动捕捉》,IEEE Trans。模式分析。马赫。智力。,41(2019年),第901-914页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。