文件Zbl 1423.62120-zbMATH打开

来自SIFT类描述符的随机图像模型。（英语） Zbl 1423.62120号

SIAM J.成像科学。 11，第4号，2305-2338（2018）.

摘要：提取局部特征是计算机视觉中许多算法的第一步。关键点和局部特征的选择通常由给定计算机视觉任务的性能标准的优化驱动，这有时会使提取的内容难以理解。在本文中，我们建议从重建的角度检查局部图像描述符的内容。为此，基于尺度不变特征变换（SIFT）提供的关键点和描述子，我们提出了两个随机模型来探索从给定的SIFT描述子中可以获得的图像集。这两个模型都被定义为广义泊松问题的解，它们结合了不同尺度上的梯度信息。第一个模型包括根据由梯度方向的局部直方图约束的最大熵分布（在尺度0处）对方向场进行采样。第二种模型是在多个尺度上对梯度方向的局部直方图进行简单重采样。我们表明，这两个模型都允许卷积表达式，这些表达式允许我们计算模型统计信息（例如，平均值、方差）。此外，在实验部分，我们表明这些模型能够恢复许多图像结构，而不需要任何外部数据库。最后，我们从重建质量的角度比较了其他几个感兴趣点的选择，这证实了SIFT关键点相对于更简单的备选方案的最佳性。

MSC公司：

62M40型	随机字段；图像分析
65D18天	计算机图形、图像分析和计算几何的数值方面
68单位10	图像处理的计算方法
94A08级	信息与通信理论中的图像处理（压缩、重建等）

关键词：

图像合成;随机图像模型;从特征重建;SIFT公司;泊松编辑;最大熵分布;指数模型

软件：

霍格尔斯;AlexNet公司;ASIFT公司;布里斯克;冲浪;ImageNet公司;iHOG公司;怪胎;Vlfeat公司;SIFT公司;巨浪

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	T.Ahonen、A.Hadid和M.Pietikainen，{局部二进制模式的人脸描述：人脸识别应用}，IEEE Trans。模式分析。机器。整数。，28（2006），第2037-2041页·兹比尔1098.68717
[2]	A.Alahi、R.Ortiz和P.Vandergheynst，{it FREAK:快速视网膜关键点}，摘自IEEE计算机视觉和模式识别会议，IEEE，2012年，第510-517页。
[3]	B.Allen和M.Kon，{马尔猜想和小波变换的唯一性}，预印本，2015年·Zbl 1404.42062号
[4]	B.Allen和M.Kon，{从边缘信息中的独特恢复}，2015年国际抽样理论与应用会议（SampTA），IEEE，2015，第312-316页。
[5]	F.Attneave，《视觉感知的一些信息方面》，《心理学评论》，61（1954），第183-193页。
[6]	S.Battiato、G.Gallo、G.Puglishi和S.Scellato，《SIFT功能跟踪视频稳定》，第14届国际图像分析与处理会议（ICIAP 2007），IEEE，2007年，第825-830页。
[7]	H.Bay，A.Ess，T.Tuytelaars和L.Van Gool，{加速鲁棒特性（SURF）}，计算。视觉。图像理解，110（2008），第346-359页。
[8]	M.Black和A.Jepson，《特征跟踪：使用基于视图的表示对铰接对象进行鲁棒匹配和跟踪》，Int.J.Comput。视觉。，26（1998年），第63-84页。
[9]	Y.-L.Boureau、F.Bach、Y.LeCun和J.Ponce，{为识别而学习中级特征}，IEEE计算机视觉和模式识别会议（CVPR），IEEE，2010年，第2559-2566页。
[10]	Y.-L.Boureau、N.Le Roux、F.Bach、J.Ponce和Y.LeCun，《询问当地人：图像识别的多路本地池》，摘自2011年IEEE计算机视觉国际会议（ICCV 2011），IEEE，2011年，第2651-2658页。
[11]	G.Csurka、C.Dance、L.Fan、J.Willamowski和C.Bray，{用关键点包进行视觉分类}，《计算机视觉中的统计学习研讨会》，ECCV，2004年。
[12]	S.Curtis和A.Oppenheim，从零交叉重建多维信号，J.Opt。Soc.Amer公司。A、 4（1987），第221-231页。
[13]	S.Curtis、S.Shitz和A.Oppenheim，{从过零点重建非周期二维信号}，IEEE Trans。阿库斯特。语音信号处理。，35（1987年），第890-893页。
[14]	N.Dalal和B.Triggs，{人类检测定向梯度直方图}，2005年IEEE计算机社会计算机视觉和模式识别会议（CVPR'05），第1卷，IEEE，2005，第886-893页。
[15]	E.d'Angelo、L.Jacques、A.Alahi和P.Vandergheynst，《从比特到图像：局部二进制描述符的反转》，IEEE Trans。模式分析。机器。整数。，36（2014），第874-887页。
[16]	A.Desolneux，{\it当一种对立面方法变得有生成性}，《国际计算机杂志》。视觉。，116（2016），第46-65页·Zbl 1398.68575号
[17]	A.Desolneux和A.Leclaire，{基于梯度方向局部直方图的随机图像重建}，《第六届计算机视觉尺度空间和变分方法国际会议论文集》，《计算机课堂讲稿》。科学。10302，施普林格出版社，2017年，第133-145页·Zbl 1489.68380号
[18]	A.Desolneux、L.Moisan和J.Morel，《从格式塔理论到图像分析：概率方法》，Interdiscip。申请。数学。34，Springer科学与商业媒体，2007年·Zbl 1241.68001号
[19]	A.Dosovitskiy和T.Brox，《用卷积网络反演视觉表征》，预印本，2015年。
[20]	J.H.Elder和S.W.Zucker，{尺度空间定位、模糊和基于轮廓的图像编码}，《1996年IEEE计算机学会计算机视觉和模式识别会议论文集》（CVPR'96），IEEE，1996年，第27-34页。
[21]	O.Faugeras，《三维计算机视觉：几何观点》，麻省理工出版社，1993年。
[22]	P.Felzenszwalb、R.Girshick、D.McAllester和D.Ramanan，{使用区分训练的基于部分的模型进行对象检测}，IEEE Trans。模式分析。机器。整数。，32（2010年），第1627-1645页。
[23]	C.Harris和M.Stephens，{\it-A组合角点和边缘检测器}，在Proc。第四届阿尔维视觉大会，Citeseer，1988年，第147-151页。
[24]	R.Hummel和R.Moniot，{从尺度空间中的零交叉点重构}，IEEE Trans。阿库斯特。语音信号处理。，37（1989），第2111-2130页。
[25]	F.Juefei-Xu和M.Savvides，《学习反转局部二进制模式》，第27届英国机器视觉会议（BMVC），2016年·Zbl 1374.94168号
[26]	H.Kato和T.Harada，{从视觉单词中重建图像}，《2014年IEEE计算机视觉和模式识别会议论文集》，IEEE，2014年，第955-962页。
[27]	A.Krizhevsky、I.Sutskever和G.Hinton，{深度卷积神经网络的ImageNet分类}，《神经信息处理系统进展》，2012年，第1097-1105页。
[28]	S.Lazebnik、C.Schmid和J.Ponce，{\it Beyond bags of features:Spatial pyramid matching for recogniting natural scene categories}，摘自IEEE Computer Society Conference on Computer Vision and Pattern Recognition，Vol.2，IEEE，2006，pp.2169-2178。
[29]	S.Leutenegger、M.Chli和R.Y.Siegwart，｛\it BRISK:二进制鲁棒不变可扩展关键点｝，在IEEE国际计算机视觉会议（ICCV）上，IEEE，2011，第2548-2555页。
[30]	T.Lindeberg，{带自动刻度选择的特征检测}，国际计算机杂志。视觉。，30（1998年），第79-116页。
[31]	T.Lindeberg，{使用广义尺度空间兴趣点进行图像匹配}，J.Math。《成像视觉》，52（2015），第3-36页·兹比尔1357.94023
[32]	D.Lowe，{从尺度不变关键点区分图像特征}，国际计算机杂志。视觉。，60（2004年），第91-110页。
[33]	Y.Lu、S.Zhu和Y.N.Wu，《使用CNN过滤器进行知识可视化的学习框架模型》，预印本，2015年。
[34]	A.Mahendran和A.Vedaldi，{通过反转理解深层图像表示}，《2015年IEEE计算机视觉和模式识别会议论文集》，IEEE，2015年，第5188-5196页。
[35]	A.Mahendran和A.Vedaldi，{使用自然预图像可视化深层卷积神经网络}，国际计算机杂志。视觉。，120（2016），第233-255页。
[36]	E.Mair、G.D.Hager、D.Burschka、M.Suppa和G.Hirzinger，{基于加速段测试的自适应和通用角点检测}，《欧洲计算机视觉会议》，施普林格出版社，2010年，第183-196页。
[37]	S.Mallat和S.Zhong，{多尺度边缘信号的表征}，IEEE Trans。模式分析。机器。整数。，14（1992年），第710-732页。
[38]	D.Marr，《视觉：人类视觉信息表征和处理的计算研究》，W.H.Freeman and Company，1982年。
[39]	D.Marr和E.Hildreth，《边缘检测理论》，Proc。R.Soc.伦敦。序列号。生物科学B。，207（1980），第187-217页。
[40]	Y.Meyer，{小波：算法和应用}，SIAM，1993年·Zbl 0821.42018号
[41]	K.Mikolajczyk和C.Schmid，{尺度和仿射不变兴趣点检测器}，国际计算机杂志。视觉。，60（2004年），第63-86页。
[42]	K.Mikolajczyk和C.Schmid，{局部描述符的性能评估}，IEEE Trans。模式分析。机器。整数。，27（2005），第1615-1630页。
[43]	J.-M.Morel、A.Petro和C.Sbert，{泊松图像编辑的傅里叶实现}，模式识别快报。，33（2012），第342-348页。
[44]	J.-M.Morel和G.Yu，《ASIFT：全仿射不变图像比较的新框架》，SIAM J.Imaging Sci。，2（2009），第438-469页·兹比尔1181.68252
[45]	J.-M.Morel和G.Yu，{它是SIFT尺度不变量吗？}，逆问题。《成像》，第5期（2011年），第115-136页·Zbl 1217.68195号
[46]	D.Mumford和A.Desolneux，《模式理论：现实世界信号的随机分析》，AK Peters/CRC出版社，2010年·Zbl 1210.94002号
[47]	P.Museí，F.Sur，F.Cao，Y.Gousseau，and J.-M.Morel，{it An a contario decision method for shape element recognition}，国际计算机杂志。视觉。，69（2006），第295-315页。
[48]	Y.Nesterov，{凸优化入门讲座：基础课程}，应用。最佳方案。87，施普林格，2004年·Zbl 1086.90045号
[49]	M.Nielsen和M.Lillholm，{特征对图像有什么影响？}，《尺度空间》，第1卷，施普林格出版社，2001年，第39-50页·Zbl 0991.68582号
[50]	T.Ojala、M.PietikÃinen和T.Maenpaa，{局部二值模式的多分辨率灰度和旋转不变纹理分类}，IEEE Trans。模式分析。机器。整数。，24（2002），第971-987页。
[51]	P.Peírez、M.Gangnet和A.Blake，{\it Poisson image editing}，载于ACM SIGGRAPH 2003论文，SIGGRACH’03，2003，第313-318页。
[52]	J.Philbin、O.Chum、M.Isard、J.Sivic和A.Zisserman，{大词汇和快速空间匹配的对象检索}，《2007年IEEE计算机视觉和模式识别会议论文集》，IEEE，2007年，第1-8页。
[53]	I.Rey Otero和M.Delbracio，《SIFT方法的解剖学》，图像处理。在线，4（2014），第370-396页。
[54]	E.Rosten和T.Drummond，《高速角点检测的机器学习》，收录于《计算机视觉-ECCV 2006》，Springer出版社，2006年，第430-443页。
[55]	J.Sanz和T.Huang，{零交叉图像重建的定理和实验}，IBM Almaden研究中心，1987，
[56]	H.Sheikh、Z.Wang、L.Cormack和A.Bovik，{实时图像质量评估数据库}，第2版（2005）。
[57]	K.Simonyan和A.Zisserman，{大规模图像识别的甚深卷积网络}，《学习表征国际会议论文集》，2014年。
[58]	J.Sivic和A.Zisserman，《视频谷歌：视频中对象匹配的文本检索方法》，第九届IEEE计算机视觉国际会议论文集，IEEE，2003年，第1470-1477页。
[59]	T.Tuytelaars和K.Mikolajczyk，《局部不变特征检测器：调查》，Found。趋势计算。图形视觉。，3（2008），第177-280页。
[60]	T.Tuytelaars和L.Van Gool，{基于仿射不变区域匹配广泛分离的视图}，国际计算机杂志。视觉。，59（2004），第61-85页。
[61]	A.Vedaldi和B.Fulkerson，{it VLFeat:一个开放的便携式计算机视觉算法库}，载于《第18届ACM国际多媒体会议论文集》，ACM，2010年，第1469-1472页。
[62]	C.Vondrick、A.Khosla、T.Malisiewicz和A.Torralba，{\it HOGgles:可视化物体检测特征}，《2013年IEEE计算机视觉国际会议论文集》，2013年，第1-8页。
[63]	C.Wallraven、B.Caputo和A.Graf，《识别本地特征：内核配方》，第九届IEEE计算机视觉国际会议论文集，IEEE，2003年，第257-264页。
[64]	P.Weinzaepfel、H.Jeígou和P.Peírez，{从局部描述符重建图像}，《IEEE CVPR学报》，2011年，第337-344页。
[65]	J.Yang、D.Schonfeld和M.Mohamed，《基于投影摄像机运动的粒子滤波器跟踪的鲁棒视频稳定》，IEEE Trans。电路系统视频技术。，19（2009），第945-954页。
[66]	A.Yilmaz、O.Javed和M.Shah，《目标跟踪：调查》，ACM Compute。调查，38（2006），13。
[67]	M.Zeiler和R.Fergus，《可视化和理解卷积网络》，收录于《计算机视觉–ECCV 2014》，Springer，2014年，第818-833页。
[68]	J.Zhang、M.Marszałek、S.Lazebnik和C.Schmid，｛\it纹理和对象类别分类的局部特征和核：综合研究｝，Int.J.Comput。视觉。，73（2007），第213-238页。
[69]	S.Zhu、Y.Wu和D.Mumford，《过滤器、随机场和最大熵（FRAME）：纹理建模的统一理论》，国际计算机杂志。视觉。，27（1998），第107-126页。

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文件类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	括号

示例

领域

操作员

来自SIFT类描述符的随机图像模型。（英语） Zbl 1423.62120号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

来自SIFT类描述符的随机图像模型。 （英语） Zbl 1423.62120号

MSC公司：

关键词：

软件：

参考文献：

来自SIFT类描述符的随机图像模型。（英语） Zbl 1423.62120号