摘要

针对现有的二进制描述子计算复杂度高、无仿射不变性以及视点变化时虚假匹配率高的缺点,提出了一种新的二进制仿射不变量描述子BAND。与其他描述子不同,BAND具有一种不规则模式,它基于特征点周围的局部仿射不变区域,并且具有五个方向,这五个方向是通过LBP有效获得的。最终,通过简单的随机采样模式计算出256位二进制字符串。实验结果表明,BAND在旋转、图像缩放、噪声、光照和小尺度透视变换等条件下具有良好的匹配效果。与当前主流描述符相比,它具有更好的匹配性能,同时花费更少的时间。

1.简介

局部特征描述子是许多计算机视觉技术的核心,例如物体识别、图像检索和三维重建。如何设计性能优良、复杂度低的局部特征描述子是一个重要而困难的研究课题。许多学者在这一领域提出了多种描述符,如SIFT(Scale Invariant Feature Transform)[13]具有良好的尺度不变性,对光照和视点变化具有鲁棒性。由于构造尺度空间和许多其他步骤来提高精度,SIFT具有较高的计算复杂性。所有这些都使其速度慢得令人望而却步。

针对这些问题,提出了许多改进算法。SURF(加速稳健功能)[4]与SIFT相比,通过用少数类Haar滤波器的响应来描述关键点,具有相似的匹配率和更快的性能。PCA-SIFT公司[5]利用主成分分析将描述子的维数从128降到36,但增加了描述子形成的时间。GLOH描述符[6]在对数极坐标系中使用圆形模式,以增强描述符的鲁棒性和唯一性,但其计算成本也高于SIFT。ASIFT描述符[7]当视点发生较大变化时,能够很好地实现特征点的匹配。

在一定程度上,上述描述符提高了性能,但由于局部直方图统计,它们仍然具有较高的计算复杂度。此外,描述符的每个维度都是一个十进制数,这使得它们需要大量的内存。所有这些都使得它们很难在低功耗、低内存的应用程序上实现。近年来,出现了许多二进制描述符,如BRIEF(binary Robust Independent Elementary Features)描述符[8],ORB(Oriented FAST and Rotated BRIEF)描述符[9],BRISK(二进制稳健不变可缩放关键点)描述符[10],RIFF(旋转不变快速特征)描述符[11]和FREAK(快速视网膜关键点)描述符[12]. 这些二进制描述子比SIFT类描述子需要更少的内存,并且可以通过计算汉明距离来评估描述子的相似性,这是非常有效的计算方法。但他们的缺点之一是图案的形状无法改变。换句话说,只有圆形图案和矩形图案,这使得它们没有仿射不变性。在这种情况下,不同视点图像之间会出现较高的假匹配率。另一个缺点是,一个模式只有一个局部方向,并且由于直方图统计,它们不够快。本文提出了一种计算复杂度较低的二进制描述符。描述子的方向由五个同心圆确定,仿射不变区域由特征点发出的16条射线确定。实验结果表明,该二值仿射不变描述子在旋转、图像缩放、噪声、光照和小尺度透视变换等条件下具有良好的匹配效果。在本文中,我们将这种二进制描述符称为BAND(二进制仿射不变描述符)。

2.方法

在本节中,我们描述了BAND的三个关键步骤,即仿射不变半径构建器、多向旋转不变构建器和简单随机采样模式构建器。

2.1. 仿射不变半径生成器

有许多算法可以提取局部仿射不变区域,例如MSER(最大稳定极值区域)[13]、EBR(基于边缘的区域)、IBR(基于强度极值的区域)[14]、和显著区域[15]. 这里我们参考了IBR的思想,以提取局部仿射不变区域为目标,提取了从特征点发出的16条射线。射线中每个采样点的灰度值通过二次插值得到。这里我们定义仿射不变半径作为哪里是方向上的仿射不变半径,是沿射线的欧几里德弧长,是位置处半径的灰度值,是的绝对值,和特征点,是的局部最大值之间的距离的最大值和特征点,以及是一个常数,我们使用的值为0.76,这是由实验确定的。

通过计算仿射不变半径,将原始圆形图案变形为不规则形状图案。如图所示1.

2.2. 多向旋转不变量生成器

为了获得旋转不变的性质,现有的算法需要确定局部区域的方向并旋转轴。在这个过程中,这些描述符的缺陷包括(1)BRIEF描述符忽略旋转;因此,在大角度旋转的情况下会出现大量的异常值。(2)SIFT和ORB等算法使用矩形模式。很难获得局部方位,并且它们具有很高的计算复杂度。(3)像FREAK和BRISK这样的算法只考虑一个模式的局部方向,尽管使用的是圆形模式。

基于上述三点,并参考BRISK和FREAK,BAND描述符的模式如下:构造五个与特征点同心的圆,每个圆中均匀分布16个采样点。通过仿射不变半径生成器得到每个圆的每个仿射不变直径。

首先,通过仿射不变半径获得每个圆上采样点的位置:哪里是特征点周围采样点的索引,是采样点的数量,以及是特征点的位置。

其次,根据文献[14],每个圆的LBP二进制字符串为哪里是圆的索引,是字符串的一个位的位置,是位置处的灰度值在圆圈上,以及是特征点的灰度值。最后,根据旋转不变量LBP[16],我们可以得到五个局部方向。Ojala定义的旋转不变LBP为:哪里对数字执行循环位右移操作具有次。BAND描述符的模式如图所示2.

2.3. 简单随机采样模式生成器

这一步非常简单。我们通过从五个LBP编码串中随机有序地采样点对来获得256比特的向量。位向量描述符是通过执行点对的所有比较来组装的(),这样每个位对应于哪里是从五个LBP字符串中采样的点的灰度值。

3.实验与分析

编程环境为Matlab 2013、Visual Studio 2010和OpenCV 2.4.4。数据集来自[17]. 所有算法都在3.40的Intel(R)Core(TM)i3上运行千兆赫。为了统一结果,所有结果都不会消除不匹配,只通过设置阈值显示最佳结果。

3.1、。局部仿射不变描述子的单性能验证

每个数据集都包含六幅图像序列,显示出不断增加的变换量。这里的所有比较都是针对每个数据集中的第一个图像执行的。3显示了所分析的每个数据集的一张图像。

变换包括模糊(树)、亮度变化(鲁汶、办公室和昼夜)、JPEG压缩(Ubc)和旋转(罗马)。匹配率定义为正确匹配点的数量与匹配点总数之间的比率。为了证明我们的算法易于集成,我们使用了FAST[18,19]用于检测树序列中的特征点和其他序列中的SURF。为了使结果具有可比性,BAND、BRIEF、BRISK和ORB的汉明距离阈值为50。我们只在SURF和SIFT中显示了最佳的50对配对。所有结果如图所示4.

3.2. 室外场景的图像匹配

在第节中,我们只测试了BAND描述符的单个性能3.1在本节中,我们将使用图中所示的6对图像5测试其综合性能。如图所示5,所有6对都包含不同程度的视点变化,例如比例、亮度和旋转。此外,所有图像都包含许多重复出现的结构。例如,图像教堂和图像喷泉中的结构都是对称的,图像布鲁塞尔、威尼斯、Semper和Rathaus中的建筑分别具有相似的门、窗和雕像。这些条件给匹配增加了额外的困难。

6显示了BAND的匹配结果。不同描述符的匹配点数和匹配率如图所示78.使结果与第节中的结果具有可比性3.1,关于BAND、BRIEF、BRISK和ORB的Hamming距离的阈值总是50。和之前一样,我们只在SURF和SIFT中显示了50对最佳匹配。

我们使用SURF来检测特征点,并且阈值与之前相同。6对室外场景如图所示56.

3.3. 时间消耗比较

在Matlab 2013平台中,我们比较了每个点对的SIFT和BAND描述符之间的时间消耗。测试结果如表所示1.

如果我们将描述一个特征点的BAND时间设置为1,那么我们将得到表中其他描述符的时间消耗2很明显。

3.4. 实验结果分析

在单个性能验证中,BAND被证明比其他描述符具有更好的适应性。在6个实验中,变换的程度在增加。值得注意的是,鲁汶的亮度逐渐从正常变为黑暗。同样,办公室的亮度也从黑暗变为正常。不同的是,Day_Night显示亮度从正常到暗的转换,但由于一些灯光,如灯、灯泡和蜡烛,一些局部区域变得比周围环境更亮。换句话说,它是非线性变化的。由于相似性降低,图中每条线的方向4向下显示。BRIEF在所有描述符中表现最差,因为它没有注意到旋转和缩放的多样性。在光线实验中,如鲁汶(Leuven)、办公室(Office)和昼夜(Day_Night),BAND表现出色。无论亮度变化有多严重,BAND都能保持较高的正确匹配率。在其他实验条件下,BAND的性能与主流描述符相似。此外,无论我们使用什么样的特征点,比如FAST和SURF,BAND描述符都能很好地工作,这表明它具有很高的适应性。

在室外场景的匹配实验中,通过ORB描述符可以得到大量的匹配点,但其正确匹配率低于BAND描述符。其负面影响之一是,在删除不匹配点的过程中会有更多的计算。虽然BAND得到的匹配点数量没有ORB多,但数量保持在较高水平,正确匹配率令人满意。它比其他描述符的正确匹配率更好或与之相当。原因是BAND考虑了仿射不变性,其形状可变的模式能够更好地适应视点的变化。

在耗时的比较实验中,每个BAND点的描述时间约为SIFT时间的0.1%。原因是没有建立高斯金字塔的过程,也没有过多的拟合操作计算。BAND使用汉明距离计算两个描述之间的距离,而SIFT使用欧几里德距离。显然,计算汉明距离具有较高的效率和较低的计算复杂度。因此,BAND显示出更高的效率。与其他描述符的比较也表明BAND更快。因此,BAND在要求高计算速度的情况下具有优势。

4.结论

实验结果表明,BAND描述符具有计算复杂度低、适应性强、稳定性好等显著优点。它弥补了其他描述符计算复杂度高、无仿射不变性的缺点。BAND在旋转、图像缩放、噪声、照明和小尺度透视变换等条件下具有良好的匹配效果。更具体地说,它具有中等数量的匹配点和较高的正确匹配率。正因为如此,在保证精度的基础上,BAND可以提高计算效率,满足实时性要求。

利益冲突

作者声明,本论文的出版不存在利益冲突。