针对现有的二进制描述子计算复杂度高、无仿射不变性以及视点变化时虚假匹配率高的缺点,提出了一种新的二进制仿射不变量描述子BAND。 与其他描述子不同,BAND具有一种不规则模式,它基于特征点周围的局部仿射不变区域,并且具有五个方向,这五个方向是通过LBP有效获得的。 最终,通过简单的随机采样模式计算出256位二进制字符串。 实验结果表明,BAND在旋转、图像缩放、噪声、光照和小尺度透视变换等条件下具有良好的匹配效果。 与当前主流描述符相比,它具有更好的匹配性能,同时花费更少的时间。
1.简介 局部特征描述子是许多计算机视觉技术的核心,例如物体识别、图像检索和三维重建。 如何设计性能优良、复杂度低的局部特征描述子是一个重要而困难的研究课题。 许多学者在这一领域提出了多种描述符,如SIFT(Scale Invariant Feature Transform)[ 1 – 3 ]具有良好的尺度不变性,对光照和视点变化具有鲁棒性。 由于构造尺度空间和许多其他步骤来提高精度,SIFT具有较高的计算复杂性。 所有这些都使其速度慢得令人望而却步。
针对这些问题,提出了许多改进算法。 SURF(加速稳健功能)[ 4 ]与SIFT相比,通过用少数类Haar滤波器的响应来描述关键点,具有相似的匹配率和更快的性能。 PCA-SIFT公司[ 5 ]利用主成分分析将描述子的维数从128降到36,但增加了描述子形成的时间。 GLOH描述符[ 6 ]在对数极坐标系中使用圆形模式,以增强描述符的鲁棒性和唯一性,但其计算成本也高于SIFT。 ASIFT描述符[ 7 ]当视点发生较大变化时,能够很好地实现特征点的匹配。
在一定程度上,上述描述符提高了性能,但由于局部直方图统计,它们仍然具有较高的计算复杂度。 此外,描述符的每个维度都是一个十进制数,这使得它们需要大量的内存。 所有这些都使得它们很难在低功耗、低内存的应用程序上实现。 近年来,出现了许多二进制描述符,如BRIEF(binary Robust Independent Elementary Features)描述符[ 8 ],ORB(Oriented FAST and Rotated BRIEF)描述符[ 9 ],BRISK(二进制稳健不变可缩放关键点)描述符[ 10 ],RIFF(旋转不变快速特征)描述符[ 11 ]和FREAK(快速视网膜关键点)描述符[ 12 ]. 这些二进制描述子比SIFT类描述子需要更少的内存,并且可以通过计算汉明距离来评估描述子的相似性,这是非常有效的计算方法。 但他们的缺点之一是图案的形状无法改变。 换句话说,只有圆形图案和矩形图案,这使得它们没有仿射不变性。 在这种情况下,不同视点图像之间会出现较高的假匹配率。 另一个缺点是,一个模式只有一个局部方向,并且由于直方图统计,它们不够快。 本文提出了一种计算复杂度较低的二进制描述符。 描述子的方向由五个同心圆确定,仿射不变区域由特征点发出的16条射线确定。 实验结果表明,该二值仿射不变描述子在旋转、图像缩放、噪声、光照和小尺度透视变换等条件下具有良好的匹配效果。 在本文中,我们将这种二进制描述符称为BAND(二进制仿射不变描述符)。
2.方法 在本节中,我们描述了BAND的三个关键步骤,即仿射不变半径构建器、多向旋转不变构建器和简单随机采样模式构建器。
2.1. 仿射不变半径生成器 有许多算法可以提取局部仿射不变区域,例如MSER(最大稳定极值区域)[ 13 ]、EBR(基于边缘的区域)、IBR(基于强度极值的区域)[ 14 ]、和显著区域[ 15 ]. 这里我们参考了IBR的思想,以提取局部仿射不变区域为目标,提取了从特征点发出的16条射线。 射线中每个采样点的灰度值通过二次插值得到。 这里我们定义仿射不变半径 作为 哪里 是方向上的仿射不变半径 , 是沿射线的欧几里德弧长 , 是位置处半径的灰度值 , 是的绝对值 , 是 和特征点, 是的局部最大值之间的距离的最大值 和特征点,以及 是一个常数,我们使用的值为0.76,这是由实验确定的。
通过计算仿射不变半径,将原始圆形图案变形为不规则形状图案。 如图所示 1 .
2.2. 多向旋转不变量生成器 为了获得旋转不变的性质,现有的算法需要确定局部区域的方向并旋转轴。 在这个过程中,这些描述符的缺陷包括 (1) BRIEF描述符忽略旋转; 因此,在大角度旋转的情况下会出现大量的异常值。 (2) SIFT和ORB等算法使用矩形模式。 很难获得局部方位,并且它们具有很高的计算复杂度。 (3) 像FREAK和BRISK这样的算法只考虑一个模式的局部方向,尽管使用的是圆形模式。
基于上述三点,并参考BRISK和FREAK,BAND描述符的模式如下:构造五个与特征点同心的圆,每个圆中均匀分布16个采样点。 通过仿射不变半径生成器得到每个圆的每个仿射不变直径。
首先,通过仿射不变半径获得每个圆上采样点的位置: 哪里 是特征点周围采样点的索引, 是采样点的数量,以及 是特征点的位置。
其次,根据文献[ 14 ],每个圆的LBP二进制字符串为 哪里 是圆的索引, 是字符串的一个位的位置, 是位置处的灰度值 在圆圈上,以及 是特征点的灰度值。 最后,根据旋转不变量LBP[ 16 ],我们可以得到五个局部方向。 Ojala定义的旋转不变LBP为 : 哪里 对数字执行循环位右移操作 具有 次。 BAND描述符的模式如图所示 2 .
2.3. 简单随机采样模式生成器 这一步非常简单。 我们通过从五个LBP编码串中随机有序地采样点对来获得256比特的向量。 位向量描述符是通过执行点对的所有比较来组装的( ),这样每个位 对应于 哪里 是从五个LBP字符串中采样的点的灰度值。
3.实验与分析 编程环境为Matlab 2013、Visual Studio 2010和OpenCV 2.4.4。 数据集来自[ 17 ]. 所有算法都在3.40的Intel(R)Core(TM)i3上运行 千兆赫。 为了统一结果,所有结果都不会消除不匹配,只通过设置阈值显示最佳结果。
3.1、。 局部仿射不变描述子的单性能验证 每个数据集都包含六幅图像序列,显示出不断增加的变换量。 这里的所有比较都是针对每个数据集中的第一个图像执行的。 图 3 显示了所分析的每个数据集的一张图像。
(a) 特雷斯 (b) 联合商业银行 (c) 罗马 (d) 鲁汶 (e) 办公室 (f) 白天_晚上 (a) 特雷斯 (b) 联合商业银行 (c) 罗马 (d) 鲁汶 (e) 办公室 (f) 白天_晚上 变换包括模糊(树)、亮度变化(鲁汶、办公室和昼夜)、JPEG压缩(Ubc)和旋转(罗马)。 匹配率定义为正确匹配点的数量与匹配点总数之间的比率。 为了证明我们的算法易于集成,我们使用了FAST[ 18 , 19 ]用于检测树序列中的特征点和其他序列中的SURF。 为了使结果具有可比性,BAND、BRIEF、BRISK和ORB的汉明距离阈值为50。 我们只在SURF和SIFT中显示了最佳的50对配对。 所有结果如图所示 4 .
3.2. 室外场景的图像匹配 在第节中,我们只测试了BAND描述符的单个性能 3.1 在本节中,我们将使用图中所示的6对图像 5 测试其综合性能。 如图所示 5 ,所有6对都包含不同程度的视点变化,例如比例、亮度和旋转。 此外,所有图像都包含许多重复出现的结构。 例如,图像教堂和图像喷泉中的结构都是对称的,图像布鲁塞尔、威尼斯、Semper和Rathaus中的建筑分别具有相似的门、窗和雕像。 这些条件给匹配增加了额外的困难。
(a) 教堂 (b) 布鲁塞尔 (c) 威尼斯 (d) Semper公司 (e) 拉特豪斯 (f) 喷泉 (a) 教堂 (b) 布鲁塞尔 (c) 威尼斯 (d) Semper公司 (e) 拉特豪斯 (f) 喷泉 图 6 显示了BAND的匹配结果。 不同描述符的匹配点数和匹配率如图所示 7 和 8 .使结果与第节中的结果具有可比性 3.1 ,关于BAND、BRIEF、BRISK和ORB的Hamming距离的阈值总是50。 和之前一样,我们只在SURF和SIFT中显示了50对最佳匹配。
(a) 教堂 (b) 布鲁塞尔 (c) 威尼斯 (d) Semper公司 (e) 拉特豪斯 (f) 喷泉 (a) 教堂 (b) 布鲁塞尔 (c) 威尼斯 (d) Semper公司 (e) 拉特豪斯 (f) 喷泉 我们使用SURF来检测特征点,并且阈值与之前相同。 6对室外场景如图所示 5 和 6 .
3.3. 时间消耗比较 在Matlab 2013平台中,我们比较了每个点对的SIFT和BAND描述符之间的时间消耗。 测试结果如表所示 1 .
如果我们将描述一个特征点的BAND时间设置为1,那么我们将得到表中其他描述符的时间消耗 2 很明显。
3.4. 实验结果分析 在单个性能验证中,BAND被证明比其他描述符具有更好的适应性。 在6个实验中,变换的程度在增加。 值得注意的是,鲁汶的亮度逐渐从正常变为黑暗。 同样,办公室的亮度也从黑暗变为正常。 不同的是,Day_Night显示亮度从正常到暗的转换,但由于一些灯光,如灯、灯泡和蜡烛,一些局部区域变得比周围环境更亮。 换句话说,它是非线性变化的。 由于相似性降低,图中每条线的方向 4 向下显示。 BRIEF在所有描述符中表现最差,因为它没有注意到旋转和缩放的多样性。 在光线实验中,如鲁汶(Leuven)、办公室(Office)和昼夜(Day_Night),BAND表现出色。 无论亮度变化有多严重,BAND都能保持较高的正确匹配率。 在其他实验条件下,BAND的性能与主流描述符相似。 此外,无论我们使用什么样的特征点,比如FAST和SURF,BAND描述符都能很好地工作,这表明它具有很高的适应性。
在室外场景的匹配实验中,通过ORB描述符可以得到大量的匹配点,但其正确匹配率低于BAND描述符。 其负面影响之一是,在删除不匹配点的过程中会有更多的计算。 虽然BAND得到的匹配点数量没有ORB多,但数量保持在较高水平,正确匹配率令人满意。 它比其他描述符的正确匹配率更好或与之相当。 原因是BAND考虑了仿射不变性,其形状可变的模式能够更好地适应视点的变化。
在耗时的比较实验中,每个BAND点的描述时间约为SIFT时间的0.1%。 原因是没有建立高斯金字塔的过程,也没有过多的拟合操作计算。 BAND使用汉明距离计算两个描述之间的距离,而SIFT使用欧几里德距离。 显然,计算汉明距离具有较高的效率和较低的计算复杂度。 因此,BAND显示出更高的效率。 与其他描述符的比较也表明BAND更快。 因此,BAND在要求高计算速度的情况下具有优势。
4.结论 实验结果表明,BAND描述符具有计算复杂度低、适应性强、稳定性好等显著优点。 它弥补了其他描述符计算复杂度高、无仿射不变性的缺点。 BAND在旋转、图像缩放、噪声、照明和小尺度透视变换等条件下具有良好的匹配效果。 更具体地说,它具有中等数量的匹配点和较高的正确匹配率。 正因为如此,在保证精度的基础上,BAND可以提高计算效率,满足实时性要求。
利益冲突 作者声明,本论文的出版不存在利益冲突。