跳到主要内容

利用基序矩阵推理进行旋转图像索引和检索

摘要

随着信息技术的飞速发展,数字图书馆的规模越来越大。如何在庞大的数字图书馆中快速有效地搜索所需的图像成为需要优先解决的挑战。在本研究中,我们首先提出了两种基于模体的矩阵,即模体平均矩阵(MAM)和模体过量矩阵(MEM),来描述图像的颜色和纹理特征。随后,根据MAM和MEM的推理,进一步提出了一种模体矩阵(MM)来索引旋转图像,解决了旋转图像检索问题。也就是说,根据这种推断,MM融合了颜色和纹理特征,揭示了原始图像和旋转图像之间的一致相关性,可以有效地用于旋转图像检索。为了广泛测试该方法的性能,我们在基准Corel图像数据集、Brodatz纹理图像数据集和WIPO全球品牌数据集上进行了实验,实验结果表明,与现有的图像检索方法相比,我们的motif矩阵推理方法提高了检索性能。

1介绍

近年来,随着多媒体和计算机技术的飞速发展,数字图书馆的规模越来越大。因此,在这些大型数字图书馆中,如何找到所需的图像信息,尤其是大量旋转图像的信息,已成为亟待解决的挑战。旋转图像检索在红外系统中有着广泛的应用。随着商标注册系统中商标图像数量的迅速增加,新图案的设计应防止与注册的类似商标发生冲突。特别是,旋转引起的类似图案也需要有效避免。商标图像检索系统可以在输入新的商标图像进行注册后立即找到相似的商标,可以有效地保护注册商标的合法权益。近十年来,图像检索已成为图像处理、模式识别和人工智能领域的研究热点。

基于文本的图像检索技术[1,2]和内容[,4]在过去的十年中,已经进行了广泛的研究。基于文本的图像检索方法是20世纪70年代首次提出并广泛应用的。大型搜索引擎公司,如谷歌、雅虎和百度,广泛使用图像上标注的关键字来实现检索。然而,随着数字成像设备的广泛应用,这种方法有两个缺点。首先,手动处理图像数据库的需要可能过于昂贵。其次,检索结果可能不准确,因为它们经常与注释者的主观理解有关。为了区别于基于文本的方法,基于内容的图像检索(CBIR)[5,6,7,8]于20世纪90年代初提出。这种方法是使用颜色等低层特征检索图像[9,10,11],形状[12,13]、和纹理[14,15,16],用于描述图像。通过提取图像的自然特征,CBIR计算查询图像和数据库图像之间的相似度[17,18]并根据相似性对最相关的图像进行排序。这种方法完全释放了注释者的劳动,有效地减少了不准确的反馈,而无需主观描述[19,20,21]. 此外,各种组织、个人和医院开发了大量CBIR系统,例如QBIC[22]、PhotoBook[23]、VisualSEEK[24]、内特拉[25]、Pictoseek[26],简单[27]和Blobworld[28].

作为图像检索研究领域的一个重要课题,基于内容的图像检索技术得到了广泛的研究。一般来说,CBIR通常使用描述符,即颜色、纹理或形状来表示图像。设计了各种算法来提取这些特征。HSV直方图(HSVH)[29]利用HSV颜色空间提取彩色像素特征。它将每个图像转换为量化的颜色直方图,以进行后续图像比较。该方案只考虑了颜色特征,忽略了像素的空间分布特征。颜色共生矩阵(CCM)[30]是一个传统的模式共生矩阵,它计算每对相邻图案之间相同排列的发生概率,并将此概率视为图像的属性。在CCM的基础上,提出了一种改进的颜色基序共生矩阵(MCMCM)[31]用于收集CCM中不存在的红色、绿色和蓝色空间之间的互相关。然而,这两种方法没有考虑每个图案中像素变化的强度,通常导致差异较大的2×2像素的值共享相同的图案。鉴于这种缺陷,扫描模式像素之间的差异(DBPSP)[32]提出并旨在计算图案中所有像素之间的差异。组合算法MCMCM&DBPSP[33],分别计算从MCMCM和DBPSP获得的相似性,然后使用固定系数对其权重进行归一化。然而,它过于依赖于难以选择的预定义系数,特别是对于不同图像数据集的应用。结构元素描述符(SED)[34]是一种基于HSV颜色空间的纹理描述符。它提取颜色和纹理特征来表示图像。然而,它对区域或纹理不显著的图像非常敏感,并且有效性受到限制。此外,上述方法没有考虑图像旋转的问题,这会产生判断错误。因此,检索结果似乎与人类识别相似图像的直觉相矛盾。在指纹识别和LOGO注册的研究领域中,有许多旋转不变的特征或模型,例如Gabor变换和统计特征[35],小波隐马尔可夫模型[36]、和本地二进制模式[37],将被考虑在内。然而,大量的计算和特征的高维性通常会影响检索的性能。

在本文中,我们提出了一种基于旋转不变纹理特征的模式矩阵推理(MMI)用于旋转图像检索。为了解决旋转图像检索问题,我们在统计分析的基础上实现了一个最小左上三角(MULT)规则,该规则包含最后八个基序以保持一致性。这种方法可以有效地减少图案的种类,解决图像旋转后的失真问题。随后从模体变换图像中导出模体过量矩阵(MEM)来描述整个图像。整个图像被划分为2×2个像素网格,每个网格都被一个扫描图案所取代。同时,我们利用模体平均矩阵(MAM)来存储图像的灰度信息。最后,进一步提出了一种基序矩阵(MM)来集成MEM和MAM来提取和描述颜色和纹理特征。也就是说,当图像旋转时,我们可以获得相同的MM。因此,我们的方法综合了纹理和彩色描述方法的优点。此外,通过统计分析,本文提出的MULT方法减少了MM的空间,有效地解决了旋转图像检索的问题。

本文的其余部分结构如下。章节2给出了motif的定义,并介绍了如何将图像转换为相关的MAM、MEM和MM。原始的256×24大小的MM只统计图像的纹理和灰度信息。其固有结构无法解决旋转图像检索的问题。同时,简单的合并模式可能会导致图像失真问题。在本研究中,提出的MULT将MM的空间缩小到相对较小的256×8的尺度,可以有效地解决旋转图像检索的问题。章节描述了计算图像之间相似度的评价方法。实验结果和比较见第节4结论见第节5.

2方法

2.1原始图案

在本文中,原始图像被划分为2×2个网格。然后用一个特定的扫描图案替换这些网格,该图案将以灰度升序(AGO)遍历网格,以反映2×2网格的纹理(见图1). 请注意,为解决具有相同灰度的网格问题,提供了固定的优先级。也就是说,根据这种优先级,可以获得唯一的扫描曲线来表示2×2网格。

图1
图1

2×2网格中的预定义优先级

在图中1,我们定义左上方网格(标签1)具有最高优先级,而左下方网格(标签4)具有最低优先级。这样的优先顺序可以解决网格中相同灰度的曲线连接问题。同时,通过灰度升序,我们可以将2×2网格转换为一个独特的图案。拍摄照片2例如,尽管标签1的灰度与标签3的灰度相同,但我们也可以获得序列为1324的唯一基序。一般来说,24种不同的图案可以穿过“2×2网格”(见图).

图2
图2

每个网格的原始灰色。b条2×2网格中的独特图案

图3
图3

共24种图案

2.2修正的八个旋转不变基序

根据直觉,如果一个图案顺时针旋转90°、180°和270°,它将分别转换为另外三种图案。因此,为了进行旋转图像检索,我们将原始基序及其三个旋转基序归类为一个基序。也就是说,在这种直接合并之后,我们可以从图中看到424种基序可以直接简化为6种,新的6种基序如图所示5.

图4
图4

主题的融合

图5
图5

融合了六个主题

这样一个简单的合并过程似乎可以解决旋转图像检索问题。然而,经过进一步分析,它可能会导致旋转失真的问题。也就是说,如果一个2×2网格单元遇到相同灰度的情况,则原始2×2栅格的旋转可能会导致指定的合并图案中出现不同的图案。我们采用图6例如。通过简单的合并,与原始网格相关的图案被指定为NO.2图案,但经过三度旋转的网格产生NO.0图案,这与原始网格产生的图案不同,导致了旋转变形问题。因此,我们不能仅仅利用这种简单的合并来处理旋转图像检索。在本研究中,我们提出了一个最小左上三角形(MULT)规则来解决它,MULT被描述为:

  • 步骤1:计算标签1、2和4中的灰度总和。

  • 步骤2:如果总和小于或等于其他三个相邻灰度的总和,即标签1、2和3;标签1、3和4;标签2、3和4,转至步骤4。否则,请转至步骤3。

  • 步骤3:将2×2网格顺时针旋转90°,再次计算标签1、2和4中的灰度总和,然后转至步骤2。

  • 第四步:利用AGO获得图案。

图6
图6

旋转变形问题

MULT规则固定了标签1、2和4网格中的三个较小灰度,无论旋转原始图像的角度是90°、180°还是270°。在图中7,我们也采用2×2网格(见图10)例如。虽然2×2网格单元遇到相同灰度的情况,但MULT规则最终可以实现唯一的图案。

图7
图7

MULT规则用于解决旋转变形

根据MULT规则,通过完整的统计方法,将原来的24种基序最终简化为8种基序,这8种基模如图所示8.

图8
图8

最后八个主题

众所周知,对于2×2网格的每一个单位,图像的旋转不仅会移动其在空间中的位置,而且还会旋转其内部内容。在对MULT进行进一步分析和广泛仿真之后,我们发现了由给出的两种特殊情况。

  • 案例1:一个2×2网格单位,具有三个等效灰度和另一个较小灰度。

  • 情况2:一个2×2网格的单位,有两个等价的灰度和另外两个较小的灰度。

为了很好地处理这两种情况,我们改进了MULT并用其生成的基序之一指定它们。指定过程如图所示9.

图9
图9

两种特殊情况与其生成的主题直接结合

为了讨论为什么我们选择这三种生成的基序来表示最终合并的基序,我们首先研究了常用图像数据集Core-1000中每种情况和基序的频率[38,39,40],相应的频率和百分比如表所示12.

表1 Corel-1000图像数据集中每个案例的频率和百分比
表2 Corel-1000图像数据集中每个图案的频率和百分比

请注意,我们需要选择一些不同的图案来代表这两种特殊情况下最终合并的图案。也就是说,可以直观地选择百分比最低的生成图案。随后,我们将解释为什么在图中选择这三种生成的基序9如下所示。

  1. (1)

    对于案例1,从原始网格和相应的三个旋转网格中,生成了三种图案,即NO.0、NO.5和NO.7,其百分比分别为11.787%、10.31%和0%。因此,选择第7号图案代表案例1。

  2. (2)

    对于案例2.1,从原始网格和相应的三个旋转网格中,生成了两种图案,即NO.4和NO.6,其百分比分别为4.596%和3.882%。因此,选择第6号图案代表案例2.1。

  3. (3)

    对于案例2.2,从原始网格和相应的三个旋转网格中,生成了两种图案,即NO.2和NO.7,其百分比分别为17.901%和0。因此,选择第7号图案代表案例2.2。

到目前为止,在对MULT进行上述修改后,最后八个基序中包含了基序的数量,这种合并的方法可以很好地组织MEM和MAM进行旋转图像检索。

2.3基序平均矩阵(MAM)

为了提取图像的颜色特征,我们使用MAM存储每个图案的平均灰度。也就是说,由于每个元素都是从2×2网格中获得的,因此很明显,灰度矩阵的大小为M(M)× N个图像可以转换为(M(M) – 1) × (N个–1)MAM,其中M(M)N个分别是原始图像中的行和列的像素数。构造MAM的步骤如下所述:

  1. (1)

    从灰度矩阵中的原点位置(0,0)开始,以1步长从左到右和从上到下移动每个2×2网格单元。

  2. (2)

    提取2×2网格中每个单元的平均灰度作为MAM的元素。

我们可以吃无花果1011例如,图10表示图像和图的原始10×10 Gy水平矩阵11表示相关的9×9 MAM。

图10
图10

一个原始的10×10Gy能级矩阵

图11
图11

构建的MAM

2.4基序过量矩阵(MEM)

在这项研究中,颜色和纹理的特征都被用来综合描述图像。也就是说,我们不仅使用MAM存储颜色特征,还使用MEM保存纹理特征。由于MEM中的每个元素都是一个模体,并且我们从2×2网格的每个单元中提取模体,很明显MEM的大小也是(M(M) – 1) × (N个–1)与M(M)× N个灰度图像。注意,图案和平均灰度信息都是从每个2×2网格单元中提取的。因此,MEM中的纹理特征可以通过相关位置映射到MAM中的颜色特征。构建MEM的步骤描述如下:

  1. (1)

    从灰度矩阵中的原点位置(0,0)开始,将2×2网格的每个单元从左到右、从上到下移动一步。

  2. (2)

    利用AGO方法生成作为MEM元素的图案。

拿Figs来说46例如。基于原始灰度矩阵(见图4),我们可以在图中获得相关的9×9 MEM12.

图12
图12

构建的MEM

2.5基序矩阵(MM)

如上所述,MAM只计算颜色特征,而MEM只计算纹理特征。在本研究中,纹理和颜色特征都被视为图像的内容。也就是说,我们建议MM将这两个特征进一步融合到一个空间中。众所周知,灰度值在0到255之间,我们总共获得了八种图案来表示纹理。随后,我们利用灰度范围和图案类型分别表示MM的行和列。也就是说,在新生成的MM是一个256×8的矩阵,元素MM(x个,)计算同一像素中的次数(,j个)、MAM(,j个)是的平均灰度x个和MEM(,j个)是第个图案。元素MM的定义(x个,)由提供

$${\displaystyle\begin{array}{c}\mathrm{If}\\mathrm}\left(i,j\right)=x,x\in\left[0255\right]\\{}\mathrm{and}\\mathr m{MEM}\left[i,j\ right)=y,y\in\leaft[0,7\right]\\{}\ mathrm[Then}\\mathrem{MM}\ left(x,y\right y\右)+1\结束{数组}}$$
(1)

例如,如果MAM(20,5)是255,MEM(20,15)是第二个图案,那么MM(255,2)的值应该增加到1。通过这种方法,我们将纹理和颜色特征合并到一个融合的空间中。也就是说,MM统计每种图案共享相同平均灰度的总时间。因此,这种基于统计的方法可以解决搜索可能分散在图像不同位置的相似纹理和颜色特征的问题。

取图中的MAM11和图中的MEM12例如。我们可以得到大小为256×8的融合MM。为了清楚地解释MM,我们只考虑了第71行MM。也就是说,我们计算平均灰度为70的每种图案的次数。我们可以从图中看到11即MAM(0,6)=70,MAM(1,1)=70、MAM(5,2)=70和MAM(7,5)=7012MEM(0,6)=1,MEM(1,1)=4,MEM描绘第71排MM。

表3从图1112

在这项研究中,我们主要关注基于内容的图像检索,特别是旋转图像检索。到目前为止,我们已经使用MM来组织图像的颜色和纹理特征。为了清楚地描述图像旋转的问题,我们还从图中提取了原始的10×10Gy水平矩阵10例如。

顺时针旋转90°后,我们可以得到旋转后的灰度矩阵,相关的MAM和MEM如图所示第13页c(c)分别是。随后,利用新生成的MAM和MEM构造相应的MM。为了将这个新构造的MM与没有旋转的原始MM进行比较,我们还考虑了新MM的第71行。我们可以从图中看到13个根据图和13摄氏度MEM(1,7)=4,MEM(2,3)=2,MEM4用于描述新MM的第71行。

图13
图13

旋转图像及其生成的MAM和MEM。图中10×10灰度矩阵顺时针旋转90°10.b条生成的MAM。c(c)生成的MEM。

表4从图13亿,c(c)

与表相比,我们可以看到表中新MM的第71行4显然与原始MM相同。也就是说,通过使用MM和八种修改的基序,我们可以解决图像旋转的问题。

相似性度量

在本研究中,MM被提议用于描述图像的纹理和颜色特征。因此,我们只能计算MMs之间的距离来揭示相关图像之间的相似性。对于数据库中的每个模板图像,预先提取并存储其256×8大小的MM。本文中,与模板MM和查询MM相关的元素之间的距离由以下公式给出

$$D\left({\mathrm{MM}}_T\ left(i,j\ right),{\mathr{MM}_Q\ left \左(i,j \右)}\kern0.75em$$
(2)

其中MMT型(, j个)和MM(, j个)是模板MM和查询MM的各自元素。由于MM(, j个)计算平均灰度为j个,它实际上被设置为一个正整数或零。直觉告诉我们MM(毫米)T型(, j个)−毫米(, j个)   → 0,D类(毫米T型(, j个),毫米(, j个))→0。也就是说,相似的特征将导致更短的距离。相反,作为MM(毫米)T型(, j个)−毫米(, j个)   → ∞,D类(毫米T型(, j个),毫米(, j个))→1.也就是说,对比度越大,距离越大。因此,模板MM和查询MM之间的距离由

$$ {D}(D)_{\mathrm{MM}\mathrm{I}}\left({\mathr{MM}}_T,{\mathrm{MMneneneep}_Q\right)=\sum\limits_{I=0}^255}\sum\limits_{j=0}^7D\left$$
(3)

其中MMT型和MM分别是模板图像和查询图像的motif矩阵。随后,模板图像和查询图像之间的相似性定义为

$$ {宋体}_{\mathrm{MM}\mathrm{I}\left(T,Q\right)=\frac{1}{1+{D}_{\mathrm{MM}\mathrm{I}\left({\mathr{MM}}_T,{\mathrem{MMneneneep}_Q\right)}$$
(4)

上述公式通过常规认知转换相似性。也就是说,距离越短,相似性越大,反之亦然。此外,它可以避免分母为0的问题。在图像检索领域,常用欧氏距离和余弦相似性作为评价方法;相应的公式由下式给出

$$ {D}(D)_{\mathrm{Euc}}\左({\mathr{MM}}_T,{\mathrem{MM}_Q\right)=\sqrt{\sum_{i=0}^{255}{\sum}_{j=0}^7{左$$
(5)
$$ {宋体}_{\mathrm{Cos}}\左({\mathr{MM}}_T,{\mathrm{MM}{_Q\right)=\frac{\sum_{i=0}^{255}{\sum}_{j=0}^7{\mathm{MM}}_T\左(i,j\右)\ast{\mathrem{MM{}_Q\left(i,j \右)}{\sqrt{\sum{i=0}^255}{\sum}{j=0}^7{\mathrm{MM}}_T{\left(i,j\right)}^2}\ast\sqrt{\sum_{i=0}$$
(6)

与欧几里德距离和余弦相似性相比,我们给出的评价测度不需要平方或平方根运算,很容易计算相似度。此外,我们的方法比它们更有效,因为与下面的实验部分中相对复杂的欧氏距离和余弦相似性相比,它可以获得更好的性能。我们的方法流程图如图所示14.

图14
图14

我们方法的流程图

4结果和讨论

在本节中,我们将在Corel图像数据集上实现用于图像检索的MMI方法[38,39,40],Brodatz纹理图像数据集[20,41,42]和WIPO全球品牌数据集[43,44],这是CBIR和商标搜索文献中使用最广泛的三个基准数据集。在我们的实验中,使用了由1000幅图像组成的Corel图像数据库Corel-1000来验证我们的方法的有效性。核心1000分为10类,即人类、景观、部门、公交车、恐龙、大象、花卉、马、山脉和食物,每类包含100幅图像。此外,为了实现旋转图像检索,每个图像都通过90°、180°和270°顺时针旋转进行处理。我们可以从表中看到5最终生成了总共4000张图像作为我们的数据集。Brodatz纹理图像数据集由990幅图像组成,分为110类。也就是说,每个类别包含9个图像。WIPO全球品牌数据集是知识产权数据的综合来源。它包含来自多个国家和国际来源的数万个品牌数据,并被广泛用于实证研究、报告和事实信息。随后,当输入查询图像(或商标)时,将根据相关相似性对反馈图像(或品牌)进行排序。

表5 Corel-1000和Corel-4000图像数据集的描述

准确度、召回率和F1-度量是信息检索领域的三个典型评估指标。在我们的实验中,所有这些都被用来评估我们的方法的有效性。精度定义为正确检索的图像数量之间的比率M(M)和检索到的图像总数D类召回定义为M(M)以及图像的总数A类在每个预定义类别中。随后,精度,召回R(右),和F1-测量值由下式给出

$$P=月/日$$
(7)
$$R=M/A$$
(8)
$$\mathrm美元{F} 1个-\mathrm{measure}=\frac{2\倍P\倍R}{P+R}$$
(9)

在我们的实验中,从Corel-4000数据集查询图像的每个类别中随机选择40幅图像。对于每个查询图像,我们首先计算召回率和相应的精度。随后,针对这400个随机选择的查询图像,获得召回率和平均精度对。15显示了将我们的相似性度量方法与欧几里德距离和余弦相似性方法进行比较的实验结果。

图15
图15

执行三种相似性度量方法时的召回率与平均精确度的结果

我们可以从图中看到15我们的方法比欧几里德距离和余弦相似性方法性能更好。注意,尽管这两种方法被广泛用于度量相似性,但我们的方法更合适,并取得了更好的性能。这是因为公式(2)规范了MM之间的距离,并且公式中考虑了有效分母。

为了揭示我们的MMI方法的性能,我们将其与包括SED在内的最新图像检索方法进行了比较[34]、HSVH[29]、CCM[30]、DBPSP[32],MCMCM公司[31]和MCMCM&DBPSP[33]. 在接下来的实验中,图16和相对于第一个的平均精度-N个图中百分比17两者都被用来深入证明MMI的有效性。

图16
图16

平均准确率和召回率对的比较

图17
图17

平均精度与第一精度的比较-N个百分比

从图16我们可以看到,对于每个算法,平均精度都随着召回率的提高而降低。与SED、HSVH、CCM、DBPSP、MCMCM、MCMCM&DBPSP相比,我们的MMI方法实现了最佳性能。对于后六种算法,当召回率为0.1时,SED性能相对较好,平均精度为0.800。相比之下,MMI的平均精度为0.907。当召回率达到1时,MCMCM在后六种算法中的平均精度为0.224,表现相对较好。通过比较,MMI的平均精度为0.323。对于其他召回,即0.2到0.9,MMI达到了更好的平均精度,并且性能优于其他六种算法。在图中17,我们通过比较第一种算法的平均精度来评估这七种算法-N个每个类别中的百分比图像。我们可以从图中看到17实验结果清楚地表明,对于每个类别的前10–100%图像,MMI明显优于其他六种算法。具体来说,MMI、SED、HSVH、CCM、DBPSP、MCMCM和MCMCM&DBPSP的前10%图像的平均精度分别为0.916、0.821、0.771、0.753、0.439、0.794和0.761,并且当第一次-N个百分比达到100%,相应的平均精度分别为0.589、0.519、0.480、0.467、0.285、0.509和0.472。

此外,鉴于召回值在0.1到1.0之间,我们计算了相应的平均精度,并计算了每个类别的F1-度量值,如下表所示6.

表6 F1测量值的比较

我们可以从表中看到6我们的MMI方法在包括人类、恐龙、大象和花卉在内的四个类别中实现了最佳的F1测量。尽管对于其他类别,MMI无法获得最佳性能,但就表最后一行所示的平均F1度量值的评估而言,它仍比其他六种算法表现更好6.

为了进一步揭示我们提出的方法的优越性,在随后的实验中应用了标准的Brodatz数据集。具体来说,我们从Brodatz数据集的每个类别中选择查询图像。然后使用召回率1计算相应的精度。也就是说,当九个对应的图像都检索到相关类别时,我们计算精度。在表中7通过平均精度,将我们的MMI方法与SED、CCM、DBPSP、MCMCM以及MCMCM和DBPSP进行了比较。

表7 Brodatz数据集的平均精度比较

注意,HSVH[29]基于HSV颜色空间,Brodatz数据集中的图像都是灰度级的png格式,无法转换为HSV色彩空间。鉴于此原因,所提出的MMI方法仅与SED、CCM、DBPSP、MCMCM以及MCMCM和DBPSP进行比较。我们可以从表中看到7我们的MMI方法在最高平均精度方面取得了最佳检索性能。

为了直接显示检索结果并揭示所提方法的性能,在Corel-4000数据集中,我们从每个类别中随机选择一幅图像作为查询。然后计算查询图像和数据库中图像之间的相似度。返回的图像按照相似性的降序排列。图中显示了八个示例的图像检索18,19,20,21,22,23,24,以及25.

图18
图18

基于Corel-4000图像集的人类图像检索

图19
图19

Corel-4000图像数据集上的科室图像检索

图20
图20

基于Corel-4000图像数据集的恐龙图像检索

图21
图21

Corel-4000图像数据集上的大象图像检索

图22
图22

Corel-4000图像集上的花卉图像检索

图23
图23

基于Corel-4000图像数据集的马匹图像检索

图24
图24

Corel-4000图像数据集上的食品图像检索

图25
图25

Corel-4000图像数据集上的景观图像检索

来自图18,19,20,21,22,23,24,以及25我们可以看到,在Corel-4000数据集上测试了八个图像检索示例。对于每个查询,排名前48位的图像将根据它们的相似性进行排序。在每个查询返回的48幅图像中,前四幅反馈图像是原始图像及其对应相似度为1的三幅旋转图像。请注意,四幅图像的每个序列具有相同的相似性。这是因为尽管每个图像都顺时针旋转90°、180°和270°,但由颜色和纹理特征组成的MMs保持不变。此外,尽管相似的纹理和颜色特征可能分散在返回图像的不同位置,但由于生成的MMs计算每种图案共享相同平均灰度的次数,因此也可以获得这些相似的图像。因此,这种检索策略更接近于人类对基于内容的图像检索的理解。从结果来看,人类、部门、恐龙、大象、花卉、马和食物类别的检索精度优于景观类别。具体来说,前7个查询的前48个检索图像完全相关。然而,对于第八次景观查询,返回了一些不准确的图像,例如关于山脉的系列2和关于部门的系列7和系列11。通过进一步分析这些结果,我们发现尽管它们来自不同的类别,但由于MMs的相似性,它们的颜色和纹理确实与查询图像相似。

在最后的实验中,为了模拟商标检索,在WIPO全球品牌数据集上实现了该方法,以进一步揭示其性能。选取六幅典型的商标图像作为查询图像,计算每个查询商标与数据库中商标的相似度。返回的商标按照相似性的降序排列。商标检索的六个示例如图所示26.

图26
图26

商标检索的六个例子。查询图像“m”的商标检索。b条查询图像“三菱”的商标检索。c(c)查询图像“w”的商标检索。d日查询图像“华为”的商标检索。e(电子)查询图像“MI”的商标检索。(f)查询图像“ip”的商标检索

我们可以从图中看到26在WIPO全球品牌数据集上进行了六个商标检索示例。对于每个查询商标,根据相似性对前九个返回的商标进行排名,这九个商标都是与相应查询相关的视觉。此外,尽管一些局部形状与查询商标中的原始形状相比发生了旋转,即图中返回的第四到第九个商标第26页,图中第三个返回的商标第26页,以及图中第一个返回的商标第26页,并用该方法进行了反演。简而言之,该方法可以找到与其查询相似的商标。此外,还可以检索旋转后的相似形状。也就是说,我们的方法可以作为实现商标检索的有效工具,从而保护注册商标的合法权益。

5结论

在本研究中,首次提出了八种新颖的基序来描述图像每个2×2网格中的所有纹理。随后,构造了两个基于主题的矩阵,即MAM和MEM,分别描述图像的颜色和纹理特征。此外,在推理方面,我们综合了结构方法和统计方法的优点。也就是说,MAM和MEM被进一步映射到MM,以解决旋转图像检索的问题。从MM的角度来看,这样一个256×8的矩阵融合了彩色和纹理特征,描绘了原始图像与其旋转图像之间的一致特征。为了有效地度量图像之间的相似度,使用了一种归一化的评价方法来计算模板MM和查询MM之间的相似性,实验结果表明,我们的归一化评价方法优于传统的欧氏距离和余弦相似性。随后,将提出的MMI与Corel图像数据集上的SED、HSVH、CCM、DBPSP、MCMCM、MCMCM&DBPSP进行了比较,并与Brodatz纹理图像数据集(由于HSVH基于HSV颜色空间,因此无法在Brodatz数据集上执行,因为这些数据集都是灰度图像的png格式)上的SED、CCM,DBPSP,MCM,MCMCM&DBPSP,实验结果证明了该方法的优越性。为了直接显示检索结果,在Corel数据集上测试了8个例子,在WIPO全球品牌数据集上测试了6个例子,实验结果证明了我们的方法在CBIR和商标检索中的有效性。

缩写

以前:

灰色升序

CBIR公司:

基于内容的图像检索

CCM(中央控制模块):

颜色共生矩阵

DBPSP公司:

扫描图案像素之间的差异

高铁车辆:

色调、饱和度、值

HSVH:

HSV直方图

MCMCM公司:

改进的彩色图案共生矩阵

MEM(机械工程师):

母题过量矩阵

月:

Motif矩阵

货币市场指数:

Motif矩阵推理

MULT公司:

最小左上三角

SED公司:

结构元素描述符

工具书类

  1. B Julesz,文本,纹理感知的元素及其相互作用。自然290(5802), 91–97 (1981)

    第条 谷歌学者 

  2. B Julesz,《文本梯度:文本理论重温》。生物、网络。54, 245–251 (1986)

    第条 谷歌学者 

  3. AWM Smeulders等人,早期基于内容的图像检索。IEEE传输。模式分析。机器。智力。22, 1349–1379 (2000)

    第条 谷歌学者 

  4. 刘毅,张德良,陆庚,马维英,基于内容的高层次语义图像检索研究。模式识别。40(11), 262–282 (2007)

    第条 谷歌学者 

  5. G Michele,Z Bertrand,《身体颜色集:紧凑可靠的图像表示法》。视觉杂志。Commun公司。图像表示。22(1), 48–60 (2011)

    第条 谷歌学者 

  6. W Song,Y Zhang,F Liu,Z Chai,SC Park,利用基于多区域的对角纹理结构描述符进行图像检索。专家系统。申请。96(15), 347–357 (2018)

    第条 谷歌学者 

  7. A El-ghazal,O Basir,S Belkasim,基于不变曲率的傅里叶形状描述符。视觉杂志。Commun公司。图像表示。23(4), 622–633 (2012)

    第条 谷歌学者 

  8. F Ding,YJ Wang,JY Dai,QS Li,QJ Chen,使用输入输出数据滤波的输出非线性自回归系统的递归最小二乘参数估计算法。J.Franklin Inst。354(15), 6938–6955 (2017)

    第条 数学科学网 谷歌学者 

  9. ZH Zhang、WH Li、B Li、in信息保证和安全国际会议.基于分割的图像检索中颜色直方图的改进技术(西安,IEEE,2009),第381-384页

  10. SH Wan、PQ Jin、LH Yue、in国际图像和图形会议.一种基于颜色感知的有效图像检索技术(合肥,IEEE,2011),第1017–1022页

  11. CC Chang、WC Wu、YC Hu、in未来一代通信和网络国际会议专题讨论会.使用色差特征的基于内容的彩色图像检索系统(Sanya,IEEE,2008),第181-184页

  12. YY Wu、YQ Wu、in国际图像和信号处理会议.结合全局和局部形状特征的基于形状的图像检索(天津,IEEE,2009),第1-5页

  13. 阿德南、S居尔、M阿里、AH达尔新兴技术国际会议国际会议.使用图像中对象的几何形状进行基于内容的图像检索(伊斯兰堡,IEEE,2007),第222-225页

  14. XJ Qin、YH Yang、inIEEE计算机学会计算机视觉和模式识别会议.纹理图像检索中灰度光环矩阵(GLAM)的相似性度量和学习(华盛顿,IEEE,2004),第1-326页

  15. A Mosleh,Z Farzad,A Reza,在信号、电路和系统国际研讨会《使用Contourlet变换进行纹理图像检索》(Lasi,IEEE,2009),第1-4页

  16. BB Baharum,K Ullah,英寸信息技术前沿.基于DCT域量化直方图纹理特征的高效图像检索(伊斯兰堡,IEEE,2011),第89–94页

  17. XF Ding,H Jin,针对不确定数据的分布式天际线查询的高效渐进算法。IEEE传输。知识。数据工程。24(8), 1448–1462 (2012)

    第条 谷歌学者 

  18. XF Ding,X Lian,L Chen,H Jin,不确定数据流上天际线的连续监测。信息科学。184, 196–214 (2012)

    第条 谷歌学者 

  19. G Quellec,M Lamard,G Cazuguel,B Cochener,C Roux,通过提升的自适应不可分离小波变换及其在基于内容的图像检索中的应用。IEEE传输。图像处理。19(1), 25–35 (2010)

    第条 数学科学网 谷歌学者 

  20. S Murala,RP Maheshwari,R Balasubramabian,局部四模式:基于内容的图像检索的新特征描述符。IEEE传输。图像处理。21(5), 2874–2886 (2012)

    第条 数学科学网 谷歌学者 

  21. XF He,Laplacian正则化主动学习D-最优设计及其在图像检索中的应用。IEEE传输。图像处理。19(1), 254–263 (2010)

    第条 数学科学网 谷歌学者 

  22. M Flickner、H Sawhney、W Niblack、J Ashley、Q Huang、B Dom,通过图像和视频内容进行查询:QBIC系统。电脑类28(9), 23–32 (1995)

    第条 谷歌学者 

  23. A Pentland,RW Picard,S Sclaroff,摄影集:基于内容的图像数据库操作。国际期刊计算。视觉。18(3), 233–254 (1996)

    第条 谷歌学者 

  24. JR Smith,SF Chang,年第四届ACM多媒体国际会议记录VisualSEEk:一个完全自动化的基于内容的图像查询系统(Boston,ACM,1997),第87–98页

  25. WY Ma,BS Manjunath,Netra:导航大型图像数据库的工具箱。多媒体系统7(3), 184–198 (1999)

    第条 谷歌学者 

  26. T Gevers,AW Smeulders,Pictoseek:结合颜色和形状不变特征进行图像检索。IEEE传输。图像处理。9(1), 102–119 (2000)

    第条 谷歌学者 

  27. JZ Wang,J Li,G Wiederhold,SIMPLIcity:图片库的语义敏感集成匹配。IEEE传输。模式分析。机器。智力。23(9), 947–963 (2001)

    第条 谷歌学者 

  28. C Carson,S Belongie,H Greenspan,J Malik,Blobworld:使用期望最大化的图像分割及其在图像查询中的应用。IEEE传输。模式分析。机器。智力。24(8), 1026–1038 (2002)

    第条 谷歌学者 

  29. CH Su、HS Chiu、TM Hsieh国际电气与控制工程会议.基于HSV颜色空间的高效图像检索(四川,IEEE,2011),第5746–5749页

  30. CH-Lin,RT Chen,YK Chan,基于颜色和纹理特征的智能基于内容的图像检索系统。图像可视性。计算。27(6), 658–665 (2009)

    第条 谷歌学者 

  31. M Subrahmanyam,QM Jonathan Wu,RP Maheshwari,R Balasubramanian,用于图像索引和检索的修改颜色基序共生矩阵。计算。电气工程师。39(3), 762–774 (2013)

    第条 谷歌学者 

  32. SS Yu、SY Huang、YH Pan、HC Wu、in国际计算机会议专题讨论会。用于图像检索的简单主色提取和边缘谷直方图(台湾,IEEE,2010),第159-164页

  33. CH Lina,CC Chenb,HL Leeb,JR Liab,基于水平直方图的快速K-means算法,用于图像检索。专家系统。申请。41(7), 3276–3283 (2014)

    第条 谷歌学者 

  34. XY Wang,ZY Wang。一种基于结构元素描述子的图像检索新方法。视觉杂志。Commun公司。图像表示。24(1), 63–74 (2013)

    第条 谷歌学者 

  35. L Vincent,图像分析中的形态学灰度重建:应用和高效算法。IEEE传输。图像处理。2(2), 176–201 (1993)

    第条 谷歌学者 

  36. Bleau,LJ Leon,基于流域的分割和区域合并。计算。视觉。图像理解。77(3), 317–370 (2000)

    第条 谷歌学者 

  37. JB Kim,HJ Kim,高效图像分割的基于多分辨率的流域。模式识别。莱特。24(1), 473–488 (2003)

    第条 谷歌学者 

  38. D Xu,S Yan,D Tao,S Lin,HJ Zhang,用于人类步态识别和基于内容的图像检索的边缘fisher分析及其变体。IEEE传输。图像处理。16(11), 2811–2821 (2007)

    第条 数学科学网 谷歌学者 

  39. L Yang,R Jin,L Mummert,R Sukthankar,A Goode,B Zheng,M Satyanarayanan,视觉保持距离度量学习的增强框架及其在医学图像检索中的应用。模式分析。机器。智力。32(1), 30–44 (2010)

    第条 谷歌学者 

  40. XH Yang,LJ Cai,通过构建区域重要性指数实现基于区域的图像检索的自适应区域匹配。计算。视觉。8(2), 141–151 (2014)

    第条 谷歌学者 

  41. Y Ji,F Ding,混合时滞神经网络的多周期性和指数吸引性。电路系统。信号处理。36(6), 2558–2573 (2017)

    第条 数学科学网 谷歌学者 

  42. 李昕,马友友,于伟,利用双输出脉冲耦合神经网络进行几何非变异纹理检索。神经计算。24(1), 194–216 (2012)

    第条 谷歌学者 

  43. R Setchi,FM Anuar,商标相似性的多方面评估。专家系统。申请。65(1), 16–27 (2016)

    第条 谷歌学者 

  44. 李昕,朱德清,一种改进的SOM神经网络方法,用于AUV的自适应领导-跟随编队控制。IEEE传输。工业电子。65(10), 8260-8270 (2018)

下载参考资料

致谢

作者感谢编辑和审稿人对本文发表的考虑。

基金

本研究由国家自然科学基金(61673193)、中央高校基本科研业务费(JUSRP51635B、JUSRP1510)、中国博士后科学基金(2017M621625)、江苏省自然科学基金会(BK20150159)资助。

数据和材料的可用性

珊瑚图像数据集位于http://wang.ist.psu.edu/docs/related/.Brodatz纹理图像数据集位于http://sipi.usc.edu/database/database.php?volume=texturesWIPO全球品牌数据集位于http://www.wipo.int/branddb/en/

作者信息

作者和附属机构

作者

贡献

YX和WS参与了基序平均矩阵(MAM)、基序过度矩阵(MEM)和基序矩阵(MM)的设计,并起草了手稿。HZ、YY和TC为实验设计做出了贡献,监测了实验流行病,并参与了数据分析。所有作者最后都同意出版。

通讯作者

与的通信魏松.

道德声明

竞争性利益

作者声明,他们没有相互竞争的利益。

出版商备注

Springer Nature在公布的地图和机构关联中的管辖权主张方面保持中立。

权利和权限

开放式访问本文根据Creative Commons Attribution 4.0 International License的条款分发(http://creativecommons.org/licenses/by/4.0/),它允许在任何媒体上不受限制地使用、分发和复制,前提是您对原始作者和来源给予适当的信任,提供知识共享许可的链接,并指明是否进行了更改。

转载和许可

关于本文

检查更新。通过CrossMark验证货币和真实性

引用这篇文章

Xu,Y.,Song,W.,Yan,Y。等。利用motif矩阵推理进行旋转图像索引和检索。EURASIP J.高级信号处理。 2018, 62 (2018). https://doi.org/10.1186/s13634-018-0575-3

下载引文

  • 收到:

  • 认可的:

  • 出版:

  • 内政部:https://doi.org/10.1186/s13634-018-0575-3

关键词