跳到主要内容

基于聚类算法和移动设备颜色局部复杂度估计的蓝鲸背鳍照片识别

摘要

我们提出了一个用于移动设备的蓝鲸照片识别自动程序。所提出的技术在小波域中工作,以减少所提出算法的图像大小和处理时间,并通过边缘增强滤波器,保留蓝鲸的特征。此外,引入了一种基于局部图像复杂度估计的图像调色板缩减算法,以消除冗余颜色,从而减少分割过程中分类不良的像素数,并将移动设备的资源消耗降至最低。分割后的图像采用FCM(模糊C-均值)或K-均值算法,并结合本文提出的动态滤波,以提高获取图像的亮度和对比度,从而提高图像分割的性能。实验结果表明,该方法可以为蓝鲸图像的照片识别提供实时解决方案,并且可以为移动设备提供便携式电源。最后,所提出的方法对于移动设备中的光电id应用来说是简单、高效和可行的。

1介绍

在许多关于行为、生态学和生物学的人口研究中,个体识别是主要目标,通过捕获-再捕获模型可以估计其人口参数,并生成其社会结构模型[1]. 人工标记是特定物种个体的独特识别机制(即金属夹、纹身),但这种方法并不十分可靠,因为动物可能会移动或丢失标记[2,]. 为了解决其中一些问题,通过动物的自然标记对动物进行个体识别已成为研究某些动物种群的重要工具,并已应用于同样广泛的动物,如鲸鱼、蝠鲼和青蛙[4].

动物自然标记最常见的视觉识别方法之一是照片识别(photo-id)技术。这种对个人进行视觉识别的方法允许照片存储库生成个人的照片捕获历史记录[4]. 可以手动和可视化地检查这些存储库,以开发一组类和子类;然而,随着存储库中收集的图像数量的增加,人们无法处理候选人的视觉特征,以通过手眼查看是否与新照片一致,因此需要开发更快速、自动化的技术来比较上述获得的新照片[5]. 广泛使用的识别野生物种个体的照片识别技术采用了自然标记,如色素沉着图案,即猎豹皮毛上的斑点图案[6]或这些斑点在小熊猫体内的形态和分布[7]鲸类的鳍形或海豚鳍上的缺口[5,8]或其他特征,如疤痕,也可以识别[9]. 这种非侵入性技术使用从一定距离获取的图像,以尽可能少的干扰获得待识别和分类的自然标记[9]. 通过识别座头鲸尾鳍腹侧的色素沉着模式,研究人员早在20世纪70年代就首次使用了光电识别技术来识别大型鲸鱼[10]. 传统的匹配腹鳍表面照片的方法需要对数据集内和数据集之间的所有图像进行手动成对比较,这些图像通常非常大。这一过程需要大量的时间、精力和专业知识。此外,随着每个数据集的增长,所需的比较数量呈指数级增加。该系统对现场拍摄的新图像进行比较,以识别鲸鱼的品牌和尾鳍。由此,一些海洋动物的照片识别系统的实施速度不断加快[5,810]. 通过对数百幅图像进行视觉比较来搜索自然模式以找到个人身份容易出错[8,11]. 这是因为照片id是由一个人通过手动分割来执行的,其结果在确定个人的识别和分类中可能是假阳性或假阴性。因此,它首先是蓝鲸照片id的“经济”系统软件和硬件的设计者。

蓝鲸个体的识别仍然是通过将新照片与已知个体的目录进行比较来手动完成的。这个过程既繁琐又费力,需要投入额外的资源(人力消耗时间)来识别个人。为了完成这项任务,一种新的方法使用七种不同类型的自然形状的背鳍(图1)再加上侧翼不同的色素沉着设计[12]. 另一个类别包括照片中未定义的背鳍,其中的角度可能会使背鳍分类产生偏差。在这些情况下,照片暂时被归类为未定义照片,直到获得该特定个人的更好照片。一项新的适用于蓝鲸的焦点动物调查(Gendron,未发表的数据)要求对海洋中的焦点动物进行个体识别。由于时间是海上的一个重要变量,在重点个人随访中进行积极识别至关重要(即,了解个人是女性、男性还是青少年),而且用于照片识别设备的空间和计算机可用区域通常有限,因此缺乏新的照片识别程序。如今,各种用于动物照片识别的计算机系统都基于每个物种的独特特征。在这些系统中,每个新图像都需要预先进行手动预处理(即切割、提高图像的亮度和对比度),从而获得蓝鲸的最佳对比轮廓,但这也增加了处理时间、主观性和分割结果中的错误。面临的主要问题是孤立研究对象。

图1
图1

不同类型的背鳍[12]:带直边的三角形;b条三角镰刀形和弯曲平稳后退;c(c)直向上;d日明显,大小和形状不同,但表现出明显的恐惧;e(电子)镰刀形的向后弯曲;(f)钩形、大尺寸、高度向后弯曲;残废、大量损失或完全残废;小时不确定,未分类

计算机视觉系统中的分割过程不是一个小问题,因为蓝鲸的图像是在其自然栖息地中采集的,蓝鲸的颜色和形状与背景图像(即蓝鲸的彩色皮肤与海洋和/或天空的颜色)融合在一起。对于使用提供低对比度的标准相机或移动设备,照片中的角度变化、对象和相机之间的距离、灯光(环境条件)和阴影都是无法提供最佳分割的条件。为了克服这些缺点,开发了各种计算机辅助识别系统,以识别鲸目动物的背鳍或其他海洋哺乳动物的形状和轮廓[8,12]. 本文使用CICIMAR-IPN(墨西哥国立理工学院海洋科学跨学科中心)的研究人员提供的在墨西哥加利福尼亚湾西南部获得的蓝鲸照片目录,对建议的蓝鲸图像计算机辅助识别系统进行了测试。利用移动设备作为便携式计算机系统,生物学家和其他蓝鲸研究领域的研究人员可以很容易地使用光电id。值得一提的是,使用移动设备可以确保在采集图像的同一位置实时处理照片id,无需使用标准相机即可跟踪蓝鲸,并确保图像处理技术离线或使用云计算,因为互联网服务不可用在这个偏远地区。

该技术使用小波域和边缘增强滤波器来保留蓝鲸背鳍图像的细节,减少了图像大小和处理时间[13]. 此外,还引入了一种图像调色板减少算法来消除图像中的冗余颜色;这种降低是基于使用中值算法和标准差的局部图像复杂度估计[13]. 这种减少改进了分割过程,减少了分类错误的像素数,并将移动设备的资源消耗降至最低。用K-means方法得到分割后的图像[14]或FCM(模糊C均值)[15]算法结合了动态直方图滤波,提高了移动设备获取的图像的亮度和对比度,提高了图像分割的性能。拟议系统的低成本代表了蓝鲸光电id的可靠实时解决方案,减少了执行此任务所需的有效载荷或设备。最后,该技术简单、高效,适用于移动(智能手机和平板电脑)设备中的应用。

本文的其余部分组织如下。在节中2,给出了所提出的算法。章节显示了所提方法的性能结果。第节介绍了对结果和用作比较的其他方法的讨论4,我们在第节中得出结论5.

2材料和方法

蓝鲸图像的分割分为五个阶段(见图2). 第一阶段涉及通过不同的标准相机和移动设备获取RGB图像。在第二阶段,使用小波域中的带通滤波器来改善蓝鲸的边缘和轮廓,并减小图像大小,以确保减少方法的处理时间,它在原始图像的每个通道(R、G和B)中实现[13,16]. 在第三阶段,引入调色板减少方法来删除图像通道中包含的冗余颜色(减少存储和内存需求);使用中值算法和基于图像局部复杂度标准偏差的阈值来确定每个像素的量化[13]. 在第四阶段,提出了一种动态直方图滤波方法,以提高图像的亮度和对比度;它与标准FCM和/或K-means聚类算法相结合,以在分割过程中提供更大的鲁棒性。最后,在第五阶段,将处理后的R、G和B通道组合成单个分量,以获得最终分割。

图2
图2

建议方法框图

  • 第一阶段:图像数据库

    为了测试提出的方法,我们使用JPG格式的CICIMAR-IPN蓝鲸图像数据库。此数据库不是公开的,可以通过CICIMAR许可获得[12,Gendron,未发布数据]。这些图像是在它们的自然栖息地(非受控环境)中使用不同的移动设备获取的。我们还使用标准相机佳能EOS反射获取的图像[12]作为比较,当所提出的算法运行时,提供的工作条件和移动设备获取的图像质量不受所提出系统适用性的限制。描述了一些RGB蓝鲸图像,这些图像是由移动设备的相机采集的:索尼Xperia J,500万像素,带LED闪光灯和自动对焦功能的相机;索尼XperiaT2,1300万像素,高清视频录制功能(1080p)的相机;三星Galaxy S4,后摄像头CMOS,1300亿像素,前摄像头,200万像素,电动LED闪光灯自动对焦,和标准相机佳能EOS反射5毫米,带70-300远距物镜。

    图3
    图3

    来自CICIMAR-IPN数据库的图像。移动设备索尼Xperia J.获取的图像。b条由移动设备索尼Xperia T2获取的图像。c(c)图像由移动设备三星Galaxy S4采集。d日通过标准Cannon相机获取的图像

    从RGB彩色图像中,我们分离其颜色分量(R、G、B),并在每个分量中应用所提方法的下一阶段。我们还提到,在使用从RGB图像获得的灰度图像的情况下,直方图结果表明,组成灰度图像的对象(即海洋、天空和蓝鲸边缘)的强度之间没有太多差异,这使得分割过程更加困难。因此,我们选择使用RGB图像的通道,其中每个通道可以提供与图像中蓝鲸的对象和/或特征有关的进一步信息,以便区分蓝鲸外部的对象和(或)边缘。

  • 第二阶段:预处理

    提出了一个预处理阶段,以改进和/或消除采集到的图像中与背鳍检测相关的一些特征;其中一些特征如下:(a)姿势:蓝鲸在真实环境中获取的图像中的特征可能会因蓝鲸的处理(正面、侧面等)而发生变化,这可能导致蓝鲸的特征被遮挡,例如背鳍和色素沉着的皮肤;(b) 结构组件:场景中的海洋、天空和其他对象的形状、大小和颜色可能不同;(c) 位置:获取的图像受图像中蓝鲸的位置影响很大;(d) 遮挡:在真实环境中,蓝鲸可能被其他运动物体部分或完全遮挡;环境条件:图像高度依赖于环境条件,如天气条件和光照强度。

    在这一阶段,离散小波变换(DWT)用于描述蓝鲸图像中的纹理,因为它提供了多分辨率(MRA)分析,其空频特性在纹理分析和分类中表现出良好的精度,为图像提供了边缘和精细细节保护[13,16]. DWT将图像细分为几个频带,分别称为LL水平低通和垂直低通、LH水平低通与垂直高通、HL水平高通与垂直低通以及HH水平高通和垂直高通[13].

    由于圆Haar小波(CHW)具有原始图像的紧凑性和能量守恒特性,因此将其用于小波分析;它在特征提取应用程序中简单易行[16]. CHW可以分为两种类型:边缘提取类型可以使用1D Haar小波计算,角点提取类型可以用2D Haar小波进行。CHW的边缘提取可视为带通滤波器[16]. 在此阶段,应用1D Haar DWT进行边缘增强,然后使用2D Haar DWT来改善原始图像中蓝鲸的轮廓。

    处理后的图像是在小波分解过程中从LL子带中获得的。LL子带图像表示原始图像的低尺度,允许所提出的分割算法的处理时间显著减少。为了说明这一阶段,将处理后的R、G和B通道组合起来,以显示最终的边缘增强RGB图像。为了方便起见,图4显示了边缘增强图像的负片,以证明该方法可以改善蓝鲸背鳍和色素沉着皮肤(强度像素)的特征;海洋、天空和其他物体也得到了改善,但它们的强度变化可以区分蓝鲸身体和其他物体的强度,从而提供更好的图像分割。这可以通过比较原始图像和处理图像的负片图像来理解。

    图4
    图4

    第2和第3阶段获得的视觉结果。c(c)原始RGB图像。d日(f)预处理阶段获得的增强RGB图像。在调色板还原阶段获得的量化RGB图像。为了方便起见,这些图像被表示为负片图像

    在对蓝鲸身体进行边缘增强后,使用目标检测方法在图像中找到定义背鳍轮廓的点(像素),以便通过背鳍对蓝鲸进行分类。目标检测技术可分为两大类:基于特征的技术和基于图像的技术[17]. 基于特征的技术明确使用面部特征。蓝鲸的明显(视觉)特性,例如皮肤颜色和背鳍几何形状,可以在蓝鲸检测期间使用。在我们的例子中,使用标准的平移和/或旋转操作符来增强图像中定义背鳍轮廓的点(像素)。

  • 第三阶段:调色板减少

    图像的颜色量化是使用有限数量的颜色来表示图像的过程;它广泛应用于图像分割、图像检索和图像压缩[17]. 其目的是尽可能接近原始的全色图像。对于只能显示少数颜色的系统,此技术是必需的。例如,具有8位/像素帧缓冲区的系统只能显示256色。虽然各种现代系统都有24位/像素帧缓冲区,并且可以显示224 = 16777216色,颜色量化仍然适用于系统运行动画和用于高级图形应用程序的动画。它减少了存储需求并节省了通过网络传输图像的时间[17].

    该技术用于根据视觉图像内容(在我们的例子中,蓝鲸的轮廓和背景)调整颜色数量,以在算法运行时以及在原始图像和处理图像的加载和存储要求的情况下,将移动设备的资源消耗降到最低,降低数据传输网络的带宽[17]. 这种减少也改进了分割过程,减少了聚类部分分类不好的像素数(错误分类)。

    该量化技术基于使用中值算法和标准差的局部图像复杂度估计[13]. 使用预处理阶段获得的LL子带的子图像(R、G和B),使用3×3核计算每个通道的标准偏差[13],

    $${\sigma}_c=\sqrt{\frac{1}{n}{\displaystyle\sum_{i=1}^n{\left({x} _ i-\上划线{x}\右)}^2}}$$
    (1)

    哪里x个 是的值当前内核中的第个元素,\(上划线{x}=\frac{1}{n}{\displaystyle\sum{i=1}^n{x} _ i} \)是当前内核的平均值,并且n个 = 9是样本中元素的数量。

    将用于减少调色板的准则应用于每个3×3核,以以下方式获得量化的彩色图像,

    $$量化=\left\{\begin{array}{ll}{x}_{med},\hfill&{sigma}_{x_c}<T\hfill \\{}{x} c(c),\hfill&否则\hfill\end{数组}\right$$
    (2)

    其中量子化是量子化的核,x个 医学 是内核中包含的像素的中值,x个 c(c) 是内核中的中心像素,\({\sigma}{xc}\)是中心像素的标准偏差x个 c(c) ,T型 = σ c(c) (f) 是用于固定其值被认为是量化调色板的像素的阈值,以及 (f)  = 3是RGB图像分量数的权重因子。提出了中值算法来均匀中心像素的强度x个 c(c) 与当前核中的邻域一起获得量化的彩色图像。根据最佳量化结果,提出了3×3的核大小。

    所提出的颜色量化方法在几次迭代中进行,停止准则为\(\sqrt{\\left({x} c(c)-{xq}_c\右)}^2}=0\),其中x个 质量控制 是内核中的中心量化像素。图像量化实现为当前像素和量化像素之间的减法,即零;在我们的例子中,量化能级的数量是16。

    4克显示了在此阶段获得的量化RGB图像(作为负片图像)。比较经过处理(量化)的图像(图4克)根据图4我们观察到,所提出的调色板减少方法可以限制强度的数量,以尽可能接近原始图像来表示图像,减少了存储和内存需求,并提供了更好的分割过程,避免了像素的错误分类。对于通道R,在图4克,与图中40kb的原始大小相比,减少了2kb4a类,以及小时从图中48 kb的原始大小限制为4 kb4b个; 这意味着存储和内存需求减少了90%至91.66%,这可能提供一种实时解决方案,以节省网络上的图像传输时间。此外,通过在图的图像之间使用PSNR(峰值信噪比),量化图像的质量为22.04、30.45和27.89 dB第4天(f),PSNR值表明,在我们的应用中,所提出的量化技术在处理图像中提供了最佳质量,其中量化图像似乎具有良好的主观质量。最后,使用移动设备而不是笔记本电脑或其他计算机系统可以提供实时应用程序所需的便携性、电量消耗以及在密闭场所(如小船)的轻松操作。

  • 第四阶段:自适应分割算法

    图像分割是图像分析和计算机视觉中最重要的研究课题之一;它是指将图像细分为区域(簇)的像素共享公共属性的连接区域的过程。

    从CICIMAR-IPN数据库获取的图像具有不同的亮度和对比度参数,因此每个图像都呈现不同的空间和频率特征。当标准FCM[15,18]和K平均值[14]算法被应用于两个数据区域(蓝鲸和背景)中的图像分割,几个像素被错误分类,导致了错误的分割,增加了这些算法的计算复杂度。

    基于这些原因,我们提出了动态直方图滤波FCM(DHFCM),它考虑了图像亮度和对比度的频率直方图的变化,以在分割过程中提供更大的鲁棒性。

    标准FCM定义如下[15,18]. X(X) = {x个 1, …, x个 n个 }是给定特征数据的集合(在我们的例子中,是蓝鲸的RGB像素强度),并让c(c)簇数(1<c<n)用模糊集表示C类 j个 (j个 = 1, …,c(c)). 然后,我们打电话U型 (f)  = (u个 ij公司 )模糊聚类划分X(X)如果\(显示样式{\sum}_{i=1}^n{u}_{ij}>0}\)j个{1, …,c(c)}和\(显示样式{\sum}_{j=1}^c{u}_{ij}=1}\){1, …,n个}保持。给定数据集的模糊聚类模型X(X)进入之内c(c)当聚类在上述两个约束条件下使目标函数(3)最小化时,聚类被定义为最优,

    $$ {J} _(f)\左(X;{U} f(_f),C\right)={\显示样式\sum_{i=1}^n{\显示类型\sum_{j=1}^C{u}_{ij}^m{\左\垂直{x} _ i-{c} _j(_j)\右\垂直}^2}}$$
    (3)

    其中参数m>1是称为fuzzifier的加权指数x个  − c(c) j个 2是与特征向量的欧几里得距离的平方x个 成为全班的中心c(c) j个 .目标函数J型 (f) 使用参数交替优化u个 ij公司 c(c) j个 (隶属度和聚类中心),通过设置J型 (f) 关于等于零的参数(考虑到上面建立的约束)。形成FCM算法的两个迭代步骤的结果方程如下所示:,

    $$ {u}_{ij}=\压裂{{\left\Vert{x} _ i-{c} _j(_j)\right\Vert}^{-\frac{2}{m-1}}}{{\显示样式{\sum}_{k=1}^c{\left\Vert{x} _ i-{c} k(_k)\右\垂直}^{-\frac{2}{m-1}}}}$$
    (4)
    $$ {c} _j(_j)=\frac{{\显示样式{\sum}_{i=1}^n{u}_{ij}^m{x} _ i}}{{\显示样式{\sum}_{i=1}^n{u}_{ij}^m}}$$
    (5)

    标准FCM算法(3)的目标函数没有考虑任何空间信息,使得FCM对伪影和噪声非常敏感。为此,我们在分类过程中使用一种称为动态直方图(DH)的方法,将亮度和对比度的邻域信息纳入聚类算法中。该算法提高了具有不同特征的图像的亮度和对比度,这些图像的直方图呈不变的高斯分布,

    $$\mathrm{D}\mathrm{H}={\theta}_{DH}=\left\{begin{array}{l}{overline{x}}_D,\kern1em{x} _ i\le{\overline{x}}_d\kern0.5em\mathrm{和}\kern05em{\mathrm{cov}}_{XY}<0\\{}{x} _ i,\kern1em\mathrm{否则}\end{array}\right$$
    (6)

    哪里\({上划线{x}}_d=\frac{1}{n}{\displaystyle\sum{i=1}^n{x} _ i} \)是3×1滑动窗口中的平均值,\({\operatorname{cov}}_{XY}=\frac{1}{n}{\displaystyle\sum_{i-1}^n\Big({x} _ i}-\上划线{x}\大)\左({y} _ i-\上划线{y}\右)\)是协方差,x个 代表-滑动窗构件, 表示直方图中的当前元素,\(\上划线{y}\)表示直方图的平均值,以及n个 = 三。

    平均值和协方差值显示了使用该标准的滑动窗口中强度值的线性相关性(6)。因此,根据DH的分布,图像中的高亮度和对比度值被一致的值所改变。因此,我们可以说,所提出的DH算法消除了采集图像中高对比度光照值引起的脉冲噪声。

    然后,我们可以使用提出的DH作为标准FCM算法像素的亮度和对比度的估计器,以改进由于图像中呈现的不同结构成分和环境条件而导致的分割过程。在此基础上,我们可以将建议的DHFCM中要最小化的新目标函数定义为,

    $$ {J} g(_g)\左({\varTheta}_{\mathrm{DH}};{U} f(_f),C\right)={\显示样式\sum_{i=1}^n{\显示类型\sum_{j=1}^C{u}_{ij}^m{\left\Vert{\theta}_{\mathrm{DH}}-{c} _j(_j)\右\垂直}^2}}$$
    (7)

    哪里Θ DH(决断高度) = {θ DH(决断高度)|1, …, n个}是一个向量,DH估计器应用于图像的强度特征向量。

    由于坡度J型 关于u个 ij公司 c(c) j个 当达到局部最优时消失,并且考虑到目标函数最小化的条件,很容易证明U型 (f) C类由给出,

    $$ {u}_{qj}=\frac{{left\Vert{theta}_{mathrm{DH}}-{c} _j(_j)\right\Vert}^{-\frac{2}{m-1}}}{{\displaystyle{\sum}_{l=1}^c{\left\Vert{\theta}_{\mathrm{DH}}-{c} _l(l)\右\垂直}^{-\frac{2}{m-1}}}}$$
    (8)
    $$ {c} _j(_j)=\frac{{\显示样式{\sum}_{i=1}^n{u}_{ij}^m{theta}_{\mathrm{DH}}}}}{\displaystyle{\sum}_{i=1}^n{u}_{ij}^m}}$$
    (9)

    建议的DHFCM算法的参数设置为 = 聚类部分的ε=1e−4(随机初始化)。我们找到了最大迭代次数的最佳参数T型 = 20; 它是从不同分割图像的迭代平均值中获得的,以确定接近阈值ε=1e−4的最佳值。簇数c(c)取决于要分割的图像,但在我们的示例中,它被设置为2(蓝鲸和背景)。最后,提出的分割方法只使用常量,使得该方法对于该应用程序来说简单、高效且可行。

    为了减少聚类部分(分割阶段)分类不好的像素数,我们建议将所提出的DH方法与标准K-means聚类算法结合使用。这种新方法称为动态直方图K-means(DHKM)。K均值的理论基础可以在[14]. 最后,图5显示了通道R中的分割结果(图5a级c(c))使用标准KM、标准FCM和建议的DHFCM,可以看出,与标准方法相比,建议的方法似乎具有更好的主观质量。

    图5
    图5

    视觉分割结果。从量化阶段获得的信道R的分段图像(见图。4克).使用标准KM算法分割图像。b条使用标准FCM算法分割图像。c(c)使用所提出的DHFCM算法分割图像。分割的图像(二进制图像):d日使用标准KM分割图像,e(电子)使用标准FCM分割结果,以及(f)用提出的DHFCM算法分割图像。移动设备获取的其他图像的结果:,小时索尼Xperia J获得的图像,SonyXperiaT2采集的图像,以及j个基于DHFCM算法的图像分割

  • 阶段5:最大限度地减少分类错误的像素数量。

    从RGB图像中,独立R、G和B通道的分割结果可能具有不同的像素,这些像素的值在其他簇中分类不正确,从而在三个通道之间提供了不正确的分割。因此,我们将这三个分量的分割图像组合在一起,使最终的分割图像具有单个灰度分量,以以下方式尽可能避免像素的不良分类,

    $$final \ segmented \ kern0.5em image=\ frac{R+G+B}{3}$$
    (10)

    哪里R(右),G公司,以及B类分别是在通道R、G和B的图像中获得的分割。

    应用以下准则获得最终的二值分割图像,其中只有两个簇(背景为黑色,蓝鲸为白色),

    $$binary\image=\left\{\begin{array}{ll}1,\hfill&final\segmented\kern0.5em图像<{\sigma}_c\hfill \\{}0,\hfirl&otherwill\end{array}\right$$
    (11)

    哪里最终分割图像从(10)和σ c(c) 是在3×3滑动窗口中计算的标准偏差(等式(1)).

    5天(f)显示了二进制图像它分别表示标准KM、标准FCM和建议的DHFCM分割算法的最终分割。从图中可以看出,提出的算法(见图第5页)与标准方法相比,显示出更好的主观质量。我们观察到,图中的像素分类不好5厘米在这一阶段进行了纠正,为蓝鲸和背景提供了良好的分类。最后,利用二值图像的结果,我们可以获得原始图像中蓝鲸及其背鳍的轮廓、边缘和特征,以便将这些数据用于分类过程。

结果

CICIMAR-IPN摄影目录包含771幅数字RGB彩色图像格式的图像,其中621幅是用佳能相机采集的,150幅是用不同的移动设备采集的。在这个目录中,57.2%的图像对应于蓝鲸的两侧,23.8%和19.0%分别属于蓝鲸的右侧和左侧。为了进行分析,我们只考虑了背鳍分为三角形、钩形和镰状的蓝鲸图像的分割和分类。将这些提出的方法的性能结果与作为基本事实的第一个人类观察者的手动分割进行比较。此外,将第二个人观察者与地面实况图像进行比较,可以提供一个被视为最佳性能水平的性能度量。地面实况图像由CICIMAR-IPN提供。

提出的DHFFCM和DHFKM算法在具有双核处理器、1.2 GHz CPU速度、Android Jelly Bean OS 4.1和9 GB内存的平板电脑上实现,开发软件是环境可视化的Android。6显示了处理建议应用程序(App)时使用的图形用户界面(GUI)。此图显示了用于移动设备的拟议应用程序的主屏幕和通过不同选项访问拟议应用程序(用于图像采集的CAMERA、用于上传采集或处理的图像的FILES、用于对photo-id执行图像分割的images以及用于退出拟议应用程序)的主菜单,以及图像分割。

图6
图6

拟议应用程序的GUI。主屏幕。b条主菜单。c(c)分割的图像

在测试期间,考虑了四个分类案例。这两种分类是真阳性(TP)和假阳性(FP),两种错误分类是假阴性(FN)和真阴性(TN)。通过使用这些指标,我们可以获得不同的性能度量,如[19],

$$Sp=TN/\left(TN+FP\right)$$
(12)
$$Se=TP/\左(TP+FN\右)$$
(13)
$$Acc=\left(TP+TN\right)/number\kern0.5em of \pixels\kern05em in \image$$
(14)
$$Si=\kern0.5em 1\hbox{-}\frac{\sqrt{{\left(1-Acc\right)}^2\kern0.5em+{\lert(1-Se\ right){^2}}{\sqrt{2}}$$
(15)

在我们的案例中,特殊性(服务提供商)是检测非蓝鲸像素的能力,灵敏度()反映了探测蓝鲸边缘的能力、准确性(Acc公司)是确定的蓝鲸像素为真正的概率,以及相似性()将分割图像的结果与地面真实图像进行比较。我们还计算了熵和纯度。熵是一种度量,用于了解群相对于既定类的分散性。因此,如果所有簇都由只有一个类标签的对象组成,则熵为0。然而,随着集群中对象的类标签变得更加多样化,熵也会增加[20],

$$熵=-{\displaystyle\sum_j{p}_{ij}\log\左({p}_{ij}\右)}$$
(16)

哪里j个代表每个集群第页 ij公司 是集群成员的概率j个属于类.

纯度量化了簇包含属于该部分的实体的程度;定义如下:每个簇中的纯度j个计算为\(\mathrm{纯度}=\frac{1}{nj}\max\left({n} _j(_j)^i \右)\),其中\( {n} _j(_j)^i \)是群集中的对象数j个带有类标签.

表格1,2,以及从相似性(Si)、特异性(Sp)、敏感性(Se)、准确性(Acc)、熵(熵)、纯度(纯度)和用于计算所提算法的处理时间(PT)(以秒为单位)方面显示三角形背鳍、钩形背鳍和镰状背鳍分割的性能结果。我们还给出了用所提出的算法获得的最大值、最小值、中值和标准偏差。从这些表中,我们观察到性能结果是由于翅片类型的性质和获取图像时的环境条件造成的。我们在表格中也提到了这一点1,2,以及,使用移动设备获取的图像用星号标记。通过比较使用建议的DHFCM和DHKM聚类算法获得的性能标准,我们发现:

表1三角背鳍分割的性能结果
表2钩状背鳍分割的性能结果
表3镰状背鳍分割的性能结果

(a) 在大多数情况下,DHFCM改进了使用DHKM聚类算法获得的结果(见表1,2,以及). 例如,三角鳍的分类精度为91.69至98.97(DHFCM)和90.24至99.04(DHKM);钩鳍分类为88.19-98.29(DHFCM)和87.33-98.26(DHKM);镰状鳍的分类范围为89.61至97.56(DHFCM)和88.02至98.05(DHKM)。

(b) 在相似性平均值(Si)和计算成本(PT)的情况下,我们发现三角鳍的分类(见表1)与DHKM(Si=94.50%,PT=5.2040s)相比,DHFCM(Si=9.474%,PT=13.5754s)提供了更好的结果;钩鳍分类(见表2)DHFCM(Si=93.50%,PT=15.4775 s)提高了DHKM的结果(Si=9.3.28%,PT=6.0702 s);最后,在镰状鳍分类的情况下(见表)DHFCM(Si=92.42%,PT=14.8512s)的结果比DHKM(Si=92.83%,PT=5.0486s)的最差。换言之,与DHFCM相比,DHFCM的Si性能从Si的−0.40变为0.24%,而PT的变化有利于DHKM,从8.3714变为9.8026 s;正是DHKM提供了从5.0486到6.0702秒的PT,这表明所提出的方法有可能为蓝鲸图像的照片id(分割和分类)提供实时解决方案,并且它可以为智能手机和平板电脑等移动设备提供可运输和便携式电源。

(c) 移动设备和标准相机采集的处理图像在所提方法的性能上几乎没有差异。在这种情况下,工作条件和通过移动设备获取的图像的质量不限制该方法的适用性。

我们还使用接收机工作特性(ROC)曲线通过绘制Se和Sp来说明分类器的性能。测试精度的分类如下:如果面积值在0.5到0.7之间,则精度较低;如果在0.7到0.9之间,则精度平均较高;如果该值大于0.9,则测试的准确性较高[21]. 在图中7,给出了用ROC曲线表示的所提方法的实验结果。第7页显示了使用DHFCM和DHKM方法的分割性能的高精度。最佳结果是钩形鳍的值为1,其次是三角形鳍和镰刀形鳍,其值分别为0.99和0.98。ROC曲线(图7亿)显示了缩放直方图,其中三角形和钩形鳍的性能最佳,镰状鳍的值为1和0.98。ROC曲线下的总面积是衡量测试性能的单一指标。AUC结果来自ROC曲线。对于三角形背鳍,DHFCM和DHKM的AUC值分别为0.9750和0.9320;对于钩状背鳍,DHFCM和DHKM的AUC值分别为0.9208和0.9180;最后,对于镰状背鳍,DHFCM和DHKM的AUC值分别为0.9043和0.9030。从AUC结果来看,DHFCM提供了比DHKM更好的结果。此外,我们观察到三角形翅片的结果比其他测试中获得的结果要好;这取决于分析特定类型背鳍结果的人的抽象层次。

图7
图7

性能ROC曲线提出的算法。镰状鳍、钩状鳍和三角形翅片。b条缩放曲线ROC(8a)

4讨论

我们将我们的建议与文献中最近发表的两种在图像中检测鲸鱼的方法进行了比较。一种检测露脊鲸的方法[22]实现了一个用于预测的卷积神经网络,该网络需要多达40000层,训练精度达到68%。该方法提出通过从上方拍摄的鲸鱼背部图像来检测右鲸鱼。另一种方法称为达尔文[23]检测背鳍的准确度高达84%;该方法使用直方图的阈值方法。这种技术的缺点是神经网络需要大量的输入数据来训练和分类数据。

这些方法不是为了检测单个鲸鱼,而是为了检测任何类型的鲸鱼。标准FCM算法也用于根据表验证拟议应用程序的性能1,2,以及和图5例如,使用标准FCM可以提供高达70%的相似性,处理时间为367.4680秒。在从标准FCM获得的分割结果中,属于海洋的某些部分没有被完全去除,蓝鲸的一些部分可能与海洋(背景)混淆,导致蓝鲸的分类不好。该应用程序的优点是,它不需要使用特殊的摄像机来获取图像,也不需要计算更复杂的算法,如[22,23],并且不需要大量数据来训练和分类处理后的图像,使得所提出的算法可以在移动设备等标准设备中实现,如第节所示2在三角鳍检测的情况下,所提出的方法对DHFCM和DHKM的精度分别为98.9790%和99.0469%;对于钩鳍检测,DHFCM和DHKM的准确率分别为95.49%和95.30%;对于镰状鳍的检测,DHFCM和DHKM的准确度分别为97.5681和98.0593%(见表1,2,以及). 此处显示的结果表明,当前提案的结果比[22]结果为15%[23]. 在[10]文中还讨论了其他方法在鉴定粉红海豚时的准确率为55%,鉴定精子时的准确度为97%。对于这些情况,该算法对粉红海豚的准确率超过40.30%,对抹香鲸的准确率达到2.046%。该应用程序的计算成本较低,因此可以使用移动设备作为便携式计算机系统,为蓝鲸的分割和分类(photo-id)提供实时解决方案。照片匹配是在采集图像的现场进行的,因此无需使用在线图像处理技术或云计算即可提供个体蓝鲸信息。

5结论

本文提出的算法包括两种新的聚类方法DHFCM和DHKM;他们使用简单易行的技术,如DWT和减少调色板,以提供背鳍到照片id的分割和分类所需的鲁棒性。图像分割的主题是一个备受争议的话题,也是一个悬而未决的问题,因为即使使用相同的设备拍摄图像,每个图像也具有不同的特征。这就是为什么,这项工作的主要贡献是,蓝鲸的每一张图像都有不同的特征,因为拍摄角度和蓝鲸皮肤上的光的入射率取决于拍摄时间照片以及场景中可能包含的具有高度随机性的单个物体或动物。因此,这里提出的技术有助于消除蓝鲸实际图像中出现的意外视觉伪影。为了测量本文提出的算法的性能,对不同类型的相机进行了不同的测试,以验证系统的简单性和便携性,并验证在使用不同类型相机(加农炮和移动设备的相机)进行的每次测试中获得的准确度以最好的回报保存下来。移动设备上的照片识别系统是该领域研究人员的另一种便携式设备,可以快速识别栖息地中的蓝鲸;该系统是一个双重工具,可以从计算机或移动设备上运行,从而帮助进行照片识别。由于DHFCM和DHKM易于操作和预处理在蓝鲸栖息地获得的图像,因此这两个新提案是移动设备的可行应用程序,在移动设备上运行的某些进程受到电池和内存等公平性的限制。最后,该提议应用程序使用便携式计算机等移动设备为蓝鲸照片识别提供了实时解决方案。

工具书类

  1. KA Walker、AW Trites、M Haulena、DM Weary,《不同标记和标记技术对海洋哺乳动物影响的综述》。威尔德。物件。39, 15–30 (2012). http://dx.doi.org/10.1071/WR10177

    第条 谷歌学者 

  2. RG Harcourt、E Turner、A Hall、JR Wass、M Hindell,捕获压力对自由活动、繁殖活跃的雄性威德尔海豹的影响。J.公司。生理学。神经乙醇。感觉神经。行为。生理学。196, 147–154 (2010). 数字对象标识:2007年10月7日/00359-009-0501-0

    第条 谷歌学者 

  3. CJA Bradshaw、RJ Barker、LS David,新西兰毛皮海豹幼崽标签丢失建模。农业杂志。生物环境。斯达。5(4), 475–485 (2000). 数字对象标识:10.2307/1400661

    第条 数学科学网 谷歌学者 

  4. CW Speed,MG Meekan,CJA Bradshaw,使用信息理论找出匹配的野生动物照片识别。前面。Zool(动物园)。4(2), 1–11 (2007). 数字对象标识:10.1186/1742-9994-4-2

    谷歌学者 

  5. Whitehead H.,《精子鲸豚的计算机辅助个体识别》,主编:Hammond P.S.、Mizroch S.A.和Donovan G.P.,第12期,第71-78页,(1990年)

  6. MJ Kelly,使用个人识别进行研究的计算机辅助照片匹配:塞伦盖蒂猎豹的一个例子。哺乳动物杂志。82(2), 440–449 (2001). 数字对象标识:10.1644/1545-1542(2001)082<0440:CAPMIS>2.0

    第条 谷歌学者 

  7. S Shrestha、KB Shah、D Bista、HS Baral,《个体小熊猫的摄影鉴定》(Ailurus fulgens Cuvier,1825)。申请。生态。环境。科学。(1), 11–15 (2015). DOI:10.12691/aees-3-1-3.9

    谷歌学者 

  8. GR Hillman,Bürsig,GA Gailey,N Kehtarnavaz,A Drobyshevsky,BN Araabi,HD Tagare,《计算机辅助海洋脊椎动物个体光识别:多物种系统》。水上运动。哺乳动物。j。29(1), 117–123 (2003). 数字对象标识:10.1578/016754203101023960

    第条 谷歌学者 

  9. J Alessi,M Aïssi,C Fiori,地中海西北部抹香鲸的照片鉴定:对自然标记的评估。水上运动。保存。3月弗莱什瓦特。生态系统。24(1), 11–22 (2014). 数字对象标识:10.1002/aqc.2427.11

    第条 谷歌学者 

  10. SK Katona、B Baxter、O Brazier、S Kraus、J Perkins、H Whitehead,通过侥幸照片识别座头鲸。行为。海洋动物。, 33–44 (1979). 数字对象标识:10.1007/978-1-4684-2985-5_2.11

    第条 谷歌学者 

  11. E Niest、D Burns、P Harrison、Fluke matcher:座头鲸计算机辅助匹配系统(巨翅目)侥幸。3月7日。科学。26(3), 744–756 (2010). 数字对象标识:10.1111/j.1748-7692.2009.00368.x号

    谷歌学者 

  12. D Gendron,A Ugalde De La Cruz,简化蓝鲸照片识别技术的新分类方法。鲸类资源管理杂志。12(1), 79–84 (2012)

    谷歌学者 

  13. BE Carvajal-Gamez,FJ Gallegos-Funes,AJ Rosales-Silva,基于颜色局部复杂度估计的隐写术(CLCES)方法。专家系统。应用。40, 1132–1142 (2013). 数字对象标识:2016年10月10日/j.eswa.2012.08.024

    第条 谷歌学者 

  14. AK Jain,《数据聚类:超越K-means 50年》。模式识别。利特。31, 651–666 (2010). 数字对象标识:2016年10月10日/j.patrec.2009.09.011

    第条 谷歌学者 

  15. F Zhao,J Fan,H Liu,基于最优选择的带自校正非局部空间信息的抑制模糊C均值聚类算法,用于图像分割。专家系统。应用。41, 4083–4093 (2014). 数字对象标识:2016年10月10日/j.eswa.2014.01.003

    第条 谷歌学者 

  16. M Honma,T Nose,S Sato,用于沿任意方向提取边缘特征的光学Haar小波。选择。修订版。7(一) 2000年9月至13日。数字对象标识:10.1007/s10043-000-0009-x

    第条 谷歌学者 

  17. L Wu-Ja,L Ja-Chen,通过保留颜色分布特征进行颜色量化。信号。过程。78, 201–214 (1999). 数字对象标识:10.1016/S0165-1684(99)00060-2

    第条 谷歌学者 

  18. D Müjica-Vargas,F Gallegos-Funes,A Rosales-Silva,J De Jesus Rubio,用于彩色图像分割的鲁棒c-原型算法。EURASIP j.图像。视频。过程。63, 1–12 (2013). 数字对象标识:10.1186/1687-5281-2013-63

    谷歌学者 

  19. A Fathi,A Naghsh-Nilchi,基于小波的视网膜血管自动分割和血管直径估计。生物识别。信号处理。控制8, 71–80 (2013). 数字对象标识:10.1016/j.bspc.2012.05.005

    第条 谷歌学者 

  20. RM Aliguliyev,基于密度的聚类方法的性能评估。通知。科学。179, 3583–3602 (2009). 数字对象标识:10.1016/j.ins.2009.06.012

    第条 谷歌学者 

  21. D Faraggi,B Reiser,ROC曲线下面积的估算。统计医学。21, 3093–3106 (2002)

    第条 谷歌学者 

  22. Yurkov A.O.,ChernukhaI。V.,《鲸鱼的自动识别和识别,控制论的理论和应用方面》,59-69,(2015),ISBN 978-966-399-702-5

  23. S.Hale,DARWIN中从数字照片中自动提取海豚背鳍轮廓的无监督阈值,高级论文,2008

下载参考资料

致谢

这项研究由墨西哥国立理工学院和国家科学技术委员会资助,以帮助和支持第221284号项目。

基金

这项研究是在墨西哥国家科学技术委员会通过221284号项目提供的财政经济资助下进行的。

作者的贡献

BECG开展了有关复杂媒体图像处理和图像滤波新算法开发的研究,并参与了动态直方图滤波算法的开发。她参与了研究和开发的设计,这也有助于起草文章。DBTS开展了关于复杂介质中图像分类的数据聚类算法开发的研究,并参与了聚类技术研究的设计和开发,这也有助于起草本文。DG对蓝鲸的视觉识别进行了长达25年的研究,提出并验证了作为蓝鲸栖息地中蓝鲸识别和分类标准的特征,并帮助起草和更正了该文章。FJGF从事图像处理复杂介质研究和图像滤波新算法的开发,并参与了动态直方图和聚类滤波算法的开发。他在图像处理和模式识别方面具有丰富的经验,参与设计研究及其发展,并帮助起草、纠正和改进文章。所有作者阅读并批准了最终手稿。

竞争性利益

作者声明,他们没有相互竞争的利益。

作者信息

作者和附属机构

作者

通讯作者

与的通信布兰卡·E·卡瓦加尔·加梅斯.

权利和权限

开放式访问本文根据Creative Commons Attribution 4.0 International License的条款分发(http://creativecommons.org/licenses/by/4.0/),它允许在任何媒体上不受限制地使用、分发和复制,前提是您对原始作者和来源给予适当的信任,提供知识共享许可的链接,并指明是否进行了更改。

转载和许可

关于本文

检查更新。通过CrossMark验证货币和真实性

引用这篇文章

Carvajal-Gámez,B.E.,Trejo-Salazar,D.B.,Gendron,D。等。利用聚类算法和移动设备颜色局部复杂度估计,通过背鳍对蓝鲸进行照片识别。J图像视频处理。 2017, 6 (2017). https://doi.org/10.1186/s13640-016-0153-2

下载引文

  • 收到:

  • 认可的:

  • 出版:

  • 内政部:https://doi.org/10.1186/s13640-016-0153-2

关键词