摘要

Horn and Schunck(HS)光流模型不能保持运动估计的不连续性,特别是对于包含复杂纹理的图像序列,精度较低。为了解决这个问题,提出了一种改进的分数阶光流模型。特别地,在HS模型的亮度约束方程中应用了分数阶泰勒级数展开。分数阶流场导数也用于光滑约束方程。利用欧拉-拉格朗日方程最小化分数阶光流模型的能量函数。提出了二维分数阶微分掩模,并应用于模型简化计算。考虑到分数阶的时空记忆特性,该算法在保持光流场边缘不连续性的同时,提高了稠密光流场估计的精度。在Middlebury数据集上的实验证明了该算法的优势。

1.简介

自1950年吉布森提出光流以来,许多学者对其进行了研究。在这些研究中,霍恩和舒克提出的HS光流模型[1]1981年取得了较高的可靠性和准确性,因此开始受到越来越多学者的关注。但在图像序列中,HS光流模型的运动估计精度会大大降低,其中包括复杂纹理和非刚性运动;同时,运动估计的不连续性很难保持。

许多学者致力于修改或改进HS模型以提高准确性[2],处理大位移运动[],解决遮挡问题[4],并跟踪非刚性运动目标[5,6]. 所有这些模型都基于一阶微分技术。

Lv等人[7]在变分TV模型的Euler-Lagrange方程中增加了一个非线性四阶扩散项,改进后的模型可以保持突变不连续性,但当噪声过大时会恶化。Chan等人提出了一种用于图像去模糊和去噪的高阶全变分最小化方法[8]; 该模型可以在保留边缘不连续性的同时滤除噪声。但忽略了边缘的细节。

由于分数微分能够在突出图像边缘特征的同时保留平滑区域的纹理细节,以及它对目标点邻域的时空记忆,因此分数微分被应用于许多图像处理领域[9],如图像去噪[10],图像增强[11]、和运动估计[1216]. 在[12,13]HS光流模型中使用了分数阶平滑约束方程来保持运动估计的不连续性,但没有考虑像素强度的相关性。虽然可以在一定程度上保留图像的边缘不连续性,但光流场估计的精度不高。为了进一步提高运动估计的精度,本文提出了一种改进的分数阶光流模型。

本文的主要特点可以概括如下:(1)分数阶首次用于HS光流模型的亮度约束方程。(2)首次提出了一种用于计算双分数阶微分的二维分数阶微分掩模,并将其应用于改进的分数阶光流模型的简化。(3)结合欧拉-拉格朗日方程和二维分数阶微分掩模,构造了改进的分数阶光流模型光流场估计的迭代公式。

2.二维分数阶微分掩模的构造

本文中使用的分数阶理论的数学初衷可以在[17,18].

在本章中,给出了六个二维分数阶微分掩模。, ,,, ,,其中是分数阶微分的阶数。

我们定义作为对偶导数的二维分数微分掩模-轴。二维分数阶导数离散图像亮度函数-轴可以定义为

是遮罩尺寸,当:

同样,哪里,何时:也,哪里,,.何时,

更重要的是,我们可以,.

应在所有掩码项中进行规范化。有关双分数阶导数展开的更多详细信息,请参阅[12].

3.改进的分数阶光流模型

3.1. 分数阶光流模型

我们用分数阶泰勒级数展开替换HS模型的亮度约束方程,得到分数阶亮度约束方程为哪里是的缩写.

结合(2.19)和(2.20)英寸[12],我们可以得到本文中的分数阶光流模型:

3.2. 数值算法

欧拉-拉格朗日方程[19]本文应用于最小化能量函数.

经过简化,我们得到如下方程:哪里

经过一系列计算,所提出的分数阶光流模型的迭代公式最终可以写成哪里,表示点附近的光流矢量、和

使用高斯-赛德尔迭代法进行重复迭代后,可以获得精确的光流场,并且可以用中提到的方法证明算法的收敛性[13].

4.实验结果与分析

我们从以下三个方面进行了实验:先前测试的光流算法的性能比较;分数阶微分的阶数对算法的影响;对偶分数阶微分掩模窗口大小对算法的影响。Middlebury数据集[20]选择用于评估我们的算法是否具有不同的结构和属性,如纹理、模糊图像、运动不连续性、阴影、非刚性运动等。

选择角度误差(AE)和流动端点误差(EE)进行评估。由于我们关心算法在整个图像中的性能,因此我们使用整个图像的AE/EE(AVAE/AVEE)来直观评估我们提出的光学模型。

为了便于描述,我们将HS光流模型称为HS模型[12]FOVOF模型和我们提出的模型DFOVOF模型。遮罩窗口大小为.

1显示了HS模型、FOVOF模型和DFOVOF模型在不同图像序列中的光流场。在DFOVOF模型中,,,其中,不同的颜色代表不同的运动方向,不同的色彩深度代表不同的移动速度。颜色越深,速度越快。

图中的第一行1显示了由传统HS模型生成的获得的光流场。可以看出,图像不连续的边缘没有得到很好的保留,图像纹理的细节被忽略了。

第二行显示了通过FOVOF模型获得的光流场。在一定程度上保留了边缘不连续性,但对象的轮廓不是很清晰。

第三行给出了由DFOVOF光流模型获得的光流场。轮廓边缘更加明显;同时可以清楚地看到图像纹理的细节。DFOVOF模型以泰勒分数阶形式扩展了亮度约束方程,并在计算光流场时加入了图像的局部亮度相关性,进一步减小了误差,提高了模型的精度。

为了评估分数阶参数对模型性能的影响,并找出分数阶与图像特征之间的相关性,估计了不同分数阶下每个图像序列光流场的AVAE/AVEE,如图所示2。此时我们选择AVAE/AVEE值越小,光流场估计的精度越高。第一行是图像序列“约塞米蒂”的AVAE和AVEE;第二行是图像序列“陆军”的AVAE和AVEE。第三行是图像序列“城市”的AVAE和AVEE

我们可以在图中找到2最低可用/可用分布在以下范围内以及最小AVAE/AVEE在范围内;图像纹理越简单,表示AVEE/AVAE值变化的表面越光滑;图像纹理越复杂,表面就越陡峭;当图像序列中存在非刚性运动时,表面也会增加倾斜。因此,很明显,本文提出的算法可以提高运动估计的精度,特别是对于具有复杂纹理和非刚性运动的图像序列。总之,我们选择一个小对于复杂纹理图像,并选择相对较大的用于简单的纹理图像序列。此外,非刚性运动也会使小。最佳在不同的图像序列中变化不大。

测试遮罩窗口大小的效果算法性能及掩模窗口长度相关性研究和图像特征,我们计算了六个图像序列在不同掩模窗口大小下的光流估计平均有效值如表所示1,其中,,式中(a)为金星;(b) 是dimetrodon;(c) 是绣球花;(d) 是橡胶鲸鱼;(e) 是格罗夫;且(f)为城市。为了进行比较,表中还添加了H-S模型和FOVOF模型的AVEE。为了进行比较,表中还添加了H-S模型和FOVOF模型光流场估计的AVEE值。

我们可以在表中看到1当应用于DFOVOF模型时,AVEE值进一步降低;在DFOVOF模型中,当掩模窗口大小为增加-通常,当在(2,7)范围内。对于所有图像,当上升;AVEE达到最佳值后,当上升。图像纹理越复杂或运动越非刚性将。

总之,我们应该选择一个大的值对于相对简单的图像序列并选择一个较小的值用于复杂纹理图像和非刚性运动图像。

5.结论

我们提出了一种改进的分数阶光流模型,它将分数阶应用于HS模型的亮度约束方程和平滑约束方程。此外,我们还提出了二维分数阶微分掩模,并将其用于简化对偶分数阶导数的计算。实验表明,本文建立的模型进一步提高了精度。我们还发现了, ,和图像内容。所以不同的图片内容应该使用不同的, ,,但我们使用的算法使用了相同的, ,在整个图像中。进一步的研究将侧重于对, ,与图像内容相关。

利益冲突

提交人声明他们没有利益冲突。

致谢

本研究得到了国家自然科学基金(61503141)、广东省边境与重点技术创新专项资金(2016B090912001)、广州市生产研究项目(2016040114)、,广州市科技信息局国际合作项目(2012J5100001)、海防公益项目(201505002)、中央高校基本科研业务费专项资金。