杂志的下一篇文章
复杂林分森林物种分类的改进原型网络模型
下一篇特刊文章
基于CNN的光谱-空间特征分割提取用于多光谱图像压缩
期刊上的上一篇文章
有效的边缘化粒子平滑算法用于室内CSS-TOF非高斯误差定位
上一篇特刊文章
基于FPGA的机载高光谱成像压缩:针对GPU实现的性能和能效基准测试
 
 
订购文章重印
字体类型:
宋体 佐治亚州 宋体,Verdana
字体大小:
澳大利亚 澳大利亚 澳大利亚
行距:
列宽:
背景:
第条

基于质量控制的多通道遥感图像有损压缩

通过
卢金
1,
伊琳娜·瓦西里耶娃
1,
谢尔盖·克里文科
1,
李方芳
1,
谢尔盖·阿布拉莫夫
1,
奥列克西·鲁贝尔
1,
贝诺伊·沃泽尔
2,*,
卡塞姆·切迪
2
凯伦·埃吉亚扎里安
1
乌克兰哈尔科夫61070国立航空航天大学信息与通信技术系
2
雷恩大学电子技术研究所1,UMR CNRS 6164,22300拉尼翁,法国
芬兰坦佩雷33720坦佩雷大学计算成像小组
*
信件应寄给的作者。
远程传感器。 2020,12(22), 3840;https://doi.org/10.3390/rs12223840
收到的提交文件:2020年10月25日/修订日期:2020年11月18日/接受日期:2020年11月19日/发布日期:2020年11月23日
(本文属于特刊遥感数据压缩)

摘要

:
有损压缩被广泛用于减小多通道遥感数据的大小。除了这种积极的影响外,有损压缩可能会导致负面的结果,使图像分类变得更糟。因此,如果可能的话,应该小心地进行有损压缩,以控制压缩图像的质量。本文研究了应用于三通道测试和真实图像的最大似然和神经网络分类器的分类精度与由标准和视觉质量度量表征的压缩图像质量之间的相关性。如下所示。首先,当压缩比增加导致的图像质量达到失真可见性阈值时,分类精度开始更快地降低。其次,特征分布更广的类开始从特征分布更窄的类中“获取像素”。第三,分类精度可能主要取决于训练方法,即特征是由原始数据还是压缩图像确定的。最后,指出了像素分类的不足,并就如何提高分类精度提出了一些建议。

图形摘要

1.简介

如今,遥感(RS)在许多应用中得到了应用[1,2,]主要原因如下。可以从RS图像中检索不同类型的有用信息,特别是高分辨率和多通道数据(即,一组同一区域的共注册分量图像,这些分量图像是通过不同的波长、偏振度甚至不同的传感器获取的[,4,5,6]). 现代遥感传感器通常提供了快速和频繁收集数据的可能性——例如,最近推出的多通道传感器Sentinel-1和Sentinel-2开始产生大量有价值的遥感数据[7,8].
因此,由于上述因素,RS数据量大大增加:更好的空间分辨率、更多的通道、更频繁的观测。这给RS数据处理带来了挑战,涉及到处理的所有基本阶段:联合注册、校准、预滤波或后滤波、压缩、分割和分类[9,10]. 最严峻的挑战之一是多通道RS图像的压缩[11,12,13]. 压缩用于在数据从星载(更罕见的是机载、无人机)传感器下行链路传输之前减小数据大小,将采集的图像存储在遥感数据收集或特殊存储库的陆地中心,并将图像传递给潜在客户。无损压缩通常无法满足应提供的压缩比(CR)要求,因为即使在最有利的情况下,分量图像的频带间相关性很高[14],现有最佳无损压缩技术获得的压缩比达到4…5[12].
有损压缩可以提供更大的CR值[12,13,15,16,17]但以引入扭曲为代价。在压缩图像质量(以许多不同的方式表征)和CR之间达成适当的折衷始终是一个问题[11,12,13,18,19,20]. 这背后有几个原因。首先,在实践中经常使用的提供固定CR的压缩[21,22]导致压缩图像的质量可能在很大范围内变化[23]. 对于给定的CR和较简单的结构图像,引入的失真较小,压缩图像质量较高,而对于结构更复杂(包含许多小型细节和纹理)的图像,损失较大,因此,图像质量可能不合适,因为一些重要信息不可避免地会丢失,这是不受欢迎的。当然,由于使用了更好的编码器,可以适应图像内容,因此可以实现一些改进[24],通过三维(3D)压缩使用通道间相关性[12,13,21,22]或其他方式。然而,积极影响可能是有限的,和/或可能存在一些限制,例如,应用图像压缩标准的必要性[12,19,21].
因此,我们更感兴趣的是一种不同的方法,该方法假定对多通道RS图像进行有损压缩,同时对引入的失真进行一定的控制,并同时希望提供更大的CR。让我们解释一下这种方法的优点,当它合理时,以及实现它的条件。请记住,在以下情况下,以有损方式压缩的RS数据是有用的:(a)引入的损失不会导致解决RS图像处理的最终任务(如分割、对象检测、光谱分解、分类、参数估计)的充分减少[17,25,26,27,28,29,30,31,32,33,34]; (b) 在解决上述最终任务时,由于有损压缩导致的失真不会作为导致不希望的负面影响(例如,出现幻影伪影)的伪影出现。
下面,我们考虑有损压缩对多通道RS图像分类的影响[27,28,33,34,35]. 具体来说,由于以下原因,我们将重点放在数量有限的通道的情况下,例如彩色、多极化或多光谱图像:(a)演示由于有损压缩而在图像中发生的效果以及这些效果如何影响分类(仅针对少量图像分量的情况)更简单;(b) 由于可用特征数量有限,并且需要在特征空间中可靠地区分类别,因此对含有少量成分的多通道图像进行准确分类通常比对高光谱数据(含有相对较多成分的图像)进行分类更困难。
回到多道RS数据有损压缩的优点,我们可以说明以下内容。首先,以有损方式压缩的图像可能比原始图像分类更好[27,34]. 如果原始图像有噪声,并且调整编码器参数,以便有损压缩产生的噪声消除效果,则通常会发生这种效果[13,36,37,38]是最大值。然而,即使图像中没有噪声(或者更准确地说,原始图像中的峰值信噪比(PSNR[27,34,38].
此范围宽度可以不同[39]. 其宽度取决于以下主要因素:
  • 使用的分类器,它的效率如何,它是如何训练的;
  • 应用压缩技术(编码器);
  • 类的区分程度以及使用了哪些功能;
  • 每个多通道图像中有多少类;
  • 考虑到图像的“复杂性”有多大(它是否具有高度的纹理,它是否包含许多小型或长时间的物体,属于每个类别的碎片的平均大小是多少)。
因此,研究人员进行了广泛的研究,旨在了解如何设置控制给定多通道图像压缩(PCC)的CR或编码器参数,使用有损压缩技术,并考虑分类器。在这里,我们想回顾一些已知的方面和依赖关系,这些将在下文中加以利用。首先,对于相同的CR,复杂度较高的图像可能会引入较大的失真[40]. 此外,对于同一PCC,更复杂和/或噪声更大的图像可能会引入更大的失真,例如基于正交变换(离散余弦变换(DCT)或小波的编码器的量化步长(QS)[40]). 其次,压缩图像的期望质量(表征图像质量的度量的值)现在可以被预测并以适当的精度提供[40,41]至少对于一些基于DCT的编码器,例如编码器AGU[42]. 第三,传统(如PSNR)和/或视觉质量指标的值与整个图像或类别正确分类的准确性之间存在一定的依赖性[43]. 主要由大尺寸均质物体(水面、草地)代表的类别的分类精度与传统指标有更好的相关性,而主要由纹理、小尺寸和长时间物体(森林、城市地区、道路、狭窄河流)代表的类的正确分类概率与视觉质量指标相关。此外,类别的分类精度可以不同地取决于PCC或CR[38]. 对于后一类,随着CR的增加,正确分类的概率降低通常更快。第四,不同的分类器产生的分类结果在所获得的分类图和定量特征(如正确分类的总概率、类的概率和混淆矩阵)方面可能存在显著差异[43,44]. 第五,在基于分形模型预测压缩RS图像正确分类总概率(TPCC)方面,已有相当成功的尝试[28].
综合所有这些,我们假设如下:
  • 对于多通道RS图像,由于有损压缩(可以用特定的度量来表征)导致的失真与TPCC之间存在严格的相关性;
  • 具有这种依赖性,可以建议必须提供哪些指标值,以确保压缩数据与原始数据的TPCC几乎相同;
  • 至少可以为一些基于DCT的现代压缩技术提供推荐的度量值;
  • 度量的阈值可能取决于使用的分类器和遭受有损压缩的多通道图像的属性;
  • 分类器的性能还可能取决于它的训练方式(例如,使用原始或压缩的多通道图像)。
本文的目的是对这些假设是否有效进行初步分析。主要贡献如下。首先,我们表明,与对应的原始图像的TPCC相比,应用有损压缩并在其不可见阈值附近进行失真,可以提高TPCC(对于简单结构图像)或可接受的TPCC(针对复杂结构图像)减少。此外,我们还展示了如何对特定编码器执行这种压缩。其次,我们证明了压缩数据的分类器训练通常比原始(未压缩)图像的训练提供稍好的结果。
论文结构如下。第2节对RS图像有损压缩中使用的性能标准进行了初步分析。第3节介绍了两种常用的基于最大似然法(MLM)和神经网络(NN)的遥感数据分类方法。第4节包含合成三通道测试图像的分类器测试结果。第5节提供了对真实三通道图像进行的实验结果。对一些实际特性进行了讨论和分析第6节; 结论如下所示第7节.

2.有损压缩的性能标准及其初步分析

考虑一个图像 j个 t吨 其中i、j表示像素索引 伊姆河 , J型 伊姆河 定义处理后的图像大小。如果处理多通道图像,请索引q个可以使用。让我们从考虑单分量图像的情况开始。为了表征压缩效率,我们使用了以下三个指标。第一种是传统的PSNR,定义如下
P(P) S公司 N个 R(右) inp公司 = 10 日志 10 ( 博士 2 / = 1 伊姆河 j个 = 1 J型 伊姆河 ( ij公司 c(c) ij公司 t吨 ) 2 / ( 伊姆河 × J型 伊姆河 ) ) = 10 日志 10 ( 博士 2 / MSE公司 )
其中DR表示图像表示的范围, ij公司 c(c) 是压缩图像,MSE是有损压缩引入的失真的均方误差。一般来说,遥感应用中的DR可能与处理RGB彩色图像常用的255有足够的不同。下面,我们将主要考虑DR=255的单通道和多通道RS图像,但也将分析如果DR不等于255应采取的措施。
PSNR是许多图像处理应用中广泛使用的传统度量。同时,PSNR的缺点也是众所周知的。PSNR的主要缺点是它不足以表征图像的视觉质量[45,46]. 目前,还有许多其他的被认为更充分的所谓HVS(人类视觉系统)指标[45,46,47]. 一些现有的HVS度量只能应用于彩色图像。由于我们需要一些足够好且适用于单分量图像的指标,因此我们应用了指标PSNR-HVS和PSNR-HVS-M。以前的HVS指标考虑到人类视觉对高频谱分量畸变的敏感性较小,后者还考虑了图像纹理和其他异质性的掩盖效应[47]. 这些指标由定义
PHVSM公司 = 10 日志 10 ( 博士 2 / MSE公司 HVS系统 )
PHVSM公司 外面的 = 10 日志 10 ( 博士 2 / MSE公司 HVS系统 M(M) )
哪里 MSE公司 HVS系统 MSE公司 HVS系统 M(M) 是考虑到上述影响而确定的中小企业。如果PSNR-HVS近似等于PSNR,则有损压缩引起的失真具有类似于加性高斯白噪声的特性。如果PSNR-HVS小于PSNR,则表明失真更类似于非高斯(重尾)或空间相关噪声,或两者兼而有之[47](另请参见[48]详细信息)。如果PSNR-HVS-M远大于PSNR,则图像内容的掩蔽效果就足够了(最有可能的是,图像具有高度纹理)。反过来,如果PSNR-HVS-M近似等于或小于PSNR,则不存在掩蔽效应,和/或失真类似于空间相关噪声。
图1a、 c,e呈现了三幅不同复杂度的灰度测试遥感图像——图像Frisco的结构最简单,而图像Diego的纹理最丰富。图1b、 d,f表示等式(1)–(3)中考虑的度量对量化步长的依赖性,量化步长在编码器AGU中充当PCC[42](该压缩方法在32×32像素块中使用2D DCT、对均匀量化的DCT系数进行编码的高级算法以及解压缩后的嵌入式去块)。正如人们所料,如果QS增加,所有指标都会变小(更糟)。同时,对于相同的QS,压缩图像质量是不一样的。例如,在QS=20的情况下,Frisco测试图像的PSNR和PSNR-HVS-M几乎相同(约40 dB)。对于结构更复杂的测试图像,机场和迭戈的PSNR-HVS-M值也约为40 dB,而PSNR值约为34 dB。这意味着:(1)存在掩蔽效应,即纹理和异质性仍然足以掩蔽引入的扭曲;(2) 通过目视检查(原始图像和压缩图像的比较)可以注意到引入的失真。回想一下,根据度量PSNR,失真可见度阈值约为35…38 dB,根据度量PSNR-HVS-M,失真能见度阈值大约为40…42 dB[45].
请注意,对于表示为8位数据阵列的灰度图像,如果QS小于18…20,则会发生失真的不可见性[23](更一般地,如果QS≤DR/(12…13))。还应记住,使用相同的QS会导致足够不同的CR。例如,对于QS=20,对于考虑的测试图像Frisco、Airfield和Diego,CR值分别等于26.3、4.6和4.5。这些事实和依赖关系在图1确认导言中的基本陈述。
除了上述QS≈20的相同QS的度量值差异外(QS>20也会出现类似差异),比较图1b、 d,f),对于QS≤10(更普遍地说,QS≤DR/25)有有趣的观察结果。在这种情况下,MSE≈QS2/ 12 [20]PSNR超过39 dB,PSNR-HVS-M不小于PSNR且超过45 dB。因此,引入的失真是不可见的,所需的PSNRdes公司(或分别为MSEdes公司)可通过适当设置QS≈(12MSE)轻松提供des公司)1/2.
当然,到目前为止,已经提出了许多质量指标。以下我们基于PSNR-HVS-M进行研究,原因如下。首先,它是最好的组件级质量指标之一[49]这可以有效计算。其次,现有最佳质量指标之间的相互关系很高(参见补充材料科). 因此,在对其属性进行相应的初步分析的情况下,可以在我们的方法中使用其他质量度量。请注意,我们早些时候在图像压缩和去噪应用中广泛使用了PSNR-HVS-M[23]充分利用其主要性能。

3.考虑的多通道图像分类方法

如上所述,有多种方法可用于多通道图像的分类。下面我们考虑其中两个。第一种方法基于最大似然法(MLM)[50,51]第二个依赖于神经网络(NN)训练[50]. 在这两种情况下,都对逐像素分类进行了研究。使用像素方式和这些分类器有很多原因:(a)简化分类任务,只使用Q特征(Q=1,…,Q),即每个像素中给定多通道图像的值;(b) 显示像素分类的问题;(c) 基于MLM和NN的分类器被认为是最好的分类器之一[50].
注意,RS数据分类的分类器可以用不同的方式进行训练。一种选择是使用早期采集的图像(例如,存储用于训练或其他目的的未压缩图像)预先训练分类器。另一种选择是使用获得的压缩图像的一部分进行分类器训练,并将其用于整个图像分类[39]. 人们可以预计,如果两种选择都有优点和缺点,分类结果会有所不同。

3.1. 最大似然分类器

MLM的分类(识别)功能基于特征空间中某些度量的计算
Φ = { 1 , ρ ( x个 , x个 ) 信托收据 ; 0 , ρ ( x个 , x个 ) < 信托收据 ,
哪里 x个 , x个 是当前和样本对象的特征(属性)向量(在我们的情况下是图像像素); ρ ( , ) 是向量相似性的一个常用度量;tr表示决策承担阈值。
通常,作为特征向量的组成部分,可以考虑原始特征(多通道图像的像素(体素)值)和基于其计算的“导数”特征(例如,这些值的比值)。
如果Φ=1,则由特征向量确定当前对象(像素) x个 ,与类相关 .
考虑到特征的随机性 x个 , x个 R(右) c(c) ,参数中包含有关每个对象类的信息 θ 联合概率密度函数 如果 c(c) ( x个 ; θ ) .
此信息用于创建统计决策规则
L(左) = 如果 c(c) ( x个 ; θ | 2 ) 如果 c(c) ( x个 ; θ | 1 ) 信托收据
其中L是似然比。阈值tr由使用的统计标准确定;例如,当以下信息可用时,贝叶斯准则提供了获得最佳分类器的方法:所有模式集的PDF、每类发生的概率以及与误分类概率相关的损失。
在大多数实际情况下,对于对象描述,使用统计样本信息,即在训练阶段获得的PDF的统计估计值采用似然比L。然后,样本大小、观测对象信息的可靠性,而在决策规则中使用这些信息的效率主要决定了所做决策的质量。
使用代表给定类的像素形成训练样本;通常,它是基于感测地形的真实数据识别的图像中的某些区域(或区域,一组像素)。训练样本数据的主要要求是其代表性——样本的像素必须对应于地面上的一个类;这样的类应该占据一个由给定分辨率的图像中的像素很好地表示的区域。换句话说,图像选定区域中的像素数应确保采用具有统计意义的决策。
在构造多替代决策规则(K>2)时,使用最大似然准则;方程式(5)中的阈值tr假定为等于1。最大似然准则可以消除解决方案的不确定性(当没有一个类别比其他类别更可取时),不需要了解类别和损失函数的先验概率,允许评估解决方案的可靠性,并且可以很容易地推广到许多类的情况。根据该标准,我们认为控制样本(当前图像像素中特征的测量值)属于1≤u≤K类,其似然函数(或者更确切地说,其在训练阶段获得的估计值)最大:
如果 c(c) ( x个 ; θ | u个 ) = 最大值 1 k个 K(K) { 如果 c(c) ( x个 ; θ | k个 ) } x个 u个 .
如果关于特征向量正态分布规律的假设是正确的,则最大似然法方程(6)提供了最佳识别。一方面,特征的正态性假设简化了分布律(DL)参数的估计,并使得在类模型中考虑不同通道中数据之间的相互关联关系成为可能。另一方面,已知真实多通道数据的分布通常是非高斯的。即使根据中心极限定理对DL观测值进行了归一化假设,在信息接收和初步处理过程中引入的非线性也不容忽视,它表现为观测分布的形状和参数的变化。
为了提高近似特征的经验非高斯分布的准确性,并考虑到可能存在的强相关关系,建议应用基于正态随机变量非线性变换的多参数分布规律。这些变换包括约翰逊变换。
为了描述一类光谱特征,我们建议使用Johnson SB类-分配[52,53]:
如果 ( x个 ) = η λ 2 π ( x个 ε ) ( ε + λ x个 ) e(电子) 1 2 ( γ + η 自然对数 x个 ε ε + λ x个 ) 2
其中η和γ是与偏度和峰度有关的两个形状参数( η > 0 , γ ( , + ) ); ε和λ是随机变量x的两个标度参数( ε ( , + ) , ε x个 ε + λ ).
由于有大量参数,方程(4)中的模型非常通用,能够近似几乎任何单峰分布以及广泛的双峰分布。此外,由于约翰逊分布是基于正态随机变量的非线性变换,因此在描述经验分布时使用约翰逊分布可以保持在相关理论框架内,这对于以非高斯分布为特征的考虑特征非常重要(参见下面的示例)并且存在很强的通道间相关性。
PDF参数的估计 θ | k个 = { ε k个 , λ k个 , η k个 , γ k个 } 可以通过对损失函数进行数值优化,以最小化公式(7)中理论模型表示的经验分布(直方图)的积分MSE。
方程(7)的多维变量如下[52]:
如果 c(c) ( x个 | ) = ( 2 π ) c(c) / 2 Ξ 1 / 2 ν = 1 c(c) η ν λ ν ( x个 ν ε ν ) ( ε ν + λ ν x个 ν ) × × 经验 [ 1 2 ν , κ = 1 c(c) Ξ ν κ 1 ( γ ν + η ν 自然对数 x个 ν ε ν ε ν + λ ν x个 ν ) ( γ κ + η κ 自然对数 x个 κ ε κ ε κ + λ κ x个 κ ) ]
哪里c(c)是特征向量的大小 x个 ;Ξ是样本相关矩阵。
因此,要构建相关数据的多维统计模型,处理包括几个阶段。在第一阶段,通过估计随机向量分量的分布矩和直方图来进行传统的统计分析。分量互相关系数的样本估计 x个 也发现了。在第二阶段,为多维数据的每个组成部分构建方程(7)形式的一维统计模型。分布密度的初始估计(特征的直方图 x个 ν )用作所需模型的目标 如果 ( x个 ν ) 由Johnson DL参数向量描述 θ 基于多维直方图建立多维统计模型 如果 ^ c(c) ( x个 ) .如等式(8)所示,为类构造多维模型 k个 ,需要评估分布参数矩阵 Θ k个 = [ ε c(c) k个 , λ c(c) k个 , η c(c) k个 , γ c(c) k个 ] : 4 × c(c) 和样本相关矩阵Ξ.
在创建和估计训练样本的过程之后,图像像素根据决策规则(#3)与类进行排序(关联)。如果应用像素分类,则坐标为(i,j)的每个像素的数据将分别(独立)处理。当前像素的值向量 x个 ij公司 被放入等式(5)中的类目标的数学模型中。获得的结果 如果 ^ c(c) ( x个 ij公司 ) | k个 ,k=1…k相互比较,并选择似然函数的最大估计;其编号是指当前像素(i,j)所指的类的编号。

3.2. NN分类器描述

由于分类器基于用于图像处理的神经网络,因此使用了前馈神经网络。目前有许多神经网络及其训练和优化方法[54]. 我们为我们的应用程序选择了一个简单但高效的NN,它可以很容易地实现或放置在不同的平台和设备上。所使用的分类器是一个全对全连接的感知器,结合自组织映射来处理获得的属于某一类的像素的权重或概率。架构细节如下:三色分量输入数据的输入层,一个包含30个完全连接的神经元的隐藏神经元层(该数字已被证明与更多可能的隐藏层神经元表现同样好)。对于隐藏层,利用tanh激活函数。采用尺度共轭梯度反向传播作为全局训练函数。如上所述,所用神经网络的输出层是一个与隐藏层神经元完全连接的自组织映射。它将决策的输出概率作为向量映射到类列表。
培训和验证过程按以下方式进行。为此,将某个图像划分为一组像素颜色值向量。由此,对获得的向量集进行置换,以便为每个训练引入非常规分配。对于神经网络训练,我们取了70%的生成集,其余30%的数据用于验证。必须在第一阶段进行自数据集验证,以证明所选的神经网络结构和神经网络参数以及其他训练过程特性。我们考虑了基于NN的分类器的不同配置,特别是改变隐藏层、神经元的数量以及它们之间的连接。已经确定,像多层感知器这样的复杂体系结构不能提供更好的分类效率,甚至会导致使用相同的训练数据集进行过拟合。结果,所选择的架构是具有一个隐藏层的NN,对于给定的NN,其训练时期的完全最优数量等于50。该分类器使用方便,速度快(这是分类应用于遥感数据的关键点)。整个训练过程重复100次,对数据集进行完全置换,并将获得的分类器应用于测试图像。

4.合成三通道图像分析

4.1. MLM分类器结果

创建测试多通道图像时,我们考虑了现实RS图像中可能出现的类的以下典型属性:
财产 1
特征的分布很少接近高斯分布;因为在我们的例子中,颜色分量值(参见测试颜色图像及其分量图2a–d)分别是使用的特征,则此属性与它们相关;
财产 2.
与某一类相关的物体很少是绝对均质的(即使水面通常也不能被视为绝对均质);许多因素导致像素值的多样性(变化),如反射或辐照表面的物理和化学特性的变化、噪声等。
财产 三。
特征在特征空间中重叠(相交);正是这种特性通常会导致错误分类,尤其是当许多特征发生这种重叠时;
财产 4
每个RS图像中属于不同类别的像素数量可能会有很大差异,可能是因为属于一个类别的像素百分比小于1%,而对于另一个类别,可能有百分之几十的对应像素。
财产 5
一个像素中可以有两个或更多类的对象[54,55]这需要应用分解方法,但在我们的进一步研究中,我们不考虑这种更复杂的情况(通常需要三个以上的多通道RS数据分量才能进行有效的分解)。
让我们展示一下,我们或多或少地在测试图像中加入了这些属性。表1包含关于七个类的数据、它们的直方图以及使用Johnson S的近似值B类-分布。第1类可以有条件地被视为“道路”,第2类可以被视为农田(Field-Y),第3类可以被认为是另一种颜色的农田(Fild-R),第4类可以被看作“水”,第5类可以被看成“草”,第6类可以被当作“树”,第7类可以被视作一些结构非常复杂或异质的类别,如城市地区或葡萄园(“纹理”)。
可以看出,属性1(非高斯分布)适用于几乎所有的特定分布。属性2(内部异质性)适用于所有类,尤其是类2和类7。属性3(特征的交集)适用于许多类——所有三个特征适用于类1和类2,所有三个特性适用于类5和类6;第7类的特征实际上与所有其他类别重叠(从部件图像的比较中也可以看出特征的交集,其中一些类别很难区分,例如绿色部件中的第2类和第4类,图2c) ●●●●。属性4也被观察到,其中一小部分像素属于类别1,而相当多的像素属于类别4、5和7。
图3a表示类的真实地图,其中类1以浅棕色显示,类2以黄色显示;第3类为红色,第4类为蓝色;第5类为浅绿色,第6类为深绿色,第7类为白色。
MLM分类器在原始图像像素级上的应用(图3a) 生成中给出的分类图图3b.正如人们所见,有很多错误分类。类别4和6以最佳方式分类(正确分类P的概率44和P66分别等于0.85和0.82),而等级5的识别方式最差(P55= 0.19). 第1类和第7类识别不好(P11和P77分别等于0.48和0.42)。第2类和第3类以P为特征22=0.67和P33分别=0.77。
分类概率很低可以用几个因素来解释。其中一些已经提到了,在特征空间中的交集就足够了。另一个可能的原因是MLM分类器基于分布近似,这些近似可能不完美(请参阅中的直方图及其近似表1).
相当多的像素错误地与类别7(“纹理”)相关,对于类别7,分布非常广泛,并且它们与其他类别的分布相交。
图2e、 f表示压缩后的图像,提供PSNR-HVS-M≈36 dB和PSNR-HVSS≈30 dB。在这些情况下,CR值分别约为4.5和8.9(对于组件式有损压缩)。对于PSNR-HVS-M≈36 dB的情况,引入的失真是可见的[45]. 它们大多表现为准同源区域变化的平滑(考虑第6类(深蓝色)的碎片图2a、 e)。对于有损压缩,这种抑制噪声或有损压缩引起的高频变化的效果是众所周知的[36,37]它们甚至可能对分类产生积极影响(在某些条件下)。对于PSNR-HVS-M≈30 dB的情况,有损压缩导致的失真(参见图2f) 出现在变体的平滑和边缘/对象涂抹中(这在类1中很明显)。显然,这种影响可能会对分类产生影响。
类的正确分类概率见表2注意,MLM分类器已经使用针对原始(未压缩)三通道图像获得的分布近似进行了“训练”。可以看出,特定类别的概率以不同的方式取决于压缩图像质量和压缩比。P(P)11稳定下降并接近于零。发生这种情况有两个原因。首先,第1类要素与第2类要素充分相交。其次,由于有损压缩,压缩后的特征分布不同于原始图像的特征分布(MLM分类器已经过训练),其中这种差异随着PSNR-HVS-M的减少和CR的增加而增加。这可以通过中所示的分布来说明表3用于1级,部分用于表4对于2级。
中的数据分析表2还显示了以下内容。对于某些类别(类别3–6),较大的CR和较小的PSNR-HVS-M(对应更充分的有损压缩)会导致正确分类概率的降低(分析P列中的数据)33,P44,P55,和P66). 同时,有一些类别的正确分类概率增加了P77这是因为纹理区域中的错误分类减少了(请参见中的贴图图3c、 d)。还有一个类(2类)的P22PSNR-HVS-M的最大值约为40 dB(由于噪声过滤效应),但PSNR-HVS-M较小(CR较大)的最大值会减小。
为原始图像训练并应用于压缩图像的MLM分类器失去效率的一个可能原因是,压缩数据的特征分布与为原始RS数据观察并用于分类器训练的特征分布不同。
然后,可以预期MLM分类器必须针对压缩图像进行训练。我们进行了相应的研究,结果见表5。对中的数据进行分析得出的结论表5可能看起来很琐碎——需要训练MLM分类器以获得具有相同压缩特性的压缩图像。遵循这一规则可以大大提高分类精度。例如,如果在训练中使用原始数据,然后将MLM分类器应用于数据压缩,提供PSNR-HVS-M=42 dB,则P复写的副本= 0.501. 同时,如果在训练中使用PSNR-HVS-M=42dB的压缩图像,P复写的副本急剧增加,等于0.579。对于压缩后产生的PSNR-HVS-M等于36和30 dB的图像,观察到了更令人惊讶的结果。P(P)复写的副本相应的训练分别达到0.597和0.527。注意P复写的副本=0.627,对于使用原始图像训练分类的原始图像。然后,对于用PSNR-HVS-M压缩大约40dB的图像,出现几乎相同的P复写的副本如果针对相应的压缩图像对其进行训练,则会观察到。
该培训方法获得的分类图如所示图4a、 b.它们可以与中的地图进行比较图3c、 分别为d。这种比较清楚地表明,对相应的压缩数据进行训练是可取的。许多班级得到了足够好的认可。一个有趣的点是,许多分类可能出现在多通道图像中的尖锐边缘附近(第4类边缘附近)。这是因为这样的边缘被有损压缩抹去了,并且出现了具有“中间值”的像素,这可以称为“错误的类”。

4.2. 基于NN的分类

让我们从分析数据开始,使用此图像的神经网络训练对原始三通道图像进行分类。获得的混淆矩阵如所示表6相应的地图如所示图5a.正如大家所见,有几个类别得到了很好的认可:Field-R(3类)、Water(4类)、Trees(6类)。类“Roads”(类Field-Y几乎具有相同的颜色)和“Texture”(其像素可能错误地与类“Water”、“Trees”、“Grass”以及更罕见的类Field-UY相关)存在许多错误分类。2班和5班的成绩相对较差。因此,即使在这种近乎理想的情况下(分类图像与用于训练的图像相同,应用了能够处理非高斯分布特征的基于NN的分类器),分类结果也远远不够完美。
考虑到MLM分类器的结果,我们还考虑了神经网络分类器对原始图像进行训练,然后应用于压缩图像的情况。PSNR-HVS-M等于42 dB、36 dB和30 dB时获得的数据如下所示表7,表8表9分别为。中的数据分析表7如下所示。正如预期的那样,所有可能性都发生了变化。让我们考虑用粗体标记的对角元素,它们对应于特定类别正确分类的概率。在这个意义上,有一些有趣的观察结果(比较表6表7):一些概率已经充分降低(参见P11)部分略有下降(P33,P44,P66,P77). 同时,一些概率略有增加(P22和P55).
中的数据分析表8表9显示有损压缩对P有负面影响11即“道路”类别正确分类的概率。回想一下,MLM也有同样的效果。如果CR较大(提供的PSNR-HVS-M较小),概率P33和P77继续下降。P(P)22缓慢增加。P(P)44几乎保持不变且非常高。P(P)66也几乎保持不变。最后,P55减少。因此,我们可以说,经过对原始图像的训练,神经网络分类器在PSNR-HVS-M中继续工作,大约40 dB,然后其性能开始变得更快(随着CR的进一步增加)。
图5显示了提供PSNR-HVS-M的三个不同值的压缩测试图像的分类结果。结果非常相似。然而,可以注意到一些差异:
  • 对于PSNR-HVS-M=30 dB的“水”类,观察到的错误分类较少。
  • 在“水”类的边缘有很多错误分类。
  • 当CR增加时,“Grass”类会出现更多的错误分类。
  • 许多像素,甚至一些属于类别2(场-Y)的对象被分类为“纹理”(白色)。这个例子再一次说明了如果要分类的图像包含类似“纹理”的类,那么图像分类中的问题。“纹理”类本身以及特征与类“纹理”的特征相交的类都会出现问题。
现在,让我们检查一下如果将压缩图像用于训练会发生什么。表10给出了使用图像压缩(PSNR-HVS-M=42 dB)的NN训练情况下获得的混淆矩阵。这些数据可以与中的相应数据进行比较表7如果使用压缩图像进行训练,则概率P11,P55、和P77足够好了,概率P22更糟糕的是,其他概率稍差。因此,总的来说,分类质量略有提高。分类图如所示图6b。
下一个考虑的情况是对产生PSNR-HVS-M=36 dB的压缩图像进行分类。获得的概率如下所示表11,分类图如所示图6c.正确分类的概率表11几乎与中的相应值相同表10。比较中的数据表8表11可以说,使用压缩图像进行训练是值得的(在这种情况下,类的正确分类的大多数概率都更好)。分类图如所示图6c,它与中的非常相似图6a、 b.这意味着与前两种情况相比,分类精度没有明显下降。
最后,最后一种情况是对PSNR-HVS-M=30 dB的压缩图像进行分类,即存在相当大的失真。混淆矩阵如下所示表12,分类图表示为图6d.与中的相应数据进行比较表9,P的充分增加11,P55,P66、和P77观察到,P22,P33、和P44也增加了一点。这意味着使用压缩图像进行训练是值得的,尤其是在使用较大的CR进行压缩时。
仔细分析中的分类图图6d允许注意到类“水”和“树”之间的边缘附近有很多错误分类,这些错误分类的像素与“纹理”有关。如果压缩比很高,我们将此效果与边缘涂抹和在高对比度边缘附近发生的其他效果相关联。

4.3. 初步结论

总结得出的结果和结论,我们可以说:
  • 如果特征在特征空间中相交和/或如果没有使用所有可能的特征,则任何分类器的分类都是不完美的;这里我们的意思是,像素级分类无法利用有助于提高分类精度的空间信息;
  • 如果分类器针对原始(未压缩)数据进行训练,然后应用于压缩图像,则更多的压缩(较大的CR、较小的PSNR或PSNR-HVS-M)会导致分类恶化(通常);同时,特定类别的Pcc和正确分类概率的差异可以忽略不计;由于噪声/变化抑制(如果存在噪声或高频变化),某些特定类别的分类精度甚至可以提高;
  • 值得训练分类器(至少是基于MLM和NN的分类器),以了解其应用的“条件”;这些条件可以通过计划在压缩阶段提供的质量度量值或将要使用的QS值来描述;
  • 不同的分类器可以为相同的RS数据生成足够不同的分类图;表征分类的定量参数也可能有很大不同;一个很好的例子是6类的数据,MLM分类器不能很好地识别它,而NN分类器表现得足够好,而7类的情况正好相反;
  • 有损压缩对主要与小型和长时间物体有关的类别产生负面影响,例如道路、狭窄河流、山沟和小房子;原因是有损压缩会模糊此类对象并改变特征分布;在这个意义上,使用视觉质量度量并在压缩阶段为其设置所需的值对于避免此类分类的分类精度的充分降低是有用的;
  • 对于像素分类,错误分类通常显示为孤立的像素;如果压缩导致的失真较大,错误分类可能会以像素组的形式出现,尤其是在RS图像中高对比度边缘的邻域;这是不希望的,值得避免的是,如果由于有损压缩而产生的失真是可见的(在我们的实验中,如果PSNR-HVS-M=30 dB,并且更罕见的是,当PSNR-HVS-M=36 dB时),这种情况通常会发生;
  • 这使我们产生了这样一种想法,即可能值得进行有损压缩,要么在没有视觉上明显失真的情况下,要么在准全息图像区域中进行与噪声部分抑制相关的失真;这可以通过设置所需的PSNR-HVS-M(≈40 dB)或所用编码器的相应PCC(例如,AGU的QS)来控制。
当然,这些结论只是基于对一张测试图像的分析,还需要更多的研究。一个机会是检查它们是否有真实的遥感数据。

5.真实生活三通道图像分析

我们对真实图像的实验是使用我们之前研究中使用的三通道Landsat TM图像进行的[38,39]. 此测试图像(以中的伪彩色表示形式显示图7a) 包含在中心波长分别等于0.66μm、0.56μm和0.49μm的光学波段中采集的三个分量图像。它们与512×512像素的彩色图像的R、G和B分量相关联。该图像有五个可识别的类别,即“土壤”(1类)、“草”(2类)、”水”(3类),“城市(道路和建筑)”(4类)和“灌木”(5类)。分类器训练中使用的图像片段如所示图7b而用于验证分类器的像素用相同的颜色标记图7c.有关像素数的详细信息,请参见[39]. 1类用红色标记,2类用绿色标记,3类用深蓝色标记;第4类为黄色,第5类为蓝色。
可以看到,类的总数小于上一节中的测试图像,但有些类是相同的或类似的。第1类类似于Field-R,第5类类似于“纹理”。与测试RS数据一样,许多类别的颜色特征相交(考虑类别“草地”和“土壤”,类别“土壤”和灌木”)。这意味着分类不是一项简单的任务。
有关该图像分量有损压缩的部分数据如所示表13(有关更多详细信息,请参阅[39]). 可以看出,提供PSNR-HVS-Mdes公司=42 dB,必须使用QS≈17.3。提供PSNR-HVS-Mdes公司=42 dB,QS≈29.3。这与中的数据非常一致图1用于其他测试图像。因此,可以就提供PSNR-HVS-M时使用的QS提出建议des公司(详见[23]).
请注意,提供的CR可能很大。PSNR-HVS-M的CR大约为6des公司=42 dB,PSNR-HVS-M达到16.5des公司=30分贝。
我们对PSNR-HVS-M的六个值(45、42、39、36、33和30 dB)进行了分析。图8给出了所考虑的三通道压缩图像(伪彩色表示),PSNR-HVS-M等于42 dB、36 dB和30 dB。它们彼此之间非常相似,并且与原始图像相似。更仔细的分析可以发现图像的差异图8b、 c主要出现在小型物体和高对比度边缘的附近。

5.1. MLM分类器结果

让我们首先考虑应用为原始图像训练的MLM分类器的结果。表14,表15,表16表17以混淆矩阵的形式表示获得的数据。如图所示,特定类别的正确分类概率在0.75到0.99之间变化,而最小的概率发生在相当异质的类别“土壤”和“灌木”。
现在考虑一下,如果MLM分类器应用于具有可见失真的压缩图像(PSNR-HVS-M=36 dB),则获得的数据。混淆矩阵如下所示表16特定类别的正确分类的大多数概率继续降低,尽管与之前的情况相比,这种降低并不重要,高达0.021(表15).
最后,让我们分析MLM分类器应用到的压缩图像(PSNR-HVS-M=30dB)的数据。数据显示在表17趋势是,特定类别的正确分类概率继续下降,但下降幅度不大。
三幅图像的分类图如所示图9。虽然可以发现一些差异,但它们非常相似。压缩不会导致分类精度的根本降低。
人们可以对P的行为感兴趣复写的副本取决于压缩。对于原始图像P复写的副本= 0.865; 对于压缩图像,PSNR-HVS-M分别等于45、42、39、36、33和30 dB,它等于0.853、0.854、0.853、0849、0.842和0.839。因此,可以说,提供约40 dB的PSNR-HVS-M的有损压缩不会导致P的充分降低复写的副本对于所考虑的情况。此外,如果对与要分类的图像具有相同条件的压缩图像进行训练,则分类结果可以提高。例如,如果对压缩图像(PSNR-HVS-M=36 dB)进行了训练,然后应用于该图像(用于验证像素集),P复写的副本增加到0.855。
我们分析了压缩前后的特征分布。P的一个原因复写的副本不随CR增加而急剧减少的是,相应的分布差别不大。“土壤”和“灌木”类的差异最大。“Urban”这一类被如此认可,这可能有点令人惊讶。原因是,对于所考虑的图像,此类的特征与其他类的特征没有充分重叠。

5.2. NN分类器结果

现在考虑一下基于NN的真实图像分类的结果。理想情况数据(针对原始图像训练的神经网络应用于原始图像)如下所示表18。结果可以与中的数据进行比较表14神经网络分类器更好地识别“土壤”和“草”类,“水”类的结果大致相同。
假设现在将此分类器(针对原始图像训练的NN)应用于压缩图像。不同质量的压缩数据的结果如所示表19,表20表21如果PSNR-HVS-M等于42 dB或36 dB,则结果几乎保持不变。只有“布什”正确分类的概率稳步下降。对于PSNR-HVS-M压缩为30 dB的图像,分类精度下降幅度较大。主要是对“水”和“城市”类进行了削减。
一些分类图如所示图10他们之间没有太大区别。一些像素属于狭窄河流的“Water”类(请参见中的左下角图10c) “消失”(分类错误)。这是因为有损压缩会对延长的对象产生涂抹效果。压缩图像的MLM分类器训练是使用中所示碎片的训练样本进行的图7b.由于在培训和验证中使用了相同的数据,因此可以观察到显著的分类改进(至少对于几个类)。

5.3. Sentinel-2三通道图像浅析

人们可能会感兴趣的是,观察到的相关性是否适用于其他图像或其片段、其他图像器和其他压缩技术。Sentinel-2提供了广泛的检查可能性,因为它提供了大量可用于不同目的的数据。在我们的研究中,我们拍摄了2019年8月30日拍摄的哈尔科夫地区(乌克兰)可见光范围内的三通道图像,当时几乎没有云(图像可在[56]). 分析的512×512像素碎片适用于Staryi Saltiv附近(乌克兰哈尔科夫东北45 km,第1组)和哈尔科夫北部(第2组)-见图11选择这些碎片的主要原因是地面实况数据的可用性,这些数据可以方便地标记四个典型类别:城市、水、植被和裸地。还有一个原因是图11a比中的图像复杂得多(纹理)图11b。
首先,通过使用三个编码器提供一组PSNR-HVS-M值,对这些片段进行了组件式压缩:本文前面部分中使用的AGU,SPIHT[57]它可以被视为JPEG2000标准和高级DCT编码器(ADCTC)的模拟[58]它使用分区方案优化来更好地适应图像内容。压缩性能的基本数据见表22。观察到的依赖关系是可预测的。如果期望的PSNR-HVS-M降低,则所有编码器的CR都会增加。对于相同的期望PSNR-HVS-M和集合的不同分量的CR值不同,但并不显著。AGU的CR通常略大于SPIHT(在相同条件下),ADCTC优于这两个编码器。由于集2 RS数据的复杂性更高,因此集2图像的CR值比对应的集1图像小几倍。
其次,进行了分类器训练,得到了所有四类的正确分类概率以及正确分类的总概率。对于NN分类器和AGU编码器,数据显示在表23表24这里和下面的缩写词SS1表示已对原始(未压缩)图像1进行了分类,而例如,SS1_45表示已对压缩后的图像进行分类,并提供PSNR-HVS-M=45 dB。已经对原始图像进行了培训。可以看到,Set 1图像的压缩结果实际上并不取决于压缩图像的质量。即使PSNR-HVS-M=30 dB,正确分类的概率实际上与原始数据的概率相同。与此同时,对于第二组图像,情况则是另一种。如果压缩图像质量变差,分类精度有下降的趋势。这主要是由于对更多异质类(例如植被)的正确分类概率降低。对于此图像,可以建议使用PSNR-HVS-M压缩约42 dB,以避免分类精度大幅降低。
我们还分析了使用压缩图像进行训练的可能性。对于集1图像,正确分类的概率提高了约0.01,而对于集2图像,几乎保持不变。
我们研究的另一部分与MLM分类有关(相同的映射用于训练NN和MLM)。MLM已经应用于由上述三个编码器压缩的数据。对于AGU编码器,获得的数据显示在表25表26.
可以看出,有损压缩会对Set 1图像产生积极影响。对于除裸土外的所有类别,正确分类的概率提高或保持不变。对于压缩图像的所有考虑的质量,总概率也提高并保持在大致相同的水平(表25). 同时,对于集2图像,较大的CR会导致总概率的稳定降低,并且大多数类别的概率也会降低表26).
我们还检查了是否值得对压缩图像而不是未压缩图像进行训练。和前面一样,答案是肯定的。特别是,对于使用PSNR-HVS-M压缩的图像=42 dB。集合1数据的总概率等于0.893,集合2图像的总概率为0.858。因此,值得在训练中使用与分类图像具有相同压缩条件的数据。
SPIHT编码器获得的数据如所示表27表28。他们的分析显示如下。同样,有损压缩对Set 1数据的分类影响很小。对于PSBR-HVS-M,观察到大约40dB的最佳值。压缩对Set 2数据的影响也很小。对于某些类,正确分类的概率会提高,而对于其他类,正确归类的概率会稍差。总的来说,总概率几乎保持不变。
现在考虑ADCTC获得的数据。它们显示在表29表30他们的分析显示了与SPIHT编码器观察到的趋势相同的趋势。

6.讨论

以上,我们考虑了一个测试和三个真实的三通道图像的趋势,这些图像以每个组件的8位2D数据表示。实际上,图像可以以不同的方式呈现,例如,16位数据[13]或经过一定的归一化处理后的10位数据[59]. 然后,出现了一个问题,即如何为要压缩的给定多通道图像提供所需的PSNR-HVS-M(例如,40 dB)。为了回答这个问题,让我们考虑一些数据。第一,图11取自[60]针对AGU的九幅不同复杂度的8位灰度测试图像,给出了PSNR-HVS-M对QS的依赖性。给出了这九幅测试图像的平均曲线。可以看出,该平均曲线允许近似设置QS,以提供所需的PSNR-HVS-M。例如,要提供PSNR-HVS-M≈43 dB,必须设置QS记录≈ 15. 为了提供PSNR-HVS-M≈40 dB,可以设置QS记录≈ 20. 如果D不等于255,则建议的QS为
质量体系记录D=质量体系记录D/255,
其中QS记录由平均曲线确定图11根据中的数据分析图11、QS的使用记录或QS记录D提供PSNR-HVS-M近似值时,根据要压缩的图像的复杂性,误差可能高达1…2 dB。这种精度可以接受,因为如前一节所示,PSNR-HVS-M即使变化2 dB也不会导致P的根本变化复写的副本以及特定类别正确分类的概率。第二,如果在提供所需PSNR-HVS-M时出现错误,则可以通过应用[60]. 如图所示表13,应用于分量压缩的QS实际上对所有分量都是相同的。这意味着这足以确定QS记录或QS记录D对于一个组件图像,然后将其应用于压缩其他组件(这可以在数据压缩阶段节省时间和资源)。此外,QS记录或QS记录D根据上述建议确定的可以用于多通道图像的所有组件或组件组的联合压缩[59]AGU的3D版本。在这种情况下,积极影响是双重的。首先,与组件式压缩相比,提供了更大的CR。其次,可以确保压缩图像的质量稍高。
图12证明了PSNR-HVS-M对不同测试图像的QS的依赖性。图13显示了RS数据处理流程图。采集的图像(如车载图像)在质量控制压缩单元中进行“仔细”有损压缩,其中PCC(如QS)是使用所选质量指标的期望阈值(如PSNR-HVS-M的40 dB)和预先获得的速率/失真曲线(如图12). 如果图像在压缩之前进行了标准化,则可以进行PCC校正。在图像分类单元中,RS数据接受分类,分类器可以使用早期处理的图像或刚收到的数据进行训练。如果时间限制不严格,第二种选择似乎更可取(根据我们的分析结果)。
另一个多次出现的问题是:是否有可能提高分类精度?从我们的分析中很容易得出的一个答案是,像素分类(至少是我们使用的简单版本)不允许利用相邻像素的信息。这些信息可以是不同类型的,也可以以不同的方式使用。例如,像素可以初步分类为同质、纹理或局部活动区域(通过局部活动,我们指的是属于小型对象或边缘或其邻域的像素)。然后,可以确定不同的特征并将其用于此类预分类像素。然而,这种方法超出了本文的范围。
还有两种其他可能的方法。他们是在[39]. 首先,可以并行应用几个基本分类器(例如,MLM、NN和SVM分类器),然后可以组合它们的输出。其次,可以对分类结果进行后处理,并对边缘进行初步检测。注意,这些方法可以导致P的充分增加(最多0.1…0.2)复写的副本尤其是当原始分类数据的值较低时。同时,为验证在[39]都是必需的。
最后,最后一个问题是如何在不损失多通道RS数据分类性能的情况下提高CR?我们认为,应该应用3D压缩。然而,在这种情况下,还需要进行额外的研究。

7.结论

我们考虑了通过引入不同程度的失真来对多通道图像进行有损压缩的任务,以分析它们对分类精度的影响。研究了两种分类器,即MLM和NN。使用了基于DCT的编码器AGU。此外,还使用了另外两个基于变换的编码器,并对其性能进行了简要分析。对一幅人工三通道图像和三幅真实三通道图像进行了深入分析。组件式压缩已通过视觉质量度量PSNR-HVS-M进行了质量控制(表征)。
以下是针对原始(未压缩)数据的分类器训练的情况;
-
如果在没有可见失真的情况下压缩图像(PSNR-HVS-M超过40…42 dB),分类精度不会有足够的降低;在某些情况下,与原始(未压缩)数据的TPCC相比,TPCC甚至可以增加;
-
即使失真是可见的(PSNR-HVS-M<40 dB),有损压缩也不会对分类精度产生很大的负面影响,但如果压缩图像的结构简单,就会出现这种情况;
-
根据图像复杂度,上述级别的失真导致不同的CR;这意味着具有复杂结构的图像必须使用较小的CR进行压缩,以避免P值的显著降低复写的副本;
-
特定类别的正确分类概率对压缩参数的依赖性不同;对于主要由大型对象表示的类,有损压缩不是那么关键;如果噪声或高频变化被部分抑制,甚至可能发生有损压缩可以提高分类精度;
-
对于由小尺寸和长时间对象以及某些纹理表示的类,有损压缩可能会导致分类精度的充分降低。这是由于变换特征的图像涂抹效果造成的。
如果对压缩数据进行培训,情况会略有不同。然后,值得使用它来训练这些压缩数据,这些压缩数据的特征是与要应用分类的数据具有相同的质量(例如,近似相同的PSNR-HVS-M值)。然后,即使PSNR-HVS-M约为36dB,分类效果也几乎与针对原始数据训练的分类器所分类的原始图像一样好。
研究还表明,对于不同的编码器(尤其是基于DCT和小波的压缩技术)以及不同多光谱系统提供的数据,可以观察到主要的相关性。我们还相信,除了PSNR-HVS-M之外,视觉质量指标也可以应用于有损压缩的拟议方法中。因此,这种方法非常通用。
最后,给出了如何设置编码器参数以避免分类精度降低的实用建议。简述了分类改进的可能性,并描述了未来的研究方向。

补充材料

以下内容可在线获取,网址为https://www.mdpi.com/2072-4292/12/3840/s1,2013年TID数据库49个质量指标的斯皮尔曼秩序相关系数(SROCC)值。

作者贡献

I.V.创建并测试了MLM分类器,O.R.创建并测试了基于NN的分类器,F.L.执行了具有所需特征的压缩;S.K.参与模型数据设计,S.A.负责仿真结果分析,V.L.提出编码器参数选择的想法并编写论文草稿,B.V.负责真实图像结果分析,K.C.提出调查方法,K.E.进行编辑和监督。所有作者都已阅读并同意手稿的出版版本。

基金

这项研究没有得到外部资助。

利益冲突

作者声明没有利益冲突。

工具书类

  1. 米尔克,C。;新泽西州博什切。;罗加斯,C。;塞格尔,K。;Gauert,C。;Kaufmann,H.Sentinel-2多光谱传感器和ENMAP高光谱传感器在矿产勘探中的潜在应用。2014年2月13日,波兰华沙,EARSeL电子程序会议记录;第13卷,第93-102页。[谷歌学者]
  2. 斯科文格特,R.A。遥感:图像处理模型和方法第3版。;学术出版社:美国加州圣地亚哥,2007年;第515页。[谷歌学者]
  3. Joshi,N。;Baumann,M。;埃哈默,A。;芬肖特,R。;Grogan,K。;霍斯特,P。;Jepsen,M.R。;Kuemmerle,T。;Meyfroidt,P。;E.T.A.米查德。;等人,《光学和雷达遥感数据融合在土地利用制图和监测中的应用综述》。剩余传感器。 2016,8, 23. [谷歌学者] [交叉参考] [绿色版本]
  4. Deledale,C。;丹尼斯,L。;Tabti,S。;Tupin,F.MuLoG,或如何将高斯去噪应用于多通道SAR斑点抑制?IEEE传输。图像处理。 2017,26, 4389–4403. [谷歌学者] [交叉参考] [公共医学] [绿色版本]
  5. Ponomaryov,V。;Rosales,A。;加列戈斯,F。;Loboda,I.处理多通道图像的自适应矢量方向滤波器。Ieice Trans.公司。Commun公司。 2007,90, 429–430. [谷歌学者] [交叉参考]
  6. 钟,P。;Wang,R.高光谱图像垃圾带去噪的多光谱带CRF。IEEE传输。地质科学。远程传感器。 2013,51, 2269–2275. [谷歌学者] [交叉参考]
  7. Sentinel-2A的首次应用。在线可用:http://www.esa.int/Our_Activities/Observing_the_Earth/Copernicus/Sentinel-2/First_applications_from_Sentinel-2A(2019年1月10日访问)。
  8. Kussul,N。;Lemoine,G。;F.J.加列戈。;斯卡昆,S。;Lavreniuk,M。;Shelestov,A.利用Landsat-8数据和Sentinel-1A数据对乌克兰基于地块的作物分类。IEEE J.选择。顶部。申请。地球目标遥感。 2016,9, 2500–2508. [谷歌学者] [交叉参考]
  9. Bioucas-Dias,J.M。;A广场。;Camps-Valls,G。;Schenders,P。;北卡罗来纳州纳斯拉巴迪。;Chanussot,J.高光谱遥感数据分析和未来挑战。IEEE地质科学。远程传感器磁。 2013,1, 6–36. [谷歌学者] [交叉参考] [绿色版本]
  10. Chi,M。;A广场。;Benediktsson,J.A。;孙,Z。;沈,J。;Zhu,Y.遥感大数据:挑战与机遇。程序。电气与电子工程师协会 2016,104, 2207–2219. [谷歌学者] [交叉参考]
  11. Christophe,E.高光谱数据压缩权衡。选择。远程传感器高级信号处理。利用。技术。 2011,7, 9–29. [谷歌学者]
  12. 布兰斯,I。;Magli,E。;Serra-Sagrista,J.光学空间成像系统图像压缩教程。IEEE地质科学。远程传感器磁。 2014,2, 8–26. [谷歌学者] [交叉参考] [绿色版本]
  13. Zemliachenko,A.N。;Kozhemiakin,R.A。;Uss,M.L。;Abramov,S.K.公司。;新墨西哥州波诺马伦科。;Lukin,V.V.基于噪声参数估计和方差稳定变换的高光谱图像有损压缩。J.应用。远程传感器。 2014,8, 25. [谷歌学者] [交叉参考]
  14. Manolakis博士。;洛克伍德,R。;Cooley,T.关于高光谱成像数据的光谱相关结构。2008年7月7日至11日,美国马萨诸塞州波士顿,IGARSS 2008-2008 IEEE国际地球科学和遥感研讨会论文集;第II-581–II-584页。[谷歌学者]
  15. Lam,K.W。;Lau,W。;李,Z。图像压缩技术对图像分类的影响。阿姆斯特丹国际建筑。照片。远程传感器。 2000,33, 744–751. [谷歌学者]
  16. 佩纳,B。;蒂洛,T。;Magli,E。;Olmo,G.有损高光谱数据压缩的变换编码技术。IEEE传输。地质科学。远程传感器。 2007,45, 1408–1421. [谷歌学者] [交叉参考]
  17. Kaur,A。;Wasson,V.使用分形有损压缩压缩陆地图像。国际工程计算杂志。科学。 2014,, 8806–8811. [谷歌学者]
  18. Taubman,D。;马塞林,M。JPEG2000图像压缩基础、标准和实践; Kluwer学术出版社:美国马萨诸塞州波士顿,2002年;第777页。[谷歌学者]
  19. 桑托斯,L。;洛佩兹,S。;Callico,G。;洛佩兹,J。;Sarmiento,R.有损高光谱图像压缩H.264/AVC视频编码标准的性能评估。IEEE J.选择。主题应用。地球观测站。远程传感器。 2012,5, 451–461. [谷歌学者] [交叉参考]
  20. 克里文科,S。;Krylova,O。;巴塔耶娃,E。;Lukin,V.基于失真预测的图像智能有损压缩。电信通信。无线电工程师。 2018,77, 1535–1554. [谷歌学者] [交叉参考]
  21. 赫利菲,F。;布瑞丹,A。;Kurugollu,F.联合光谱树,用于基于SPIHT的可缩放多光谱图像压缩。IEEE传输。Multimed公司。 2008,10, 316–329. [谷歌学者] [交叉参考]
  22. Zemliachenko,A。;Kozhemiakin,R。;Abramov,S。;卢金,V。;Vozel,B。;Chehdi,K。;Egiazarian,K.基于DCT的编码器的压缩比预测及其在遥感图像中的应用。J.塞尔。顶部。申请。地球目标遥感。 2018,11, 257–270. [谷歌学者] [交叉参考]
  23. Zemliachenko,A。;北卡罗来纳州Ponomarenko。;卢金,V。;Egiazarian,K。;Astola,J.静止图像/视频帧有损压缩提供所需的视觉质量。多维空间。系统。信号处理。 2015,27, 697–718. [谷歌学者] [交叉参考]
  24. Shi,C。;Wang,L。;张杰。;苗,F。;He,P.自适应基于内容驱动四叉树编码的基于方向提升的块变换的遥感图像压缩。剩余传感器。 2018,10, 999. [谷歌学者] [交叉参考] [绿色版本]
  25. Balasubramanian,R。;Ramakrishnan,S.S.小波在遥感图像压缩中的应用。2013年7月26日至28日,中国南京,《2013年国际遥感、环境与运输工程会议论文集》;第659-662页。[谷歌学者]
  26. Jagadeesh,P。;库马尔,S。;Nedumaan,J.接受设计视频游戏的灵活性和灵活性的挑战。国际期刊信息安全。 2015,14, 582–590. [谷歌学者]
  27. Ozah,N。;Kolokolova,A.压缩提高了图像分类精度。2019年5月28日至31日在加拿大安大略省金斯顿举行的第32届加拿大人工智能会议记录中;第525-530页。[谷歌学者]
  28. 陈,Z。;Ye,H。;映雪,Z。基于分形分析的压缩对遥感图像分类的影响。IEEE传输。地质科学。远程传感器。 2019,57, 4577–4589. [谷歌学者] [交叉参考]
  29. 加西亚·索布利诺,J。;拉帕拉,V。;Serra-Sagristá,J。;卡尔贝特,X。;Camps-Valls,G.通过IASI数据的空间谱数据压缩改进了基于统计的检索。IEEE传输。地质科学。远程传感器。 2019,57, 5651–5668. [谷歌学者] [交叉参考]
  30. Gimona,A。;Poggio,L。;奥尔德斯,I。;Aitkenhead,M.图像压缩对合成PROBA-V图像的影响。《国际遥感杂志》。 2014,35, 2639–2653. [谷歌学者] [交叉参考]
  31. 佩拉,C。;阿佐里,L。;De Natale,F.G.B.在光谱VQ中引入监督分类,用于多通道图像压缩。在IGARSS 2000,IEEE 2000国际地球科学和遥感研讨会论文集中。《把握地球脉搏:遥感在环境管理中的作用》(分类号:00CH37120),美国夏威夷州火奴鲁鲁,2000年7月24日至28日;第597-599页。[谷歌学者] [交叉参考]
  32. Izquierdo-Verdiguier,E。;拉帕拉,V。;Gómez-Chova,L。;Camps Valls,G.用SVM编码遥感图像分类中的不变量。IEEE地质科学。遥感快报。 2013,10, 981–985. [谷歌学者] [交叉参考]
  33. 扎巴拉,A。;Pons,X.有损压缩对遥感作物面积制图的影响。《国际遥感杂志》。 2013,34, 2796–2813. [谷歌学者] [交叉参考]
  34. 扎巴拉,A。;Pons,X。;迪亚兹·德尔加多,R。;加西亚,F。;Auli-Llinas,F。;Serra-Sagrista,J.JPEG和JPEG2000有损压缩对作物和森林地区制图遥感图像分类的影响。2006年7月31日至8月4日在美国科罗拉多州丹佛举行的2006年IEEE地球科学和遥感国际研讨会论文集;第790-793页。[谷歌学者] [交叉参考] [绿色版本]
  35. 波波夫,文学硕士。;Stankevich,S.A.公司。;Lischenko,L.P.公司。;卢金,V.V。;Ponomarenko,N.N.城市地区污染检测的高光谱图像处理。环境安全与生态恐怖主义; 施普林格:德国柏林/海德堡,2010年;第25-26页。[谷歌学者]
  36. 波诺马连科,N。;克里文科,S。;卢金,V。;Egiazarian,K。;Astola,J.基于视觉质量的噪声图像有损压缩:一项综合研究。Eurasip。贾斯普。 2010,2010, 976436. [谷歌学者] [交叉参考] [绿色版本]
  37. Al-Shaykh,OK。;Mersereau,R.M.噪声图像的Lossy压缩。IEEE传输。图像处理 1998,7, 1641–1652. [谷歌学者] [交叉参考]
  38. Lukin,V.环境监测用多通道遥感数据的处理。程序。北约高级研究研讨会地理组。Inf.流程。视觉。分析。环境。安全。 2009,1, 129–138. [谷歌学者]
  39. Proskura,G。;瓦西里耶娃,I。;芳芳,L。;Lukin,V.压缩多通道图像的分类及其改进。在2020年4月15日至16日于斯洛伐克布拉迪斯拉发举行的第30届Radioelektronika国际会议记录中;第62-67页。[谷歌学者]
  40. Lukin等人。;Zemliachenko,A。;克里文科,S。;Vozel,B。;切迪,K。畸变可控的遥感图像有损压缩。卫星信息分类与解释; Rustam,B.R.,编辑。;IntechOpen:英国伦敦,2018年。[谷歌学者] [交叉参考] [绿色版本]
  41. Krivenko,S.S.公司。;Abramov,S.K.公司。;卢金,V.V。;Vozel,B。;Chehdi,K.基于Lossy DCT的遥感图像压缩,提供所需的视觉质量。遥感图像和信号处理XXV; 国际光学和光子学学会:美国华盛顿州贝灵汉,2019年;第11155页。[谷歌学者] [交叉参考]
  42. 新墨西哥州波诺马伦科。;卢金,V.V。;Egiazarian,K。;Astola,J.基于DCT的高质量图像压缩。斯堪的纳维亚图像分析会议; 施普林格:柏林/海德堡,德国,2005年;第1177-1185页。[谷歌学者]
  43. 卢金,V。;Abramov,S。;克里文科,S。;Kurekin,A。;Pogrebnyak,O。预过滤多通道遥感数据的分类精度分析。J.专家系统。申请。 2013,40, 6400–6411. [谷歌学者] [交叉参考]
  44. 康加尔顿,R.G。;格林,K。评估遥感数据的准确性:原则和实践; CRC出版社:佛罗里达州,佛罗里达州,美国,1999年。[谷歌学者]
  45. 卢金,V。;波诺马连科,N。;Egiazarian,K。;Astola,J.使用彩色图像数据库TID2013分析HVS-Metrics的特性。程序。酸中毒病毒 2015,9386, 613–624. [谷歌学者]
  46. Lin,W。;郭杰伦(Jay Kuo),C.C.感知视觉质量指标:一项调查。视觉杂志。Commun公司。图像表示。 2011,22, 297–312. [谷歌学者] [交叉参考]
  47. 北卡罗来纳州Ponomarenko。;西尔维斯特里,F。;Egiazarian,K。;Carli,M。;阿斯托拉,J。;Lukin,V.关于DCT基函数的系数间对比度掩蔽。2007年1月25日至26日在美国亚利桑那州斯科茨代尔举行的第三届视频处理和质量指标国际研讨会论文集;第7卷。[谷歌学者]
  48. 在线可用:http://ponomarenko.info/psnrhvsm.htm(2020年11月20日查阅)。
  49. 奥雷米耶夫。;卢金,V。;Okarma,K。;Egiazarian,K.基于神经网络的全参考质量度量,用于评估遥感图像的视觉质量。远程传感器。 2020,12, 2349. [谷歌学者] [交叉参考]
  50. Sun,J。;杨,J。;张,C。;Yun,W。;Qu,J.基于最大似然法的网格环境下遥感图像自动分类。数学。计算。模型。 2013,58, 573–581. [谷歌学者] [交叉参考]
  51. 西索迪亚,P.S。;蒂瓦里,V。;Kumar,A.遥感图像监督最大似然分类分析。国际工程最新进展和创新会议(ICRAIE-2014); IEEE:美国纽约州皮斯卡塔韦,2014年;第1-4页。[谷歌学者] [交叉参考]
  52. 巴雷索尔,B.R。Johnson’s s的参数恢复B类分发; 美国农业部,林业局,南方研究站:阿什维尔,北卡罗来纳州,美国,2003年;第9卷。
  53. A.J.莱蒙特。;Bazán,J.L.新型Johnson SB分布及其相关的比率和比例回归模型。生物。J。 2016,58, 727–746. [谷歌学者] [交叉参考]
  54. C.M.主教。模式识别与机器学习; 施普林格:美国纽约州纽约市,2006年。[谷歌学者]
  55. Bioucas Dias,J.M.高光谱解混合概述:基于几何、统计和稀疏回归的方法。IEEE J.选择。顶部。申请。地球目标遥感。 2012,5, 354–379. [谷歌学者] [交叉参考] [绿色版本]
  56. 在线可用:https://apps.sentinel-hub.com/eo-browser/?lat=46.45&lng=34.12&zoom=6&time=2019-11-03&预设=3_NDVI&数据源=哨兵-2%20L1C(2020年11月20日查阅)。
  57. Taubman,D。;马塞林,M.W。JPEG2000图像压缩:基础、标准和实践; Kluwer学术出版社:荷兰多德雷赫特,2002年。[谷歌学者] [交叉参考]
  58. 新墨西哥州波诺马伦科。;科威特埃吉亚扎里安。;卢金,V.V。;Astola,J.T.使用分区方案的基于高质量DCT的图像压缩。IEEE信号处理。莱特。 2007,14, 105–108. [谷歌学者] [交叉参考]
  59. Zemliachenko,A。;卢金,V。;奥雷米耶夫。;Vozel,B.亚带组高光谱图像有损压缩的特殊性。2019年IEEE第二届乌克兰电气与计算机工程会议(UKRCON)会议记录,2019年7月2-6日,乌克兰利沃夫;第918-923页。[谷歌学者]
  60. 李,F。;克里文科,S。;Lukin,V.在图像无损压缩中提供所需视觉质量的两步方法。2020年2月25日至29日,乌克兰利维夫·斯拉夫斯克,IEEE第15届国际无线电电子学、通信和计算机工程先进趋势会议(TCSET)会议记录;第502-506页。[谷歌学者] [交叉参考]
图1。测试灰度图像Frisco(),机场(c(c))和迭戈(e(电子))、所有尺寸均为512×512像素,以及这些测试图像的编码器AGU的量化步长(QS)对所考虑指标(PSNR、PSNR-HVS、PSRN-HVS-M,均以dB为单位)的依赖性((b), (d日)、和(如果))。
图1。测试灰度图像Frisco(),机场(c(c))和迭戈(e(电子))、所有尺寸均为512×512像素,以及这些测试图像的编码器AGU的量化步长(QS)对所考虑指标(PSNR、PSNR-HVS、PSRN-HVS-M,均以dB为单位)的依赖性((b), (d日)、和(如果))。
远程调校12 03840 g001
图2。三通道测试图像:原始(),它的三个组件(bd日),通过提供PSNR-HVS-M=36 dB进行压缩(e(电子)),通过提供PSNR-HVS-M=30 dB进行压缩(如果).
图2。三通道测试图像:原始(),它的三个组件(bd日),通过提供PSNR-HVS-M=36 dB进行压缩(e(电子)),通过提供PSNR-HVS-M=30 dB进行压缩(如果).
远程定位12 03840 g002a远程设置12 03840 g002b
图3。分类结果:真实地图(); 原始图像分类图(b); PSNR-HVS-M=36 dB压缩图像的分类图(c(c)); PSNR-HVS-M=30dB压缩图像的分类图(d日).
图3。分类结果:真实地图(); 原始图像分类图(b); PSNR-HVS-M=36 dB压缩图像的分类图(c(c)); PSNR-HVS-M=30dB压缩图像的分类图(d日).
遥感12 03840 g003
图4。使用针对同一压缩图像训练的最大似然法(MLM)分类器提供PSNR-HVS-M=36 dB的压缩图像分类图(); 使用针对同一压缩图像训练的MLM分类器提供PSNR-HVS-M=30 dB的压缩图像(b).
图4。使用针对同一压缩图像训练的最大似然法(MLM)分类器提供PSNR-HVS-M=36 dB的压缩图像分类图(); 使用针对同一压缩图像训练的MLM分类器提供PSNR-HVS-M=30 dB的压缩图像(b).
远程定位12 03840 g004
图5。分类结果:对于压缩图像(PSNR-HVS-M=42 dB)(),用于压缩图像(PSNR-HVS-M=36 dB)(b); 对于压缩(PSNR-HVS-M=30 dB)(c(c)).
图5。分类结果:对于压缩图像(PSNR-HVS-M=42 dB)(),用于压缩图像(PSNR-HVS-M=36 dB)(b); 对于压缩(PSNR-HVS-M=30 dB)(c(c)).
远程定位12 03840 g005
图6。同一图像的神经网络训练图像分类结果:原始(),用PSNR-HVS-M压缩=42 dB(b),用PSNR-HVS-M压缩=36 dB(c(c)),用PSNR-HVS-M压缩=30 dB(d日).
图6。同一图像的神经网络训练图像分类结果:原始(),用PSNR-HVS-M压缩=42 dB(b),用PSNR-HVS-M压缩=36 dB(c(c)),用PSNR-HVS-M压缩=30 dB(d日).
远程设置12 03840 g006
图7。伪彩色表示中的三通道图像(); 用于训练的像素组(b),用于验证的像素组(c(c)).
图7。伪彩色表示中的三通道图像(); 用于训练的像素组(b),用于验证的像素组(c(c)).
远程设置12 03840 g007
图8。伪彩色表示的三通道图像:通过提供PSNR-HVS-M=42 dB进行压缩(),通过提供PSNR-HVS-M=36 dB进行压缩(b); 通过提供PSNR-HVS-M=30 dB进行压缩(c(c)).
图8。伪彩色表示的三通道图像:通过提供PSNR-HVS-M=42 dB进行压缩(),压缩后提供PSNR-HVS-M=36 dB(b); 通过提供PSNR-HVS-M=30 dB进行压缩(c(c)).
远程定位12 03840 g008
图9。分类结果:对于原始图像(),用于压缩图像(PSNR-HVS-M=36 dB)(b),用于压缩(PSNR-HVS-M=30 dB)(c(c)).
图9。分类结果:对于原始图像(),用于压缩图像(PSNR-HVS-M=36 dB)(b),用于压缩(PSNR-HVS-M=30 dB)(c(c)).
远程设置12 03840 g009
图10。基于NN的方法提供的分类结果:对于原始图像(),用于压缩图像(PSNR-HVS-M=36 dB)(b); 对于压缩(PSNR-HVS-M=30 dB)(c(c)).
图10。基于NN的方法提供的分类结果:对于原始图像(),用于压缩图像(PSNR-HVS-M=36 dB)(b); 对于压缩(PSNR-HVS-M=30 dB)(c(c)).
遥感12 03840 g010
图11。Staryi Saltiv Sentinel-2图像片段()和哈尔科夫北部(b).
图11。Staryi Saltiv Sentinel-2图像片段()和哈尔科夫北部(b).
远程设置12 03840 g011
图12。PSNR-HVS-M对九张测试图像的QS的依赖性(参见图上部的列表)和AGU的平均曲线。
图12。PSNR-HVS-M对九张测试图像的QS的依赖性(参见图上部的列表)和AGU的平均曲线。
远程定位12 03840 g012
图13。拟议处理方法的流程图。
图13。拟议处理方法的流程图。
远程设置12 03840 g013
表1。有关类的信息。
表1。有关类的信息。
#类映射(对象示例)红色(直方图和近似值)绿色(直方图和近似值)蓝色(直方图和近似值)
1 远程定位12 03840 i001 远程设置12 03840 i002 远程设置12 03840 i003 远程设置12 03840 i004
2 远程设置12 03840 i005 远程设置12 03840 i006 远程设置12 03840 i007 远程设置12 03840 i008
远程设置12 03840 i009 远程设置12 03840 i010 遥感12 03840 i011 远程设置12 03840 i012
4 远程设置12 03840 i013 远程设置12 03840 i014 远程设置12 03840 i015 远程设置12 03840 i016
5 远程设置12 03840 i017 遥感12 03840 i018 远程设置12 03840 i019 远程设置12 03840 i020
6 遥感12 03840 i021 远程设置12 03840 i022 远程设置12 03840 i023 远程设置12 03840 i024
7 远程设置12 03840 i025 远程设置12 03840 i026 远程设置12 03840 i027 远程设置12 03840 i028
表2。特定类别的正确分类概率取决于图像质量。
表2。特定类别的正确分类概率取决于图像质量。
PSNR-HVS-M,分贝P(P)11P(P)22P(P)33P(P)44P(P)55P(P)66P(P)77
∞(原始图像)0.4750.6670.7730.8540.1930.8220.415
480.1900.7810.6860.3840.0930.8090.579
450.1470.7950.6520.3080.0770.7770.623
420.1010.8040.6150.2530.0580.7120.665
360.0310.8020.5680.1630.0400.5450.777
300.0010.7530.4780.1770.0420.5560.843
表3。类别1有损压缩引起的分布变化的图示。
表3。类别1有损压缩引起的分布变化的图示。
PSNR-HVS-M,分贝红色(直方图和近似值)绿色(直方图和近似值)蓝色(直方图和近似值)

(原始图像)
遥感12 03840 i029 远程设置12 03840 i030 远程设置12 03840 i031
42 远程设置12 03840 i032 远程设置12 03840 i033 远程设置12 03840 i034
36 远程设置12 03840 i035 远程设置12 03840 i036 远程设置12 03840 i037
30 远程设置12 03840 i038 远程设置12 03840 i039 遥感12 03840 i040
表4。类别2有损压缩引起的分布变化的图示。
表4。类别2有损压缩引起的分布变化的图示。
PSNR-HVS-M,分贝红色(直方图和近似值)绿色(直方图和近似值)蓝色(直方图和近似值)
∞(原始图像) 远程设置12 03840 i041 远程设置12 03840 i042 远程设置12 03840 i043
36 遥感12 03840 i044 远程设置12 03840 i045 远程设置12 03840 i046
30 远程设置12 03840 i047 远程设置12 03840 i048 远程设置12 03840 i049
表5。不同图像的正确分类Pcc的总概率取决于“训练”数据。
表5。不同图像的正确分类Pcc的总概率取决于“训练”数据。
用于培训的图像压缩图像正确分类的总概率
PSNR-HVS-M=42分贝PSNR-HVS-M=36分贝PSNR-HVS-M=30分贝
0原始(未压缩)0.5010.4340.442
1通过提供PSNR-HVS-M压缩=42 dB0.5790.5660.563
2通过提供PSNR-HVS-M=36 dB进行压缩0.5190.5970.599
通过提供PSNR-HVS-M=30 dB进行压缩0.4080.4460.527
表6。由神经网络(NN)为该图像训练的原始图像分类的混淆矩阵。
表6。由神经网络(NN)为该图像训练的原始图像分类的混淆矩阵。
等级决策概率
道路字段-Y字段-R草地纹理
道路0.3560.64500000
字段-Y0.1090.6080.0020000.281
字段-R00.0040.9960000
0000.986000.014
草地00000.7440.2450.012
00000.0720.9230.005
纹理00.0300.260.1160.1530.441
表7。神经网络分类的压缩图像的混淆矩阵用于训练原始图像并应用于压缩图像(PSNR-HVS-M=42 dB)。
表7。神经网络分类的压缩图像的混淆矩阵用于训练原始图像并应用于压缩图像(PSNR-HVS-M=42 dB)。
等级决策概率
道路字段Y字段-R草地纹理
道路0.2990.69900000
字段-Y0.0890.62700000.276
字段-R00.0180.9820000
0000.980000.020
草地00000.7530.2190.028
00000.0840.9110.006
纹理00.0300.260.1160.1530.441
表8。神经网络分类的压缩图像的混淆矩阵用于训练原始图像并应用于压缩图像(PSNR-HVS-M=36 dB)。
表8。神经网络分类的压缩图像的混淆矩阵用于训练原始图像并应用于压缩图像(PSNR-HVS-M=36 dB)。
等级决策概率
道路字段-Y字段-R草地纹理
道路0.2710.7280.0010000
字段-Y0.0780.6310.01200.00100.279
字段-R00.0270.9730000
0000.979000.021
草地00000.7210.220.059
00000.0780.9150.007
纹理00.04900.2530.1230.1480.426
表9。神经网络分类的压缩图像的混淆矩阵用于训练原始图像并应用于压缩图像(PSNR-HVS-M=30dB)。
表9。神经网络分类的压缩图像的混淆矩阵用于训练原始图像并应用于压缩图像(PSNR-HVS-M=30dB)。
等级决策概率
道路字段-Y字段-R草地纹理
道路0.2170.76600000.017
字段-Y0.0670.6460.00700.00500.275
字段-R00.050.9460.004000
0000.992000.008
草地00000.6580.210.131
00000.0510.9250.025
纹理00.06700.2430.1410.1310.418
表10。通过训练神经网络对压缩图像进行分类的混淆矩阵(PSNR-HVS-M=42 dB)。
表10。通过训练神经网络对压缩图像进行分类的混淆矩阵(PSNR-HVS-M=42 dB)。
等级决策概率
道路字段-Y字段-R草地纹理
道路0.4550.5450.0010000
字段-Y0.1370.5610.0140000.289
字段-R00.0260.9740000
0000.961000.039
草地00000.8200.1650.015
00000.0680.9290.004
纹理00.02900.2340.1240.1530.461
表11。通过训练神经网络对压缩图像进行分类的混淆矩阵(PSNR-HVS-M=36 dB)。
表11。通过训练神经网络对压缩图像进行分类的混淆矩阵(PSNR-HVS-M=36 dB)。
等级决策概率
道路字段-Y字段-R草地纹理
道路0.5070.4920.0020000
字段-Y0.1270.5620.00500.00100.305
字段-R00.0690.9310000
0000.989000.01
草地00000.9010.0870.013
00000.0390.9560.005
纹理00.02900.2360.1420.1410.452
表12。通过训练神经网络对压缩图像进行分类的混淆矩阵(PSNR-HVS-M=30dB)。
表12。由针对该图像训练的NN分类的压缩图像的混淆矩阵(PSNR-HVS-M=30dB)。
等级决策概率
道路字段-Y字段-R草地纹理
道路0.6920.304000.0020.0010.01
字段-Y0.0550.6540.00900.01900.263
字段-R00.0330.9670.004000
0000.994000.006
草地00000.9390.0350.026
00000.0230.9720.005
纹理00.04900.2210.1130.1310.486
表13。压缩参数。
表13。压缩参数。
组件所需PSNR-HVS-M质量体系提供PSNR-HVS-M
伪红色42分贝17.37241.9416.008
36分贝29.82536.0598.952
30分贝55.55830.00716.503
伪绿色42分贝17.28541.9365.994
36分贝29.85635.9928.968
30分贝55.13429.99616.445
伪蓝色42分贝17.22741.8476.016
36分贝29.72935.9988.993
30分贝55.01430.000816.577
表14。MLM方法的分类概率针对原始图像进行训练并应用于原始图像。
表14。MLM方法的分类概率针对原始图像进行训练并应用于原始图像。
等级决策概率
土壤草地城市的灌木丛
土壤0.7470.02700.0370.189
草地0.1730.81200.0080.007
000.96700.033
城市的0.004000.9890.007
灌木丛0.0910.0680.0130.0160.812
表15。为原始图像训练并应用于压缩图像的MLM方法的分类概率(混淆矩阵)(PSNR-HVS-M=42dB)。
表15。MLM方法的分类概率(混淆矩阵)针对原始图像进行训练,并应用于压缩图像(PSNR-HVS-M=42 dB)。
等级决策概率
土壤草地城市的灌木丛
土壤0.7320.02500.0430.199
草地0.1770.80800.0080.006
000.96300.037
城市的0.005000.9870.008
灌木丛0.1180.070.0140.0180.779
如果对压缩图像应用相同的分类器(PSNR-HVS-M=42 dB),结果会稍差(参见表15).正确分类的概率减少了0.002…0.033。对于最不均匀的类别“衬套”,可以观察到最大的减少。
表16。针对原始图像训练MLM并应用于压缩图像的分类概率(混淆矩阵)(PSNR-HVS-M=36 dB)。
表16。针对原始图像训练MLM并应用于压缩图像的分类概率(混淆矩阵)(PSNR-HVS-M=36 dB)。
等级决策概率
土壤草地城市的灌木丛
土壤0.7440.02800.0430.185
草地0.1850.79900.0090.007
瓦特»000.95900.041
城市的0.005000.9850.010
灌木丛0.1330.0740.0160.0180.758
表17。针对原始图像训练MLM并应用于压缩图像的分类概率(混淆矩阵)(PSNR-HVS-M=30 dB)。
表17。针对原始图像训练MLM并应用于压缩图像的分类概率(混淆矩阵)(PSNR-HVS-M=30 dB)。
等级决策概率
土壤草地城市的灌木丛
土壤0.7240.026-0.0440.206
草地0.1780.80900.0060.007
-00.94200.058
城市的0.007-00.9820.011
灌木丛0.1450.0790.0160.0190.741
表18。基于NN的方法对原始图像进行训练并应用于原始图像的分类概率。
表18。基于NN的方法对原始图像进行训练并应用于原始图像的分类概率。
等级决策概率
土壤草地城市的灌木丛
土壤0.9500000.05
草地01000
000.95200.048
城市的0.098000.7670.135
灌木丛0.1870.0090.020.0090.774
表19。基于NN的方法的分类概率(混淆矩阵)针对原始图像进行训练,并应用于压缩图像(PSNR-HVS-M=42 dB)。
表19。基于NN的方法的分类概率(混淆矩阵)针对原始图像进行训练,并应用于压缩图像(PSNR-HVS-M=42 dB)。
等级决策概率
土壤草地城市的灌木丛
土壤0.9420000.058
草地00.999000.001
000.94200.058
城市的0.01000.7650.136
灌木丛0.2070.0160.0180.0090.751
表20。基于NN的方法的分类概率(混淆矩阵)针对原始图像进行训练,并应用于压缩图像(PSNR-HVS-M=36 dB)。
表20。基于NN的方法的分类概率(混淆矩阵)针对原始图像进行训练,并应用于压缩图像(PSNR-HVS-M=36 dB)。
等级决策概率
土壤草地城市的灌木丛
土壤0.9440000.057
草地01000
000.94100.059
城市的0.108000.7610.131
灌木丛0.2360.0220.0170.0070.718
表21。为原始图像训练并应用于压缩图像的基于NN的方法的分类概率(混淆矩阵)(PSNR-HVS-M=30dB)。
表21。基于NN的方法的分类概率(混淆矩阵)针对原始图像进行训练,并应用于压缩图像(PSNR-HVS-M=30 dB)。
等级决策概率
土壤草地城市的灌木丛
土壤0.9410000.059
草地00.999000.001
0.00100.91900.08
城市的0.099000.7470.153
灌木丛0.2470.0280.0140.0040.707
表22。两组三个编码器的实际数据CR比较。
表22。两组三个编码器的实际数据CR比较。
颜色所需PSNR-HVS-MAGU的CRSPIHT的CRADCTC的CR
伪红色,集14510.3389.46711.306
3918.38316.63120.362
3332.92929.30336.465
伪红色,集2453.3173.2833.498
394.5204.7624.886
337.1217.3607.986
伪绿色,集1457.1795.9577.513
3912.66610.91413.513
3323.90720.83326.030
伪绿色,集2453.2143.1503.363
394.3564.5644.684
336.7847.1057.573
伪蓝色,集1456.6655.7277.216
3911.94210.33612.740
3324.91422.34627.191
伪蓝色,集2453.2123.2523.418
394.3144.6984.785
336.8827.3807.817
表23。集1、AGU编码器、NN分类器的正确分类概率取决于压缩图像质量。
表23。集1、AGU编码器、NN分类器的正确分类概率取决于压缩图像质量。
课程第1阶段SS1_45型SS1_42型SS1_39型SS1_36型SS1_33型SS1_30型
城市的0.7740.7770.7750.7770.7780.7730.786
0.9980.9980.9980.9990.9990.9990.998
植被0.9150.9130.9140.9150.9180.9210.927
裸土0.8090.8110.8090.8090.8120.7980.801
P(P)全部的0.8740.8750.8740.8750.8770.8730.878
表24。集2、AGU编码器、NN分类器的正确分类概率取决于压缩图像质量。
表24。正确分类的概率取决于集合2、AGU编码器、NN分类器的压缩图像质量。
课程第二阶段SS2_45型SS2_42型SS2_39号SS2_36号SS2_33号第2卷第30页
城市的0.8770.8720.8710.8650.8610.8610.864
0.6540.6590.6620.6610.6540.6440.647
植被0.8570.8250.8150.8010.7880.7970.788
裸土0.8900.8670.8650.8690.8660.8600.870
P(P)全部的0.8200.8100.8030.7990.7920.7910.792
表25。集1、AGU编码器、ML分类器的正确分类概率取决于压缩图像质量。
表25。正确分类的概率取决于集合1、AGU编码器、ML分类器的压缩图像质量。
课程第1阶段SS1_45型SS1_42型SS1_39型SS1_36型SS1_33型SS1_30型
城市的0.6950.7270.7270.7350.7450.7430.771
0.9790.990.9920.9920.9930.9920.988
植被0.90.8960.8960.8950.8990.9010.902
裸土0.850.8520.8510.8490.8520.8310.826
P(P)全部的0.8560.8660.8660.8680.8720.8670.872
表26。集2、AGU编码器、ML分类器的正确分类概率取决于压缩图像质量。
表26。集2、AGU编码器、ML分类器的正确分类概率取决于压缩图像质量。
课程第二阶段SS2_45型SS2_42型SS2_39号SS2_36号SS2_33号SS2_30型
城市的0.9170.9140.9130.9130.910.9130.918
0.9230.9020.8930.8850.8730.8730.857
植被0.6910.6670.6470.6450.6340.6310.619
裸土0.8560.8190.8150.8170.8120.8020.812
P(P)全部的0.8470.8260.8170.8150.8070.8050.801
表27。集1、SPIHT编码器、ML分类器的正确分类概率取决于压缩图像质量。
表27。集1、SPIHT编码器、ML分类器的正确分类概率取决于压缩图像质量。
课程第1阶段SS1_45型SS1_42型SS1_39型SS1_36型SS1_33型SS1_30型
城市的0.6950.7210.7240.7280.7350.7420.759
0.9790.9910.9910.9930.9930.9920.985
植被0.90.8990.9010.90.9040.9080.906
裸土0.850.8560.8640.8580.8580.8480.816
P(P)全部的0.8560.8660.870.870.8720.8730.867
表28:。集2、SPIHT编码器、ML分类器的正确分类概率取决于压缩图像质量。
表28:。集2、SPIHT编码器、ML分类器的正确分类概率取决于压缩图像质量。
课程第二阶段SS2_45型SS2_42型SS2_39号SS2_36号SS2_33号SS2_30型
城市的0.9170.9150.9150.9170.9160.920.924
0.9230.9180.9130.9030.8920.8840.875
植被0.6910.6860.6880.6920.6970.6990.707
裸土0.8560.8470.8580.8620.8530.8610.859
P(P)全部的0.8470.8410.8430.8430.8390.8410.841
表29。集1、ADCTC、ML分类器的正确分类概率取决于压缩图像质量。
表29。集1、ADCTC、ML分类器的正确分类概率取决于压缩图像质量。
课程第一阶段SS1_45型SS1_42型SS1_39型SS1_36型SS1_33型SS1_30型
城市的0.6950.7230.7250.7340.7360.7510.76
0.9790.9920.9940.9950.9950.9950.995
植被0.90.8980.90.9010.9010.910.913
裸土0.850.8630.8550.850.8640.840.827
P(P)全部的0.8560.8690.8690.870.8740.8740.874
表30:。集2、ADCTC编码器、ML分类器的正确分类概率取决于压缩图像质量。
表30。集2、ADCTC编码器、ML分类器的正确分类概率取决于压缩图像质量。
课程第二阶段SS2_45型SS2_42型SS2_39号SS2_36号SS2_33号SS2_30型
城市的0.9170.9140.9110.910.9110.9120.915
0.9230.9180.9120.9060.9090.9010.898
植被0.6910.6740.6880.6820.6640.670.693
裸土0.8560.8480.8480.8470.8430.8590.868
P(P)全部的0.8470.8380.840.8360.8320.8360.844
出版商备注:MDPI对公布的地图和机构关联中的管辖权主张保持中立。

分享和引用

MDPI和ACS样式

卢金,V。;瓦西里耶娃,I。;克里文科,S。;李,F。;Abramov,S。;鲁贝尔,O。;沃泽尔,B。;Chehdi,K。;Egiazarian,K。基于质量控制的多通道遥感图像有损压缩。远程传感器。 2020,12, 3840.https://doi.org/10.3390/rs12223840

AMA风格

Lukin V、Vasilyeva I、Krivenko S、Li F、Abramov S、Rubel O、Vozel B、Chehdi K、,Egiazarian K。基于质量控制的多通道遥感图像有损压缩。遥感. 2020; 12(22):3840.https://doi.org/10.3390/rs12223840

芝加哥/图拉宾风格

卢金、弗拉基米尔、伊琳娜·瓦西里耶娃、谢尔盖·克里文科、李方芳、谢尔盖·阿布拉莫夫、奥列克西·鲁贝尔、贝诺伊特·沃泽尔、卡塞姆·切迪,和凯伦·埃吉亚萨里安。2020年,“多通道遥感图像有损压缩与质量控制”遥感第12期,第22期:3840页。https://doi.org/10.3390/rs12223840

请注意,从2016年第一期开始,该杂志使用文章编号而不是页码。查看更多详细信息在这里.

文章指标

返回页首顶部