基于多尺度注意力的遥感影像建筑物提取研究

doi:10.11896/jsjkx.230200134

计算机科学››2024,第51卷››问题（5）: 134-142.数字对象标识：10.11896/jsjkx.230200134

• 计算机图形学&多媒体 • 上一篇下一篇

基于多尺度注意力的遥感影像建筑物提取研究

赫晓慧¹,周涛²,李盼乐²,常静²,李加冕²

1郑州大学地球科学与技术学院郑州 450052
2郑州大学计算机与人工智能学院郑州 450001

收稿日期:2023-02-19 修回日期:2023-08-17 出版日期:2024-05-15 发布日期:2024-05-08
通讯作者:赫晓慧(13137052075@163.com)
基金资助:
河南省重大科技专项——面向超算的黄河模拟器构建与服务关键技术研究(201400210900)

基于多尺度注意的遥感图像建筑物提取研究

何晓辉¹、周涛²，李潘乐²、常静²、李佳勉²

1郑州大学地球科学与技术学院，郑州450052，中国
2郑州大学计算机与人工智能学院，郑州450001，中国

收到：2023-02-19 修订过的：2023-08-17 在线：2024-05-15 出版：2024-05-08
关于作者：何晓辉，1978年生，教授，博士生导师。她的主要研究兴趣包括人工智能、计算机视觉、遥感图像处理和数据挖掘。
支持单位：
河南省重大科技专项——超级计算黄河模拟器建设与服务关键技术研究（201400210900）。

摘要/摘要

摘要：基于深度学习的遥感影像建筑物提取方法具有覆盖范围广、运算效率高的特点,在城市建设、灾害防治等方面有着重要的实际意义。主流方法大多采用多尺度特征融合的方式使神经网络能够学习到更丰富的语义信息,然而由于受到多尺度特征的复杂性以及其他类别地物的干扰,该类方法往往存在着目标漏检与噪声密集的问题。对此,文中设计并实现了一种结合注意力机制的特征解译模型MGA-ResNet50（MGAR）该方法的核心在于利用多头注意力对高等级语义信息进行分层加权处理,以提取出表征效果较好的最优特征组合;而后使用门控结构将每维特征图与对应编码端的低级语义信息融合,来解决局部建筑物细节信息丢失的问题。在马萨诸塞州建筑，WHU建筑等公开数据集上的实验结果表明,与RAPNet、GAMNet、GSM等较为先进的多尺度特征融合方法相比,所提算法能够取得更高的F1 IoU

关键词: 深度学习, 建筑物提取, 多尺度特征, 多头注意力, 门控机制

摘要：基于深度学习的遥感图像建筑物提取具有覆盖面广、计算效率高等特点，在城市建设、防灾等方面发挥着重要作用。大多数主流方法使用多尺度特征融合，使神经网络能够学习更丰富的语义信息。然而，由于多尺度特征的复杂性和其他地物的干扰，这种方法往往会导致目标丢失和噪声密集。为此，本文提出了一种结合注意机制的特征解释模型MGA-ResNet50（MGAR）。该方法的核心是利用多人注意处理高层语义信息的层次加权，从而提取出具有较好表示效果的最优特征组合。然后使用门控结构将每个维度的特征图与对应编码器的低层语义信息融合，以补偿局部建筑细节的丢失。在马萨诸塞大楼和WHU大楼等公共数据集上的实验结果表明，与RAPNet、GAMNet和GSM等更先进的多尺度特征融合方法相比，该算法可以实现更高的F1和IoU。

关键词： 深度学习，建筑物提取，多尺度特征，多人关注，浇口机构

中图分类号:

TP391.4标准

赫晓慧, 周涛, 李盼乐, 常静, 李加冕.基于多尺度注意力的遥感影像建筑物提取研究[J] ●●●●。计算机科学, 2024, 51(5): 134-142. https://doi.org/10.11896/jsjkx.230200134

何晓辉、周涛、李潘乐、常静、李佳棉。基于多尺度注意的遥感图像建筑物提取研究[J] ●●●●。计算机科学，2024，51（5）：134-142。https://doi.org/10.11896/jsjkx.230200134

参考文献

[1] 张毅，费X，王杰，等.基于高分辨率遥感图像的建筑物提取方法综述[J]。地理信息与空间信息技术，2020,43（4）：76-79。
[2] LONG J，SHELHAMER E，DARRELL T.语义分割的全卷积网络[J]。IEEE模式分析和机器智能汇刊，2015,39（4）：640-651。
[3] 张丙，安荣，马琳.改进的U-Net遥感影像建筑物变化检测[J]。计算机工程与应用，2021,57（3）：239-246。
[4] 何Z，丁H，AN B.从高分辨率遥感图像中提取建筑物的空腔卷积E-Unet算法[J]。大地测量学与地理信息科学杂志，2022,51（3）：457-467。
[5] 张C，葛毅，姜霞。基于稀疏约束SegNet的高分辨率遥感图像建筑物提取[J]。西安科技大学学报，2020,40（3）：441-448。
[6] WU L，HU X.基于多尺度多特征高空间分辨率遥感图像的建筑物自动检测[J]。国土资源遥感，2019,31（1）：71-78。
[7] 张毅，王旭，张泽，等.一种基于边界感知的遥感图像建筑物提取方法[J]。西安电子科技大学学报（自然科学版），2022,49（1）：236-244。
[8] 刘辉，张聪，葛勇，等.多尺度特征融合深度学习建筑物提取方法[J]。地理空间信息，2022,20（2）：97-100。
[9] 张毅，颜强，邓F.从高分辨率遥感图像中提取建筑物的多通道RSU网络方法[J]。大地测量学与地理信息科学杂志，2022,51（1）：135-144。
[10] 刘德，张华，程德，等.基于注意机制的提取方法的构建[J]。遥感信息，2021,36（4）：119-124。
[11] 张毅，成C，杨斯，等。基于双注意机制模型的遥感图像建筑物提取[J]。测绘科学，2022,47（4）：129-136174。
[12] 李华，李泽，张D。最优尺度下的面向对象建筑物提取[J]。遥感信息，2022,37（3）：72-76。
[13] 陈克，高X，严M，等。基于编解码器网络的航空图像像素级构建提取[J]。国家遥感公报，2020,24（9）：1134-1142。
[14] 何强，孟毅，李浩。多级码解码网络遥感影像构建分割[J]。计算机应用研究，2021,38（8）：2510-2514。
[15] BIANCHINI M，SCARSELLI F.关于神经网络分类器的复杂性：浅层和深层结构的比较[J]。IEEE神经网络和学习系统汇刊，2014,25（8）：1553-1565。
[16] RAGHU M，POOLE B，KLEINBERG J，et al.论深度神经网络的表达能力[C]//第34届国际机器学习大会论文集（第70卷）。悉尼：PMLR，2017:2847-2854。
[17] 何凯，张旭，REN S，等。图像识别中的深度残差学习[C]//IEEE计算机视觉与模式识别会议。拉斯维加斯：IEEE出版社，2016:770-778。
[18] VASWANI A，SHAZEER N，PARMAR N，et al.注意你所需要的一切[C]//第31届神经信息处理系统国际会议记录.2017:6000-6010。
[19] 林天勇，杜拉·P，GIRSHICK R，等。用于目标检测的特征金字塔网络[C]//2017 IEEE计算机视觉与模式识别会议（CVPR）。檀香山：IEEE出版社，2017:2117-2125。
[20] 顾毅，颜凤.基于不同骨架UNet++网络的建筑物提取[J]。中国科学院学报，2022,39（4）：512-523。
[21]JI S，WEI S，LU M.从开放式航空和卫星图像数据集中提取多源建筑物的全卷积网络[J]。IEEE地球科学与遥感汇刊，2018年，57（1）：574-586。
[22]田强，赵毅，李毅，等.基于精细注意金字塔网络的多尺度建筑物提取[J]。IEEE地球科学与遥感快报，2021,19-1-5。
[23]ZHENG Z，ZHANG X，XIAO P，et al.集成门和注意模块的高分辨率图像语义分割[J]。IEEE应用地球观测和遥感专题期刊，2021,14:4530-4546。
[24]徐磊，李毅，徐杰，等.用于建筑实例提取的门控空间存储和质心软件网络[J]。IEEE地球科学和遥感事务，2021,60:1-14。

韵律学

已查看

全文

摘要

引用

共享

讨论

基于多尺度注意力的遥感影像建筑物提取研究

基于多尺度注意的遥感图像建筑物提取研究

PDF（PC）

摘要/摘要

引用本文

使用本文

参考文献

相关文章0

韵律学

本文评价

推荐阅读0