摘要:基于深度学习的遥感影像建筑物提取方法具有覆盖范围广、运算效率高的特点,在城市建设、灾害防治等方面有着重要的实际意义。主流方法大多采用多尺度特征融合的方式使神经网络能够学习到更丰富的语义信息,然而由于受到多尺度特征的复杂性以及其他类别地物的干扰,该类方法往往存在着目标漏检与噪声密集的问题。对此,文中设计并实现了一种结合注意力机制的特征解译模型MGA-ResNet50(MGAR)该方法的核心在于利用多头注意力对高等级语义信息进行分层加权处理,以提取出表征效果较好的最优特征组合;而后使用门控结构将每维特征图与对应编码端的低级语义信息融合,来解决局部建筑物细节信息丢失的问题。在马萨诸塞州建筑,WHU建筑等公开数据集上的实验结果表明,与RAPNet、GAMNet、GSM等较为先进的多尺度特征融合方法相比,所提算法能够取得更高的F1 IoU
中图分类号:
赫晓慧, 周涛, 李盼乐, 常静, 李加冕.基于多尺度注意力的遥感影像建筑物提取研究[J] ●●●●。计算机科学, 2024, 51(5): 134-142. https://doi.org/10.11896/jsjkx.230200134
何晓辉、周涛、李潘乐、常静、李佳棉。基于多尺度注意的遥感图像建筑物提取研究[J] ●●●●。计算机科学,2024,51(5):134-142。https://doi.org/10.11896/jsjkx.230200134