课题组赵元昊博士近期在遥感领域国际权威期刊IEEE Transactions on Geoscience and Remote Sensing发表论文“MSRF-Net: Multiscale Receptive Field Network for Building Detection from Remote Sensing Images”。该期刊为国际遥感领域顶级期刊,最新影响因子8.125,JCR-1区,TOP期刊。
论文针对遥感影像建筑物提取的空间细节损失问题,提出了一种多尺度感受野特征编码器和多路径解码器组成的多尺度感受野网络,能够捕捉并学习多尺度感受野的特征,实现多尺度建筑物的准确提取。
研究背景:
基于遥感影像的建筑物提取在城市发展规划和灾害评估等领域至关重要。卷积神经网络(CNN)凭其强大的深度语义特征提取能力而被广泛地应用于建筑物提取。然而,由于感受野的限制和空间细节信息的损失,现有CNN方法很难提取具有准确边缘的多尺度建筑物。针对上述问题,本文提出了一种多尺度感受野网络(MSRF-Net)以精确提取遥感图像中的多尺度建筑物。MSRF-Net包括多尺度感受野特征编码器和多路径解码器。多尺度感受野特征编码器中引入了多尺度注意力下采样模块和不对称残差接收模块来捕捉多尺度感受野特征。多路径解码器利用三个平行的不同大小和膨胀程度的卷积核来学习多尺度局部保留特征。更重要的是,不同的分支和多尺度感受野特征编码器的特征通过特征组合模块融合,有助于在恢复特征空间分辨率的同时捕捉多尺度感受野的上下文信息。实验结果表明,与最新的MAP-Net相比,MSRF-Net在Massachusetts数据集、WHU数据集和Typical Cities Building数据集上分别取得了1.14%、0.42%、1.11%的F1提升和1.68%、0.76%、1.64%的IoU提升。
研究方法:
提出的MSRF-Net如图1所示,不对称残差接收模块的详细结构如图2所示,多尺度空间注意力下采样模块的详细结构如图3所示,多尺度通道注意力下采样模块的详细结构如图4所示,多路径解码器的详细结构如图5所示。
图1:提出的MSRF-Net,包括多尺度感受野特征编码器和多路径解码器。
图2:不对称残差接收模块的详细结构。
图3:多尺度空间注意力下采样模块的详细结构。
图4:多尺度通道注意力下采样模块的详细结构。
图5:多路径解码器的详细结构。
结果结论:
与最新的MAP-Net相比,MSRF-Net在Massachusetts数据集、WHU数据集和Typical Cities Building数据集上分别取得了1.14%、0.42%、1.11%的F1提升和1.68%、0.76%、1.64%的IoU提升。
论文链接:10.1109/TGRS.2023.3282926