融合Swin Transformer与视觉图神经网络的遥感影像场景分类方法

    公开(公告)号:CN117392547A

    公开(公告)日:2024-01-12

    申请号:CN202311516804.2

    申请日:2023-11-15

    Applicant: 福州大学

    Abstract: 本发明提供一种融合Swin Transformer与视觉图神经网络的遥感影像场景分类方法,涉及计算机视觉和遥感图像处理领域。该模型由四个关键部分组成:首先是基于剪枝Swin Transformer的特征提取器,其能构建远距离依赖关系,捕捉全局和局部特征;其次是过渡层,将特征序列转换为特征图;接着,基于视觉图神经网络(ViG)的特征提取器,能够捕捉场景图像的空间拓扑关系,形成空间感知特征;最后使用分类器进行具体的场景分类。本发明采用串行融合和模型剪枝的策略,在降低模型复杂度和训练时间的同时,巧妙融合多尺度特征和空间感知特征,更好地处理了遥感图像类间相似性高和类内差异大的问题,与现有场景分类方法相比,具有较好的遥感场景分类性能。

Patent Agency Ranking