-
公开(公告)号:CN118212526A
公开(公告)日:2024-06-18
申请号:CN202410390026.5
申请日:2024-04-02
Applicant: 西安电子科技大学
IPC: G06V20/10 , G06V10/26 , G06V20/70 , G06V10/774 , G06V10/54 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/0495 , G06N3/084 , G06N3/0985
Abstract: 基于注意力和空洞卷积嵌入UNet3Plus的超高分辨率SAR建筑物提取方法、系统、设备及介质,方法:采集并预处理超高分辨率的SAR影像数据,划分为训练集、验证集和测试集;并将其转化为适用于MindSpore深度学习框架的数据集样本类型;构建注意力和空洞卷积嵌入UNet3Plus的深度网络模型;训练与监控深度网络模型;将测试集送入训练好的深度网络模型中进行建筑物提取,得到分割预测结果;利用分割预测结果和对应的SAR测试集影像的标签计算超高分辨率下建筑物/非建筑物类别的评价指标和整体评价指标,评估网络性能,可视化预测结果图;本发明通过注意力机制和空洞卷积嵌入UNet3Plus,改善超高分辨率SAR影像中建筑物的边缘提取效果和减少小目标漏检情况,提高建筑物分割精度和鲁棒性。
-
公开(公告)号:CN119131196A
公开(公告)日:2024-12-13
申请号:CN202411168466.2
申请日:2024-08-23
Applicant: 西安电子科技大学
IPC: G06T11/60 , G06T11/20 , G06V10/774 , G06V10/82 , G06V10/80 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 一种基于遥感图文对比预训练特征的模态对齐与多尺度提取遥感图像描述生成方法、系统、设备及介质,方法包括:获取遥感字幕生成数据集NWPU‑Captions;对遥感字幕生成数据集NWPU‑Captions的训练集、验证集和测试集的文本和图像预处理,得到词表和文本特征以及图像特征;搭建基于Transformer模型的遥感字幕生成网络;使用训练集训练基于Transformer模型的遥感字幕生成网络,再将验证集输入每个轮次得到模型中验证,挑选效果最好的模型;将测试集中的图像特征输入效果最好的模型,得到图像对应的字幕;系统、设备及介质用于实现该方法;本发明使用对比预训练的图像编码器、多尺度融合提取模块、文本编码模块,能提取更具语义、更多尺度的特征,可以使生成的描述包含更高级、更详细的语义词汇。
-