-
公开(公告)号:CN114973401B
公开(公告)日:2025-04-04
申请号:CN202210433456.1
申请日:2022-04-24
Applicant: 西安电子科技大学
Abstract: 本发明公开了一种基于动作检测与多模态学习的标准化引体向上评估方法,主要解决现有方法对引体向上计数和标准性评估不准确的问题。其实现方案是:引入人脸识别进行身份识别,通过语音关键词控制视频采集;采用单周期波形序列分割法对完整引体向上动作视频进行单次动作检测,提取单次动作视频片段;根据考核标准设定动作判定参数;对视频片段进行人体骨骼点估计,生成单次动作评估向量,判断单次引体向上动作的标准性;基于实时判断结果进行视频、骨骼数据与音频的多模态学习;统计符合标准的引体向上动作个数,生成评估报告,以指导被测试人员查看标准示例进行动作调整。本发明检测准确性高,抗干扰能力强,可用于平时体育训练及体测。
-
公开(公告)号:CN119721233A
公开(公告)日:2025-03-28
申请号:CN202411358506.X
申请日:2024-09-27
Applicant: 西安电子科技大学
Abstract: 一种应用于水利领域的多模态大模型构建方法、系统、设备和介质,先获取水利领域文本数据并进行预处理,并结合向量数据库构建本地知识库,再对预处理后的水利领域文本数据设计提示词,调用大语言模型及人工标注生成问答形式数据集;对本地大语言模型词表扩充,并基于预处理后的水利领域文本数据,对词表扩充后的本地大语言模型二次预训练,得到水利领域大模型;接着基于问答形式数据集,使用Lora算法对水利领域大模型进行指令精调,生成水利领域智能聊天大模型;构建评测数据集评测水利领域智能聊天大模型的性能;基于水利领域智能聊天大模型和本地知识库,构建专用于水利领域的Water_Agent,并基于评测数据集,评测和优化;本发明具有准确性、效率高等优点。
-
公开(公告)号:CN119360222A
公开(公告)日:2025-01-24
申请号:CN202411377659.9
申请日:2024-09-30
Applicant: 西安电子科技大学
IPC: G06V20/13 , G06V10/26 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464
Abstract: 一种基于多源预训练模型融合决策的大场景遥感影像层次化地物分割方法、系统、设备及介质,方法:构建遥感影像预训练数据集;并采用掩码重建策略对编码器‑解码器结构的预训练模型训练,得到遥感影像预训练权重;构建遥感影像微调数据集,划分训练、验证和测试集;对编码器‑语义分割头结构的模型分别在遥感影像预训练权重和自然图像预训练权重基础上,使用训练集和验证集微调,得到两个语义分割模型;使用两个语义分割模型分别对测试集进行测试,得到自然图像预训练模型和遥感影像预训练模型的预测结果;基于设定的规则,对两个预测结果融合决策,得到遥感影像地物分割结果;系统、设备及介质实现该方法;本发明具有分割精度高和鲁棒性强的优点。
-
公开(公告)号:CN118628902A
公开(公告)日:2024-09-10
申请号:CN202410390028.4
申请日:2024-04-02
Applicant: 西安电子科技大学
IPC: G06V20/10 , G06V20/70 , G06V10/26 , G06V10/774 , G06V10/82 , G06V10/764 , G06V10/40 , G06N3/0455 , G06N3/0464 , G06N3/0495 , G06N3/08
Abstract: 一种面向复杂场景的单极化SAR影像的建筑物提取方法,包括:采集单极化SAR遥感影像,构建复杂场景下的单极化SAR影像建筑物数据集,并划分为训练集、验证集和测试集或者训练集和验证测试集;对复杂场景下的单极化SAR影像建筑物数据集进行预处理,得到可迭代的训练集、验证集和测试集或者训练集和验证测试集;构建编码器E‑解码器D网络模型;将可迭代的训练集和验证集或验证测试集输入编码器E‑解码器D网络模型中进行训练和验证,获得训练好的编码器E‑解码器D网络模型;将可迭代的测试集或验证测试集输入训练好的编码器E‑解码器D网络模型验证效果,获得预测概率值,评估网络性能;本发明提高了复杂场景下建筑物提取的准确性和鲁棒性。
-
公开(公告)号:CN118314399A
公开(公告)日:2024-07-09
申请号:CN202410470108.0
申请日:2024-04-18
Applicant: 西安电子科技大学
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06V20/10 , G06N3/045
Abstract: 基于跨模态空间动态融合网络的高分辨大场景SAR和光学影像土地覆盖分类方法、系统及介质,其方法为:采集同一地区的SAR影像和光学影像并组成训练数据集;构建跨模态空间动态融合网络模型;利用训练数据集训练跨模态空间动态融合网络模型;采集待预测的SAR影像和光学影像,利用训练好的跨模态空间动态融合网络模型进行分类,得到影像块的最终语义分割结果;合并图像块的分类结果,得到最终的土地覆盖分类结果;系统、设备及介质用于实现该方法;本发明在SAR和光学影像的多尺度特征基础上,利用跨模态注意力机制进行特征交互,实现模态间信息交流,通过空间动态融合模块进行SAR和光学特征互补信息的高效融合,提升了土地覆盖分类的性能。
-
公开(公告)号:CN117636379A
公开(公告)日:2024-03-01
申请号:CN202311712089.X
申请日:2023-12-13
Applicant: 西安电子科技大学
IPC: G06V30/412 , G06V30/146 , G06V10/82 , G06V30/168 , G06N3/044 , G06N3/0464 , G06N3/084
Abstract: 一种基于深度学习的表格识别方法,包括:获取包含表格的图像数据集;提取数据集中图像的表格区域,并利用投影变换矫正表格区域;再得到表格图像;提取出表格图像中的单元格图像作为文本框识别网络训练集;对yolov8检测网络进行训练;将待识别单元格图像输入训练好的文本块检测网络,输出重新排序后的文本块图像;输出文本块图像中的文本;将文本块图像中的文本输出到excel;本发明解决了现有技术中存在的识别稳定性受表格图像规范度影响较大以及现有技术中识别速度和准确率之间的平衡问题,能够准确地从包含表格的图像中识别所包含的全部表格,包括表格结构与内容信息,有助于提高结构化数据处理的效率与准确性,具有更强的实用性。
-
公开(公告)号:CN116740559A
公开(公告)日:2023-09-12
申请号:CN202310530759.X
申请日:2023-05-11
Applicant: 西安电子科技大学
IPC: G06V20/10 , G06V10/26 , G06V10/80 , G06Q10/0635 , G06Q50/26
Abstract: 本发明公开了一种基于多模态学习的滑坡风险评估方法,主要解决现有方法无法处理多模态数据,进而导致滑坡风险评估精度低的问题。其实现方案是:对高分遥感子图对应的数字高程模型进行提取;对高分遥感子图进行语义分割提取滑坡风险点的边缘;计算提取出的数字高程模型所对应的坡度图、坡向图;从坡度图、坡向图中提取各自对应的特征序列;对待评估高分遥感子图进行居民点检测和道路检测;将高分遥感子图、坡度图、坡向图进行图像嵌入;将特征序列进行序列嵌入;将居民点和道路的检测结果进行点嵌入;将嵌入后的数据输入到视觉自注意力模型中,得到滑坡风险评估等级。本发明提高了滑坡风险点评估的评估精度,可以用于地质灾害的预警。
-
公开(公告)号:CN116206214A
公开(公告)日:2023-06-02
申请号:CN202310218039.X
申请日:2023-03-08
Applicant: 西安电子科技大学
IPC: G06V20/13 , G06V10/26 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法、系统、设备及介质,方法包括:对遥感影像进行预处理,获取滑坡遥感影像数据集;搭建Ournetworkframework网络模型;对Ournetwork framework网络模型进行迭代训练,最终保存训练效果最好轮次的权重;对训练好的网络模型进行预测,评价网络的好坏;使用深度学习框架随机生成一个张量,将其送入Ournetworkframework网络模型中,计算FLOPs、参数量、以及模型推理时间;其系统、设备及介质,用于实现种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法;本发明的网络模型是将卷积神经网络的优势和自注意力机制的优势结合起来,创建出轻量化网络模型,在降低模型复杂度的同时,滑坡识别的准确率也以提升。
-
公开(公告)号:CN113962960A
公开(公告)日:2022-01-21
申请号:CN202111232233.0
申请日:2021-10-22
Applicant: 西安电子科技大学
IPC: G06T7/00 , G06V10/25 , G06V10/774 , G06N3/04
Abstract: 本发明公开了一种基于深度学习的路面病害检测方法,主要解决现有技术无法得到路面病害的具体类别及对不同类别病害计数不准确的问题。其实现方案为:通过车载摄像头拍摄路面视频帧图像,获取训练样本集L;选用yolov5网络作为路面病害检测模型B;将训练样本集L输入到路面病害检测模型B中,利用梯度下降法对路面病害检测模型B进行迭代训练,得到训练好的路面病害检测模型B′;巡检视频中路面病害的类别;确定视频帧图像集合C的单帧图像中的同一位置病害的类别;对连续多帧图像中同一处病害进行去重与计数处理,得到准确的路面病害检测结果。本发明避免了人工干预,提高了病害检测的准确性,可用于路面的检修和养护。
-
公开(公告)号:CN112801148A
公开(公告)日:2021-05-14
申请号:CN202110048216.5
申请日:2021-01-14
Applicant: 西安电子科技大学
Abstract: 本发明公开了一种基于深度学习的火情识别定位系统及方法,主要解决传统火情检测方法中存在的检测可靠性差问题;其实现方案为:在主机端对深度学习卷积神经网络进行算法改进,并基于现有火焰数据集得到火情检测模型权重文件;将卷积神经网络模型及权重文件移植到边缘嵌入式计算设备,并将设备部署到火情监控点,由摄像头获取监控画面传入设备;在边缘端对输入的图像画面进行深度学习火情识别,获得画面监控点的火情信息,同时北斗卫星获取定位信息;采用双通道通信链路传输火情识别定位信息;主机端接收信息后于浏览器页面呈现。本发明在保证系统传输可靠性的同时,准确完成火情检测,并能够将火情现场状况在浏览器页面直观展示。
-
-
-
-
-
-
-
-
-