基于动作检测与多模态学习的标准化引体向上评估方法

    公开(公告)号:CN114973401B

    公开(公告)日:2025-04-04

    申请号:CN202210433456.1

    申请日:2022-04-24

    Abstract: 本发明公开了一种基于动作检测与多模态学习的标准化引体向上评估方法,主要解决现有方法对引体向上计数和标准性评估不准确的问题。其实现方案是:引入人脸识别进行身份识别,通过语音关键词控制视频采集;采用单周期波形序列分割法对完整引体向上动作视频进行单次动作检测,提取单次动作视频片段;根据考核标准设定动作判定参数;对视频片段进行人体骨骼点估计,生成单次动作评估向量,判断单次引体向上动作的标准性;基于实时判断结果进行视频、骨骼数据与音频的多模态学习;统计符合标准的引体向上动作个数,生成评估报告,以指导被测试人员查看标准示例进行动作调整。本发明检测准确性高,抗干扰能力强,可用于平时体育训练及体测。

    一种应用于水利领域的多模态大模型构建方法、系统、设备和介质

    公开(公告)号:CN119721233A

    公开(公告)日:2025-03-28

    申请号:CN202411358506.X

    申请日:2024-09-27

    Abstract: 一种应用于水利领域的多模态大模型构建方法、系统、设备和介质,先获取水利领域文本数据并进行预处理,并结合向量数据库构建本地知识库,再对预处理后的水利领域文本数据设计提示词,调用大语言模型及人工标注生成问答形式数据集;对本地大语言模型词表扩充,并基于预处理后的水利领域文本数据,对词表扩充后的本地大语言模型二次预训练,得到水利领域大模型;接着基于问答形式数据集,使用Lora算法对水利领域大模型进行指令精调,生成水利领域智能聊天大模型;构建评测数据集评测水利领域智能聊天大模型的性能;基于水利领域智能聊天大模型和本地知识库,构建专用于水利领域的Water_Agent,并基于评测数据集,评测和优化;本发明具有准确性、效率高等优点。

    基于跨模态空间动态融合网络的高分辨大场景SAR和光学影像土地覆盖分类方法、系统及介质

    公开(公告)号:CN118314399A

    公开(公告)日:2024-07-09

    申请号:CN202410470108.0

    申请日:2024-04-18

    Abstract: 基于跨模态空间动态融合网络的高分辨大场景SAR和光学影像土地覆盖分类方法、系统及介质,其方法为:采集同一地区的SAR影像和光学影像并组成训练数据集;构建跨模态空间动态融合网络模型;利用训练数据集训练跨模态空间动态融合网络模型;采集待预测的SAR影像和光学影像,利用训练好的跨模态空间动态融合网络模型进行分类,得到影像块的最终语义分割结果;合并图像块的分类结果,得到最终的土地覆盖分类结果;系统、设备及介质用于实现该方法;本发明在SAR和光学影像的多尺度特征基础上,利用跨模态注意力机制进行特征交互,实现模态间信息交流,通过空间动态融合模块进行SAR和光学特征互补信息的高效融合,提升了土地覆盖分类的性能。

    一种基于深度学习的表格识别方法

    公开(公告)号:CN117636379A

    公开(公告)日:2024-03-01

    申请号:CN202311712089.X

    申请日:2023-12-13

    Abstract: 一种基于深度学习的表格识别方法,包括:获取包含表格的图像数据集;提取数据集中图像的表格区域,并利用投影变换矫正表格区域;再得到表格图像;提取出表格图像中的单元格图像作为文本框识别网络训练集;对yolov8检测网络进行训练;将待识别单元格图像输入训练好的文本块检测网络,输出重新排序后的文本块图像;输出文本块图像中的文本;将文本块图像中的文本输出到excel;本发明解决了现有技术中存在的识别稳定性受表格图像规范度影响较大以及现有技术中识别速度和准确率之间的平衡问题,能够准确地从包含表格的图像中识别所包含的全部表格,包括表格结构与内容信息,有助于提高结构化数据处理的效率与准确性,具有更强的实用性。

    基于多模态学习的滑坡风险评估方法

    公开(公告)号:CN116740559A

    公开(公告)日:2023-09-12

    申请号:CN202310530759.X

    申请日:2023-05-11

    Abstract: 本发明公开了一种基于多模态学习的滑坡风险评估方法,主要解决现有方法无法处理多模态数据,进而导致滑坡风险评估精度低的问题。其实现方案是:对高分遥感子图对应的数字高程模型进行提取;对高分遥感子图进行语义分割提取滑坡风险点的边缘;计算提取出的数字高程模型所对应的坡度图、坡向图;从坡度图、坡向图中提取各自对应的特征序列;对待评估高分遥感子图进行居民点检测和道路检测;将高分遥感子图、坡度图、坡向图进行图像嵌入;将特征序列进行序列嵌入;将居民点和道路的检测结果进行点嵌入;将嵌入后的数据输入到视觉自注意力模型中,得到滑坡风险评估等级。本发明提高了滑坡风险点评估的评估精度,可以用于地质灾害的预警。

    基于深度学习的路面病害检测方法

    公开(公告)号:CN113962960A

    公开(公告)日:2022-01-21

    申请号:CN202111232233.0

    申请日:2021-10-22

    Abstract: 本发明公开了一种基于深度学习的路面病害检测方法,主要解决现有技术无法得到路面病害的具体类别及对不同类别病害计数不准确的问题。其实现方案为:通过车载摄像头拍摄路面视频帧图像,获取训练样本集L;选用yolov5网络作为路面病害检测模型B;将训练样本集L输入到路面病害检测模型B中,利用梯度下降法对路面病害检测模型B进行迭代训练,得到训练好的路面病害检测模型B′;巡检视频中路面病害的类别;确定视频帧图像集合C的单帧图像中的同一位置病害的类别;对连续多帧图像中同一处病害进行去重与计数处理,得到准确的路面病害检测结果。本发明避免了人工干预,提高了病害检测的准确性,可用于路面的检修和养护。

    基于深度学习的火情识别定位系统及方法

    公开(公告)号:CN112801148A

    公开(公告)日:2021-05-14

    申请号:CN202110048216.5

    申请日:2021-01-14

    Abstract: 本发明公开了一种基于深度学习的火情识别定位系统及方法,主要解决传统火情检测方法中存在的检测可靠性差问题;其实现方案为:在主机端对深度学习卷积神经网络进行算法改进,并基于现有火焰数据集得到火情检测模型权重文件;将卷积神经网络模型及权重文件移植到边缘嵌入式计算设备,并将设备部署到火情监控点,由摄像头获取监控画面传入设备;在边缘端对输入的图像画面进行深度学习火情识别,获得画面监控点的火情信息,同时北斗卫星获取定位信息;采用双通道通信链路传输火情识别定位信息;主机端接收信息后于浏览器页面呈现。本发明在保证系统传输可靠性的同时,准确完成火情检测,并能够将火情现场状况在浏览器页面直观展示。

Patent Agency Ranking