-
公开(公告)号:CN119623651B
公开(公告)日:2025-04-22
申请号:CN202510159775.1
申请日:2025-02-13
Applicant: 华中科技大学 , 中建三局第一建设工程有限责任公司
IPC: G06N5/04 , G06V20/70 , G06V10/82 , G06F40/30 , G06F16/334 , G06N3/045 , G06N3/042 , G06N3/08 , G06Q10/0635 , G06Q50/08
Abstract: 本发明属于施工安全检查相关技术领域,具体涉及一种基于多模态大语言模型的施工现场安全检查方法,包括:引入多模态大语言模型,结合包含有安全标准规范和评估规则的知识库,多次应用多模态大语言模型,具体为:由图像和预设的视觉感知系统提示文本,得到图像内容描述;由用户输入查询、图像内容描述和预设的任务分解系统提示,将用户输入查询智能分解为多个子查询任务;向施工安全知识库搜索与每子查询相关的施工安全管理标准数据,基于图像内容描述,结合搜索到的标准数据,对该子查询进行分析推理,得到该子查询的推理与结论;最后基于各子查询数据得出总的推理与结论。本发明能准确、科学、全面地实现施工现场安全检查。
-
公开(公告)号:CN119539013B
公开(公告)日:2025-04-22
申请号:CN202510080721.6
申请日:2025-01-20
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06N3/084 , G06N3/0985 , G06N3/0455 , G06V10/82 , G06V10/25 , G06V10/764 , G06V20/70 , G06F40/30 , G06F18/25 , G06F18/22
Abstract: 本公开的实施例涉及目标检测领域,具体涉及基于小样本提示微调的多模态检测模型训练方法和装置。该方法的一实施方式包括:获取训练样本集和初始多模态检测模型;执行训练步骤:得到文本语义嵌入向量序列,对第一层文本提示向量序列与文本语义嵌入向量序列进行拼接处理,得到初始文本嵌入向量序列;得到图像块嵌入向量序列组,对第一层图像提示向量序列与图像块嵌入向量序列进行拼接处理,得到初始图像嵌入向量序列组;得到图像文本相似度矩阵组;对各个图像文本相似度矩阵进行融合处理,得到图像文本对齐分数矩阵;生成分类标注图像;确定多模态检测损失值;确定多模态检测模型。该实施方式可以降低多模态检测模型的复杂度,减少计算资源的占用。
-
公开(公告)号:CN119442123B
公开(公告)日:2025-04-22
申请号:CN202510045375.8
申请日:2025-01-10
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请提供基于多模态大模型的异常信息检测方法及装置。在本实施例中,在确定了存在异常信息的前提下,再进行异常信息的具体内容的检测方式,这相比于直接对目标文件进行异常信息的具体细节的检测,一方面,不再是同时进行异常信息的检测和异常信息的具体内容的检测,这使得在进行是否存在异常信息的检测的时候,将异常信息检测模型的全部算力聚焦于是否存在异常信息上,能够提高是否存在异常信息的准确度。另一方面,也能在进行异常信息的具体内容的检测的时候,充分利用存在异常信息的先验条件,且全部算力聚焦于异常信息的具体内容上,这也能够准确检测出异常信息的具体内容。
-
公开(公告)号:CN119273915B
公开(公告)日:2025-04-22
申请号:CN202411284274.8
申请日:2024-09-13
Applicant: 中南大学
IPC: G06V10/26 , G06V20/70 , G06V10/774 , G06V10/82 , G06V10/771 , G06V10/74
Abstract: 本申请涉及计算机视觉领域,公开了一种基于原型感知的少样本语义分割方法,包括以下步骤:S1、收集并预处理包含训练集和测试集的数据集;S2、通过将数据集中的所有图像按照类别分为大小相等且互不相交的四个fold;S3、利用预训练的深度神经网络提取支持图像和查询图像的特征;S4、基于支持图像特征和查询图像特征,进行循环一致性筛选,获得可信的查询特征集;S5、利用可信的查询特征集迭代优化前景和背景原型,并基于优化后的原型进行特征匹配;S6、输入测试图像通过优化后的模型进行语义分割,计算分割结果。本发明通过高置信度特征匹配、循环一致性筛选和级联预测优化,显著提高了少样本语义分割的准确率和鲁棒性。
-
公开(公告)号:CN117392675B
公开(公告)日:2025-04-22
申请号:CN202311293866.1
申请日:2023-10-09
Applicant: 杭州电子科技大学
IPC: G06V20/70 , G06V40/20 , G06V10/774 , G06V10/82 , G06V10/30 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于适配网络增强扩散模型的人体姿态场景恢复方法,属于计算机视觉的图像生成领域,该方法首先每一组训练用的数据表示为一个五元组(A(N),B(N),y,ZA,ZB),并用点阵A(N),B(N)分别制作灰度图A0,B0。其次由扩散模型得到扩散模型中主副适配器的差异,并根据差异计算出损失函数,并计算结余损失。最后根据损失函数和结余损失函数得到全局优化函数,对输出的人物姿态图进行优化。本发明消除了通过试探方法训练寻找损失函数间权值时所需的计算开销,实现了预训练模型功能细分的训练方式,使得输出的人物姿态图更为准确稳定。
-
公开(公告)号:CN119851284A
公开(公告)日:2025-04-18
申请号:CN202510331146.2
申请日:2025-03-20
Applicant: 中国人民解放军海军军医大学第三附属医院
Abstract: 本发明涉及一种基于三维重建的选择性肝胆血流阻断标定方法及系统,包括了通过主干网络提取肝胆断层图像的特征图,将特征图输入得到分类分支得到每个像素点的概率分布矩阵,计算所述肝胆断层图像中每个点的梯度得到边缘强度图,利用概率分布矩阵和边缘强度图得到边缘不确定概率图,根据边缘不确定概率图和概率分布矩阵对医学断层图像进行图像分割得到感兴趣区域;确定需要在两个相邻断层图像之间插入图像个数,根据两个相邻的断层图像同类感兴趣区域以及所述边缘不确定概率图确定插入图像中感兴趣区域;利用分割得到的感兴趣区域和插入图像的感兴趣区域进行三维重建,利用血管和病患区域的关系确定血流阻断标记位置。
-
公开(公告)号:CN119851276A
公开(公告)日:2025-04-18
申请号:CN202411832017.3
申请日:2024-12-12
Applicant: 陕西小保当矿业有限公司
Abstract: 本申请提供了一种煤矿井下安全监控语义识别方法及系统。该煤矿井下安全监控语义识别方法包括:在本申请的技术方案中,通过安装于煤矿井下的摄像装置,采集视频数据;对所述视频数据进行分帧处理,并进行图像预处理,生成井下图像;提取所述井下图像的图像特征;根据所述图像特征对所述井下图像中的像素进行分类,以根据像素分类结果确定所述井下图像对应的语义识别结果;将所述语义识别结果反馈至安全监控平台。通过高清摄像装置实时捕捉视频数据,系统能智能识别出井下图像的语义内容,最终将精确的语义信息实时反馈给安全监控平台,使管理人员能迅速掌握井下动态,有效预防安全事故,显著提升煤矿作业的安全性与管理效率。
-
公开(公告)号:CN119851271A
公开(公告)日:2025-04-18
申请号:CN202311315584.7
申请日:2023-10-11
Applicant: 北京有竹居网络技术有限公司
IPC: G06V20/70 , G06V10/774
Abstract: 本公开涉及一种数据标注模型的训练方法、数据标注方法以及对应装置,以通过数据标注模型提高数据标注的效率、一致率和准确率,该方法包括:获取满足预设标注条件的样本数据,预设标注条件包括对标注任务对应的标注规则进行拆解得到的单一标注条件,样本数据对应有思维链信息,用于指示样本数据是否属于标注任务对应的标注类别以及对应的原因;根据标注类别和样本数据,确定样本数据对应的样本问题,并根据思维链信息确定样本数据对应的样本答案;根据样本问题和样本答案进行模型训练,得到目标数据标注模型,目标数据标注模型用于根据输入的包括目标数据的问题,得到问题的答案,答案包括目标数据的类别信息以及类别信息对应的目标思维链信息。
-
公开(公告)号:CN119851206A
公开(公告)日:2025-04-18
申请号:CN202411913900.5
申请日:2024-12-24
Applicant: 北京鑫博腾飞科技有限公司
Inventor: 吴庆广
Abstract: 本发明公开了一种基于人像监测的智能检测方法、系统、装置及产品,其属于人像检测领域,包括:获取图像数据,基于图像数据质量检测模型检测图像数据;预处理达到预设图像质量标准的图像数据,得到基础图像数据;采用纹理特征提取模型对基础图像数据进行提取,得到纹理方向特征编码;使用图像分割算法分割处理基础图像数据,得到多个第一子图像数据,计算第一子图像数据中各个纹理方向特征编码出现频率,根据出现频率构建基础图像数据的特征向量;基于人像检测模型分类特征向量,得到分类结果,判断分类结果中是否包含人像,若包含,则使用预定义的锚框对人像进行标注。本发明可以减少光照条件对检测准确度的影响,提升检测效率,实现高效检测。
-
公开(公告)号:CN119851158A
公开(公告)日:2025-04-18
申请号:CN202510323261.5
申请日:2025-03-19
Applicant: 大连理工大学
IPC: G06V20/13 , G01S13/90 , G06V20/70 , G06V10/26 , G06V10/44 , G06V10/42 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/048
Abstract: 本发明提供一种可解释极化深度学习网络的海水浮筏养殖信息提取方法,属于海洋遥感与人工智能交叉技术领域。其中可解释极化深度学习网络包括三个关键组件:极化散射类激活映射模块、可解释分割一致性学习模块和精细化类激活与边缘引导网络。极化散射类激活映射模块通过结合全极化SAR影像的极化散射特征与梯度权重,生成高质量的类激活映射图;可解释分割一致性学习模块利用生成的类激活映射图,指导模型在训练过程中关注养殖区域的特征;精细化类激活与边缘引导网络采用双分支架构,分别进行语义分割和边缘监督,生成准确的分割结果。本发明能够显著减少背景误判的发生,确保分割结果清晰、细致;且具有较强的适用性。
-
-
-
-
-
-
-
-
-