-
公开(公告)号:CN119379652A
公开(公告)日:2025-01-28
申请号:CN202411511389.6
申请日:2024-10-28
Applicant: 北京邮电大学
IPC: G06T7/00 , G06N3/0442 , G06N3/042 , G06N3/08
Abstract: 本发明公开了一种基于视觉大模型的重量估计方法,包括:获取多模态重量数据集,构建视觉语言模型,基于所述多模态重量数据集对所述视觉语言模型进行两个阶段的训练;基于所述多模态重量数据集获得微调数据集;基于微调数据集、类别引导策略和参考校准策略对完成第二阶段训练的视觉语言模型获得重量估计模型;基于重量估计模型与待评估的物体图像进行重量估计。本发明通过类别引导策略和参考校准策略有效提升了视觉大模型的重量估计精度和重量推理能力。