-
公开(公告)号:CN119274144B
公开(公告)日:2025-03-21
申请号:CN202411793306.7
申请日:2024-12-09
Applicant: 山东理工大学
Abstract: 本发明属于图像分析技术领域,具体涉及一种基于场景理解的多专家投票式人群计数方法,步骤包括利用包括图像编码器、文本编码器和特征增强器的骨干网络,从输入图像中提取视觉特征,并从文本提示中提取文本特征;将文本特征投影到与视觉特征相同的嵌入空间中进行对齐;构建用于局部人群目标检测的局部主体专家、用于理解场景的整体布局的全局上下文专家、用于建模人群之间的空间关系的空间关系专家、用于处理场景中目标的外观和属性信息的属性特征专家;采用知识蒸馏策略,细粒度训练各个专家;获取各个专家的输出,通过解码器输出最终的计数结果。本发明能够利用多专家系统的投票机制和知识蒸馏策略来优化复杂场景下的细粒度人群计数性能。
-
公开(公告)号:CN119274144A
公开(公告)日:2025-01-07
申请号:CN202411793306.7
申请日:2024-12-09
Applicant: 山东理工大学
Abstract: 本发明属于图像分析技术领域,具体涉及一种基于场景理解的多专家投票式人群计数方法,步骤包括利用包括图像编码器、文本编码器和特征增强器的骨干网络,从输入图像中提取视觉特征,并从文本提示中提取文本特征;将文本特征投影到与视觉特征相同的嵌入空间中进行对齐;构建用于局部人群目标检测的局部主体专家、用于理解场景的整体布局的全局上下文专家、用于建模人群之间的空间关系的空间关系专家、用于处理场景中目标的外观和属性信息的属性特征专家;采用知识蒸馏策略,细粒度训练各个专家;获取各个专家的输出,通过解码器输出最终的计数结果。本发明能够利用多专家系统的投票机制和知识蒸馏策略来优化复杂场景下的细粒度人群计数性能。
-