-
公开(公告)号:CN116662587B
公开(公告)日:2023-10-03
申请号:CN202310942873.3
申请日:2023-07-31
Applicant: 华侨大学
IPC: G06F16/53 , G06F16/55 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于查询生成器的人物交互检测方法、装置及设备,方法包括以下步骤:读取待检测的目标图像;利用特征提取器对所述目标图像进行特征提取获得图像特征;随机初始化一组人‑物对的先验边界框,将所述图像特征与所述先验边界框共同输入查询生成器,并基于所述查询生成器生成每层实例检测器和交互分类器所需的两组查询向量以及查询向量的位置信息;经由不同的解码器将输入的图像特征、查询向量和位置信息解码为特征向量组;根据所述特征向量组得到人物交互的预测结果。本发明将查询向量视为候选的人物交互检测结果,通过初始化人‑物对的先验边界框,来从中生成所需的查询向量,能够更精准且高效地进行人物交互行为识别。
-
公开(公告)号:CN116662587A
公开(公告)日:2023-08-29
申请号:CN202310942873.3
申请日:2023-07-31
Applicant: 华侨大学
IPC: G06F16/53 , G06F16/55 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于查询生成器的人物交互检测方法、装置及设备,方法包括以下步骤:读取待检测的目标图像;利用特征提取器对所述目标图像进行特征提取获得图像特征;随机初始化一组人‑物对的先验边界框,将所述图像特征与所述先验边界框共同输入查询生成器,并基于所述查询生成器生成每层实例检测器和交互分类器所需的两组查询向量以及查询向量的位置信息;经由不同的解码器将输入的图像特征、查询向量和位置信息解码为特征向量组;根据所述特征向量组得到人物交互的预测结果。本发明将查询向量视为候选的人物交互检测结果,通过初始化人‑物对的先验边界框,来从中生成所需的查询向量,能够更精准且高效地进行人物交互行为识别。
-