视频行人重识别的方法

    公开(公告)号:CN114202739B

    公开(公告)日:2024-12-20

    申请号:CN202111483319.0

    申请日:2021-12-07

    Abstract: 本发明属于视频行人重识别技术领域,提供了一种视频行人重识别的方法。本发明使用Transformer结构提取多视角特征来解决视频行人重识别任务。视频行人重识别目的是实现行人序列图片的跨摄像头匹配。本发明提出使用三叉网络分别获取行人视频的空间视角,时序视角和时空视角,以此获得在不同特征域的多视角观察。在单一的视角特征域内使用Transformer挖掘单视角特征关系,并优化视角特征。在跨视角特征域间使用Transformer探索多视角特征关系,并融合多视角信息得到更充分的特征表示。本发明可以提取行人视频更鲁棒、更具判别力的特征表示,能够实现更高精度的行人视频实例匹配。

    密集行人检测方法
    8.
    发明公开

    公开(公告)号:CN114202774A

    公开(公告)日:2022-03-18

    申请号:CN202111512063.1

    申请日:2021-12-07

    Abstract: 一种密集行人检测方法。在网络训练阶段,搭建卷积神经网络,训练编码器解码器及检测头部预测正确的行人包围框;并根据预测结果,为每个行人分配一个最佳的预测候选框;固定密度估计头部外的其他网络参数,使用每个行人唯一的预测候选框生成密度目标,训练密度估计头部;最后放开网络所有参数,联合训练整个网络。在测试应用阶段,在进行后处理时,每选定一个确定保留的行人框,则在这张预测密度图上减去对应位置的高斯激活图,对于那些与该被保留行人重叠率大于阈值的行人框,利用更新后的密度图对这些行人框进行二次判断。本发明在密集场景下,解决了通用的非极大值抑制方法会误删的正确预测的包围框的问题,同时也不影响非密集场景的表现。

    一种基于多尺度特征融合的行人重识别方法

    公开(公告)号:CN114202740A

    公开(公告)日:2022-03-18

    申请号:CN202111483359.5

    申请日:2021-12-07

    Abstract: 一种基于多尺度特征融合的行人重识别方法,1)构建基于多尺度融合的模型,并预训练主干网络暨多尺度特征提取器。2)利用多尺度特征提取器生成图像的多尺度特征。3)采用基于Transformer的特征校准模型融合两个不同尺度的特征。4)利用深监督融合从浅层特征到深层特征不断融合不同层级的特征。5)用交叉熵损失和三元组损失监督融合过程。6)将目标测试集图像输入训练好的模型提取特征,根据特征相似度进行排序得到行人重识别的结果,进而实现行人重识别。本发明采用卷积神经网络提取多尺度特征,使用Transformer从全局的角度融合多尺度信息,使得特征同时具有细节和语义信息,有效的提高了行人重识别的准确率。

    密集行人检测方法
    10.
    发明授权

    公开(公告)号:CN114202774B

    公开(公告)日:2024-12-13

    申请号:CN202111512063.1

    申请日:2021-12-07

    Abstract: 一种密集行人检测方法。在网络训练阶段,搭建卷积神经网络,训练编码器解码器及检测头部预测正确的行人包围框;并根据预测结果,为每个行人分配一个最佳的预测候选框;固定密度估计头部外的其他网络参数,使用每个行人唯一的预测候选框生成密度目标,训练密度估计头部;最后放开网络所有参数,联合训练整个网络。在测试应用阶段,在进行后处理时,每选定一个确定保留的行人框,则在这张预测密度图上减去对应位置的高斯激活图,对于那些与该被保留行人重叠率大于阈值的行人框,利用更新后的密度图对这些行人框进行二次判断。本发明在密集场景下,解决了通用的非极大值抑制方法会误删的正确预测的包围框的问题,同时也不影响非密集场景的表现。

Patent Agency Ranking