一种基于Transformer和错位对齐策略的小样本动作识别方法

    公开(公告)号:CN116503945B

    公开(公告)日:2025-04-08

    申请号:CN202310471308.3

    申请日:2023-04-27

    Abstract: 本发明公开了一种基于Transformer和错位对齐策略的小样本动作识别方法,包括:获取查询集视频和支持集视频;获得对应的第一图像集和第二图像集;对图像集进行采样并裁剪,裁剪后的第一图像集形成第一图像序列,每个裁剪后的第二图像集形成一个第二图像序列,将第一图像序列和一个第二图像序列视为一组;建立动作识别模型,动作识别模型包括依次连接的改进ResNet网络模型、时空特征编码器和多粒度特征对齐模块,并获取每组第一图像序列和第二图像序列对应的多粒度动作概率;采用分类器获取全部多粒度动作概率中概率最高的动作类别作为对应待识别动作类别视频的动作识别结果。该方法能够提升小样本动作视频分类的准确度和效率。

    一种基于矩形信息的单目视觉平面测距方法

    公开(公告)号:CN116678370A

    公开(公告)日:2023-09-01

    申请号:CN202310663492.1

    申请日:2023-06-06

    Abstract: 本发明公开了一种基于矩形信息的单目视觉平面测距方法,包括如下步骤:在玻璃移动所在的待测平面上放置一已知的矩形物体,通过拍摄相机获得图片,并取得拍摄相机的参数;取得已知矩形四个顶点在图片上的坐标以及矩形的实际对角长;根据获取的矩形顶点坐标、对角长以及拍摄相机的参数,得到预设参数并保存;读取玻璃上第一待测点在图片上的坐标,并根据得到的预设参数得到第一待测点对应的向量;读取玻璃上第二待测点在图片上的坐标,并根据得到的预设参数得到第二待测点对应的向量,可得到两个待测点之间的真实距离。该方法相比传统的单目视觉计算方案具有更少的计算量,解决透明物体难测的问题,同时保证足够的精度。

Patent Agency Ranking