-
公开(公告)号:CN116665307A
公开(公告)日:2023-08-29
申请号:CN202310717800.4
申请日:2023-06-15
Applicant: 南京信息工程大学
IPC: G06V40/20 , G06V10/764 , G06V10/80 , G06V20/40 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了结合注意力的多级时空特征融合行为识别方法和系统,包括以下步骤:(1)获取需要识别的视频,对视频进行预处理操作获得图像;(2)将预处理后的图像输入结合注意力的多级时空特征融合的人体行为识别网络中进行卷积神经网络训练;(3)输出相应的人体动作分类结果。该发明在行为识别中传统的三维卷积的方法上进行创新,实现了降低一定参数量并有效提升识别准确率的效果。
-
公开(公告)号:CN116110020A
公开(公告)日:2023-05-12
申请号:CN202211433581.9
申请日:2022-11-16
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种融合Transformer机制的交通标志检测方法,包括如下步骤:步骤1、根据Transformer机制,设计结合图像全局特征的编码模块Trans;步骤2、利用GhostConv代替普通卷积模块搭建特征融合网络,通过GhostConv轻量便捷的线性操作轻量化冗余特征的提取过程,释放计算力和内存占用;步骤3、设计精简的解耦检测头Slim Decoupled Head,将分类与回归任务分开解析,加强网络模型的输出能力。本发明能够在复杂的道路场景中,以较高的准确率完成小型交通标志的检测。
-
公开(公告)号:CN117475349A
公开(公告)日:2024-01-30
申请号:CN202311268267.4
申请日:2023-09-28
Applicant: 南京信息工程大学
IPC: G06V20/40 , G06V40/20 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开了基于全局频域池化算法的轻量型行为识别方法,包括:获取需要进行动作识别的视频片段,对选取的视频片段进行预处理操作得到图片;将预处理后的图片输入基于全局频域池化的人体行为识别网络模型中进行卷积神经网络训练,并输出相应的人体动作分类结果;所述基于全局频域池化的人体行为识别网络模型包括输入层、3D卷积层、连续堆叠的高效残差块ERB、一个全局频域池化层GFDP、全连接层和softmax输出层。本发明在行为识别中传统的三维卷积和全局平均池化的方法上进行创新,实现了网络模型轻量化和高效提升识别准确率的效果。
-
-