Saved successfully
Save failed
Saved Successfully
Save Failed
公开(公告)号:CN115147641A
公开(公告)日:2022-10-04
申请号:CN202210609575.8
申请日:2022-05-31
Applicant: 东南大学
Inventor: 伍家松 , 张家伟 , 马瑛瑶 , 孔佑勇 , 杨冠羽 , 杨淳沨 , 董志芳 , 舒华忠
IPC: G06V10/764 , G06V10/82 , G06V20/40 , G06N3/08 , G06N3/04
Abstract: 本发明涉及一种基于知识蒸馏和多模态融合的视频分类方法,具体步骤如下:步骤1,提取音频、视觉数据集并预处理,步骤2,搭建知识蒸馏架构,步骤3,多模态融合学生网络。本发明在不更改网络结构的前提下,可以充分利用视频中的多模态数据以及使用的网络性能,显著提升视频分类效果。