-
公开(公告)号:CN113177138A
公开(公告)日:2021-07-27
申请号:CN202110480048.7
申请日:2021-04-30
Applicant: 南开大学
Abstract: 弹幕视频是近几年来兴起的一种全新视频模式,这类视频广泛受到青少年喜欢。在观看传统类型的视频时,浏览者只能在视频外部固定的地方留言,而在观看弹幕视频时,浏览者不仅可以在视频画面上发表实时评论弹幕,也可以与其他浏览者发表的弹幕互动。弹幕视频作为一种包含文本信息的视频模式,我们可以挖掘其文本的有效信息对视频内容进行预测分类,本公开针对该问题,提供了一种基于弹幕和标题分析的有监督视频分类方法。本公开包括:一、收集并且预处理有标签的弹幕视频文本数据集。二、将处理好的文本数据传入预训练BERT模型以对模型进行微调。三、将弹幕视频的弹幕文本和标题文本数据传入微调好的BERT模型,分别生成文本向量表达。四、将弹幕文本向量和标题文本向量按照弹幕的数量进行加权,生成加权复合向量。五、将加权复合向量传入机器学习模型中分类,完成视频内容分类任务。