-
公开(公告)号:CN108806668A
公开(公告)日:2018-11-13
申请号:CN201810590276.8
申请日:2018-06-08
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G10L15/02 , G10L15/06 , G10L15/08 , G10L15/26 , G10L17/02 , G10L17/04 , G10L17/22 , G10L21/0272 , G10L25/87
CPC classification number: G10L15/02 , G10L15/063 , G10L15/08 , G10L15/26 , G10L17/02 , G10L17/04 , G10L17/22 , G10L21/0272 , G10L25/87
Abstract: 本发明公开一种音视频多维度标注与模型优化方法,具体包括如下步骤:首先进行样本管理与分拣,针对输入系统的样本数据进行去重,编号,建立样本标注任务库;音频数据预处理阶段,将任务库的视频数据进行音频抽取,同时完成对音频数据的预处理操作;音频内容分析与特征提取阶段,在完成音频预处理后,并依据后台已配置的标注规范体系进行深度分析输出标签数据;步骤304:视频内容分析与特征提取阶段,通过对视频内容进行图像分析,并依据后台已配置的标注规范体系进行深度分析输出标签数据;步骤305:特征融合与标签生成,将识别特征与标签信息融合,输出该样本的标签结果;人工复核与模型优化,系统产生的标签结果数据会经由人工进行复核确认。