Invention Grant
- Patent Title: 一种从视频字幕中提取概念词的方法
-
Application No.: CN201910278094.1Application Date: 2019-04-09
-
Publication No.: CN110175246BPublication Date: 2021-04-13
- Inventor: 赵中英 , 杨永浩 , 周慧 , 李超
- Applicant: 山东科技大学
- Applicant Address: 山东省青岛市黄岛区经济技术开发区前湾港路579号
- Assignee: 山东科技大学
- Current Assignee: 山东科技大学
- Current Assignee Address: 山东省青岛市黄岛区经济技术开发区前湾港路579号
- Agency: 青岛智地领创专利代理有限公司
- Agent 林琪超
- Main IPC: G06F16/483
- IPC: G06F16/483 ; G06F40/284 ; G06F40/30

Abstract:
本发明公开了一种从视频字幕中提取概念词的方法,其包括如下步骤:对字幕文本进行分词处理,并删除标点符号;对分词后的字幕文本进行停止词和词性标注;计算目标单词和相邻词的共现特征;计算目标单词和相邻词的语义相似度;对分词后的少量字幕文本进行概念词标记,作为训练集;根据所述训练集对预先建立的基于条件随机场的半监督学习框架进行训练,得到概念词预测模型,并获取所述概念词预测模型输出的字幕文本对应的概念词预测结果。基于本发明提供的提取概念词的方法,减轻了人工标注语料的工作量,提升了在MOOC视频字幕场景中提取概念词的准确性,并满足了实际需求。
Public/Granted literature
- CN110175246A 一种从视频字幕中提取概念词的方法 Public/Granted day:2019-08-27
Information query