一种基于人工智能的字幕生成方法和装置
Abstract:
本申请实施例公开了一种基于人工智能的字幕生成方法和装置,至少涉及人工智能中的语音处理技术和自然语言处理技术,针对来自同一个音频流、且根据静音片段切分的多个语音片段,通过语音识别得到多个语音片段分别对应的文本并确定静音片段的时间长度。在根据目标语音片段所对应文本确定字幕时,根据音频流时间轴的顺序,依次确定静音片段的时间长度是否大于预设时长,以此确定包括了该目标语音片段所对应文本的待处理文本组。之后,根据待处理文本组中字符数量多少以及是否具有分隔符确定字幕文本,由于分隔符间的文本部分属于完整的句子,能够体现合理的语义,故确定的字幕文本中出现不完整句子的可能性低,将该字幕文本作为字幕进行展示时,能够帮助收看音视频的用户理解音视频内容。
Public/Granted literature
Patent Agency Ranking
0/0