-
公开(公告)号:CN117174092A
公开(公告)日:2023-12-05
申请号:CN202311449029.3
申请日:2023-11-02
Applicant: 北京语言大学
IPC: G10L17/00 , G10L17/02 , G10L25/30 , G10L25/60 , G10L15/26 , G06V10/40 , G06V10/82 , G06V20/40 , G06V40/10 , G06N3/0464 , G06N3/0442 , G06N3/08 , H04L67/1095 , H04L9/40 , G06F21/60
Abstract: 本发明公开了一种基于声纹识别与多模态分析的移动语料转写方法及装置,涉及视频语音融合识别技术领域。包括:获取待分析的视频数据以及音频数据;将视频数据以及音频数据输入到构建好的数据处理模型,得到数据处理结果,包括视频数据的关键信息标注结果、音频数据的转写结果以及音频数据的分析结果;对转写结果进行实时校验以及二次标注,得到多模态数据的移动语料转写结果。本发明提出了一种集成了多模态分析、实时数据校验与查阅功能的先进移动语料转写系统,旨在为用户提供更加准确、完整和直观的转写体验。
-
公开(公告)号:CN117174092B
公开(公告)日:2024-01-26
申请号:CN202311449029.3
申请日:2023-11-02
Applicant: 北京语言大学
IPC: G10L17/00 , G10L17/02 , G10L25/30 , G10L25/60 , G10L15/26 , G06V10/40 , G06V10/82 , G06V20/40 , G06V40/10 , G06N3/0464 , G06N3/0442 , G06N3/08 , H04L67/1095 , H04L9/40 , G06F21/60
Abstract: 本发明公开了一种基于声纹识别与多模态分析的移动语料转写方法及装置,涉及视频语音融合识别技术领域。包括:获取待分析的视频数据以及音频数据;将视频数据以及音频数据输入到构建好的数据处理模型,得到数据处理结果,包括视频数据的关键信息标注结果、音频数据的转写结果以及音频数据的分析结果;对转写结果进行实时校验以及二次标注,得到多模态数据的移动语料转写结果。本发明提出了一种集成了多模态分析、实时数据校验与查阅功能的先进移动语料转写系统,旨在为用户提供更加准确、完整和直观的转写体验。
-