-
公开(公告)号:CN119724157A
公开(公告)日:2025-03-28
申请号:CN202411892222.9
申请日:2024-12-20
Applicant: 华夏数智智慧校园规划设计院(深圳)有限公司
IPC: G10L15/00 , G10L15/06 , G10L15/16 , G10L15/18 , G10L15/26 , G10L21/0272 , G10L25/63 , G06V40/16 , G06F18/25 , G06F18/214 , G06F18/23 , G06F18/24
Abstract: 本发明公开了基于人工智能辅助谈话场景的语言识别方法及系统,属于语言识别技术领域,其方法具体包括:利用传感器采集音频信号和视频数据,实时对音频信号和视频数据进行噪声过滤,对噪声过滤后的音频信号进行预处理,对预处理后的音频信号中的语音进行分离,和谈话者进行分割,提取每个谈话者的语音特征,并根据语音特征进行语音解码,输出最终的文本,根据输出最终的文本和语境,分析谈话者的意图;通过摄像头捕捉谈话者的面部表情和肢体语言,并结合语音信号中的音调和情感信息,能够更加全面地理解对话的真实语义。