-
公开(公告)号:CN114999459A
公开(公告)日:2022-09-02
申请号:CN202210481126.X
申请日:2022-05-05
Applicant: 苏州大学
Abstract: 本发明公开了一种基于多尺度递归量化分析的语音识别方法及系统,所述方法包括以下步骤:提取语音信号的声门波信号;利用Gammatone滤波器对声门波信号多频带划分,得到若干个频率通道的声门波信号;通过时间延迟和嵌入维数重建各频率通道的声门波信号的多尺度相空间,并根据相空间中两两相点之间的距离构建递归图;根据递归图量化声门波信号在各频率通道中的非线性动态递归特性,得到各频率通道的声门波信号的若干特征参数;将语音信号分为训练集与测试集,利用训练集的特征参数训练识别模型;利用训练好的识别模型对测试集的特征参数进行预测分类。本发明能够准确量化语音信号中的非线性特征,提高语音识别准确率。
-
公开(公告)号:CN116597864A
公开(公告)日:2023-08-15
申请号:CN202310534832.0
申请日:2023-05-12
Applicant: 苏州大学
Abstract: 本发明提供了一种嗓音检测方法及装置,涉及声音检测技术领域。包括:将待检测语音信号输入可解释卷积滤波器组,得到多频带语音信号;利用一维深度可分离卷积神经网络的第一路径和第二路径分别提取多频带语音信号的时间特征和时频特征,并组合得到多频带语音信号特征向量;利用全连接网络对多频带语音信号特征向量进行分类得到分类结果,将分类结果作为待检测语音信号的异常指数。本发明使用可解释卷积滤波器组可以更好的捕捉待检测语音信号的频带信息,而一维深度可分离卷积神经网络可以分别提取多频带语音信号的时间特征和时频特征,增加了特征提取的有效性,使得该方法更具有可解释性,提高了嗓音检测结果的可靠性。
-