-
公开(公告)号:CN112151071B
公开(公告)日:2022-10-28
申请号:CN202011006934.8
申请日:2020-09-23
Applicant: 哈尔滨工程大学
Abstract: 本发明提供基于混合小波包特征深度学习的语音情感识别方法,S1:通过自相关函数算法对语音数据进行端点检测;S2:将语音序列数据截取成相同长度,将语音序列采样统一为1024,针对该序列用3层小波包重构算法生成新的8个重构信号,组成特征集1;S3:将语音信号直接通过快速傅里叶变换(FFT)提取140个融合了LLDs及其泛化函数的特征值,组成特征集2;S4:将特征集2用DNN的深度学习结构进行进一步提取特征,将特征集1进行进一步提取特征;S5:将两种利用不同结构所提取到的特征集融合在一起,利用Softmax损失函数进行最终分类。本发明能够混有噪声的情况下,能够充分提取语音信号的时域信息和频域信息特征,进而利用深度学习算法实现。
-
公开(公告)号:CN112151071A
公开(公告)日:2020-12-29
申请号:CN202011006934.8
申请日:2020-09-23
Applicant: 哈尔滨工程大学
Abstract: 本发明提供基于混合小波包特征深度学习的语音情感识别方法,S1:通过自相关函数算法对语音数据进行端点检测;S2:将语音序列数据截取成相同长度,将语音序列采样统一为1024,针对该序列用3层小波包重构算法生成新的8个重构信号,组成特征集1;S3:将语音信号直接通过快速傅里叶变换(FFT)提取140个融合了LLDs及其泛化函数的特征值,组成特征集2;S4:将特征集2用DNN的深度学习结构进行进一步提取特征,将特征集1进行进一步提取特征;S5:将两种利用不同结构所提取到的特征集融合在一起,利用Softmax损失函数进行最终分类。本发明能够混有噪声的情况下,能够充分提取语音信号的时域信息和频域信息特征,进而利用深度学习算法实现。
-