小样本不均衡语音数据库的生成式数据增强方法及系统

    公开(公告)号:CN114548221B

    公开(公告)日:2023-04-28

    申请号:CN202210050846.0

    申请日:2022-01-17

    Applicant: 苏州大学

    Abstract: 本发明公开了一种小样本不均衡语音数据库的生成式数据增强方法,包括S1、对原始语音数据进行信号预处理,并对预处理后的语音数据划分训练集与测试集;S2、对训练集数据和测试集数据进行压缩;S3:对压缩后的训练集数据和测试集数据进行独热编码;S4、使用独热编码后的训练集数据训练低残差WaveNet神经网络;S5、使用独热编码后的测试集数据和训练好的低残差WaveNet神经网络生成原始数据库中不存在的语音样本。本发明小样本不均衡语音数据库的生成式数据增强方法及系统可以生成准确、多样的语音样本以扩充现有小样本不均衡语音数据库,使数据库能够应用更复杂的机器学习算法。

    一种面向语音识别的特征迁移学习方法及系统

    公开(公告)号:CN114997266B

    公开(公告)日:2023-07-11

    申请号:CN202210427775.1

    申请日:2022-04-22

    Applicant: 苏州大学

    Abstract: 本发明公开了一种面向语音识别的特征迁移学习方法及系统,包括以下步骤:获取制作为训练集和测试集;计算训练集和测试集的特征边缘分布差异和特征间条件分布差异;建立特征分布差异目标,求解一个映射矩阵,使得训练集和测试集映射到同一子空间上的特征分布差异尽可能小;其中,特征分布差异目标以最小化训练集和测试集的特征边缘分布差异和特征间条件分布差异为基础,将类内距、类间距和图嵌入矩阵作为正则项,使得映射后不同类别的样本的中心投影点之间的距离尽可能地大,同一类别的样本投影后距离应尽可能地小,且保持邻域间样本的相似关系作为分布差异约束。本发明有效减少各种不确定因素对语音信号的干扰,从而提升语音识别率。

    一种面向语音识别的特征迁移学习方法及系统

    公开(公告)号:CN114997266A

    公开(公告)日:2022-09-02

    申请号:CN202210427775.1

    申请日:2022-04-22

    Applicant: 苏州大学

    Abstract: 本发明公开了一种面向语音识别的特征迁移学习方法及系统,包括以下步骤:获取制作为训练集和测试集;计算训练集和测试集的特征边缘分布差异和特征间条件分布差异;建立特征分布差异目标,求解一个映射矩阵,使得训练集和测试集映射到同一子空间上的特征分布差异尽可能小;其中,特征分布差异目标以最小化训练集和测试集的特征边缘分布差异和特征间条件分布差异为基础,将类内距、类间距和图嵌入矩阵作为正则项,使得映射后不同类别的样本的中心投影点之间的距离尽可能地大,同一类别的样本投影后距离应尽可能地小,且保持邻域间样本的相似关系作为分布差异约束。本发明有效减少各种不确定因素对语音信号的干扰,从而提升语音识别率。

    小样本不均衡语音数据库的生成式数据增强方法及系统

    公开(公告)号:CN114548221A

    公开(公告)日:2022-05-27

    申请号:CN202210050846.0

    申请日:2022-01-17

    Applicant: 苏州大学

    Abstract: 本发明公开了一种小样本不均衡语音数据库的生成式数据增强方法,包括S1、对原始语音数据进行信号预处理,并对预处理后的语音数据划分训练集与测试集;S2、对训练集数据和测试集数据进行压缩;S3:对压缩后的训练集数据和测试集数据进行独热编码;S4、使用独热编码后的训练集数据训练低残差WaveNet神经网络;S5、使用独热编码后的测试集数据和训练好的低残差WaveNet神经网络生成原始数据库中不存在的语音样本。本发明小样本不均衡语音数据库的生成式数据增强方法及系统可以生成准确、多样的语音样本以扩充现有小样本不均衡语音数据库,使数据库能够应用更复杂的机器学习算法。

    数字语音信号处理系统
    5.
    实用新型

    公开(公告)号:CN220604328U

    公开(公告)日:2024-03-15

    申请号:CN202320492694.X

    申请日:2023-03-15

    Applicant: 苏州大学

    Abstract: 本申请涉及一种数字语音信号处理系统,包括音频信号接收模块,用于接收外部的语音信号;主控制模块,与音频信号接收模块连接;以及语音识别模块,连接音频信号接收模块和主控制模块,语音识别模块将音频信号接收模块接收的语音信号进行识别分类并将识别结果输出至主控制模块进行分析转化为控制信号以控制承载数字语音信号处理系统的设备进行相应操作;其中,语音识别模块包括语音识别器,语音识别模块为LD3320芯片;主控制模块为STM32F103C8T6单片机,从而使得该系统可以自定义识别关键词,识别准确度高,整套系统有较高的移植性,只需更改待识别的关键词等少量程序即可与其他MCU进行结合使用实现特定的功能。

Patent Agency Ranking