双通道同步复装载脉冲发生方法

    公开(公告)号:CN112787638B

    公开(公告)日:2025-04-11

    申请号:CN202011579629.8

    申请日:2020-12-28

    Applicant: 苏州大学

    Abstract: 本发明公开了一种双通道同步复装载脉冲发生方法,包括时钟发生模块、同步复装载计数模块和信号边沿触发模块三个部分,所述发生方法的步骤如下:1)时钟发生模块产生两个频率相近的计数时钟信号和同步装载信号;2)将上述计数时钟和同步装载信号输出给同步复装载计数模块;3)当同步复装载计数模块的计数值满足条件时,输出指示信号给信号边沿触发模块生成所需宽度的脉冲信号,实现了纳秒级脉冲信号的FPGA直接输出。通过上述方式,本发明通过两个通道之间产生的游标效应,对指示信号逻辑运算直接生成纳秒级瞬态脉冲,在此基础上,还可以通过更改计数值,实现纳秒级精度的脉冲宽度调制。

    一种利用声带建模反演的嗓音分类方法

    公开(公告)号:CN109119094B

    公开(公告)日:2023-04-28

    申请号:CN201810824379.6

    申请日:2018-07-25

    Applicant: 苏州大学

    Abstract: 本发明公开了一种利用声带建模反演的嗓音分类方法,从发声机理角度对各类语音进行有效区分。本发明主要利用复倒谱相位分解获得实际嗓音声门波作为目标声门波,采用优化算法通过匹配目标和模型声门波特征参数进行声带动力学模型反演操作,选取正常嗓音与特殊嗓音进行识别分类,有较好的准确率。本发明在输入实际语音信号后,提取实际声门波为目标,采用遗传算法进行反演对原有模型进行优化,从而模拟出不同嗓音发声时的声带振动情况。实验结果表明,模型反演后各特征参数匹配相对误差不超过1.95%,反演效果良好。选取正常嗓音与特殊嗓音进行识别分析,有较高的准确率。

    针对病理嗓音的语音转换方法、装置和存储介质

    公开(公告)号:CN115294970B

    公开(公告)日:2023-03-24

    申请号:CN202211226889.6

    申请日:2022-10-09

    Applicant: 苏州大学

    Abstract: 本申请公开了一种针对病理嗓音的语音转换方法、装置和存储介质,涉及声音处理技术领域,所述方法包括:获取训练样本;对于每个样本病理嗓音,获取所述样本病理嗓音的样本梅尔谱图;根据各个样本梅尔谱图获取所述样本病理嗓音的样本基频;获取风格向量;将各个样本梅尔谱图、各个样本基频以及所述风格向量输入至生成器,通过所述生成器输出转换后的各个样本梅尔谱图;根据判别器判别所述生成器生成的转换后的各个样本梅尔谱图的真伪;根据所述判别器的各个判别结果训练所述生成器和所述判别器,训练后的所述生成器用于对目标病理嗓音进行嗓音转换。解决了现有技术中病理嗓音的语音质量较差,无法被理解的问题。

    一种基于多尺度递归量化分析的语音识别方法及系统

    公开(公告)号:CN114999459A

    公开(公告)日:2022-09-02

    申请号:CN202210481126.X

    申请日:2022-05-05

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于多尺度递归量化分析的语音识别方法及系统,所述方法包括以下步骤:提取语音信号的声门波信号;利用Gammatone滤波器对声门波信号多频带划分,得到若干个频率通道的声门波信号;通过时间延迟和嵌入维数重建各频率通道的声门波信号的多尺度相空间,并根据相空间中两两相点之间的距离构建递归图;根据递归图量化声门波信号在各频率通道中的非线性动态递归特性,得到各频率通道的声门波信号的若干特征参数;将语音信号分为训练集与测试集,利用训练集的特征参数训练识别模型;利用训练好的识别模型对测试集的特征参数进行预测分类。本发明能够准确量化语音信号中的非线性特征,提高语音识别准确率。

    一种面向语音识别的特征迁移学习方法及系统

    公开(公告)号:CN114997266A

    公开(公告)日:2022-09-02

    申请号:CN202210427775.1

    申请日:2022-04-22

    Applicant: 苏州大学

    Abstract: 本发明公开了一种面向语音识别的特征迁移学习方法及系统,包括以下步骤:获取制作为训练集和测试集;计算训练集和测试集的特征边缘分布差异和特征间条件分布差异;建立特征分布差异目标,求解一个映射矩阵,使得训练集和测试集映射到同一子空间上的特征分布差异尽可能小;其中,特征分布差异目标以最小化训练集和测试集的特征边缘分布差异和特征间条件分布差异为基础,将类内距、类间距和图嵌入矩阵作为正则项,使得映射后不同类别的样本的中心投影点之间的距离尽可能地大,同一类别的样本投影后距离应尽可能地小,且保持邻域间样本的相似关系作为分布差异约束。本发明有效减少各种不确定因素对语音信号的干扰,从而提升语音识别率。

    小样本不均衡语音数据库的生成式数据增强方法及系统

    公开(公告)号:CN114548221A

    公开(公告)日:2022-05-27

    申请号:CN202210050846.0

    申请日:2022-01-17

    Applicant: 苏州大学

    Abstract: 本发明公开了一种小样本不均衡语音数据库的生成式数据增强方法,包括S1、对原始语音数据进行信号预处理,并对预处理后的语音数据划分训练集与测试集;S2、对训练集数据和测试集数据进行压缩;S3:对压缩后的训练集数据和测试集数据进行独热编码;S4、使用独热编码后的训练集数据训练低残差WaveNet神经网络;S5、使用独热编码后的测试集数据和训练好的低残差WaveNet神经网络生成原始数据库中不存在的语音样本。本发明小样本不均衡语音数据库的生成式数据增强方法及系统可以生成准确、多样的语音样本以扩充现有小样本不均衡语音数据库,使数据库能够应用更复杂的机器学习算法。

Patent Agency Ranking