-
公开(公告)号:CN116189703B
公开(公告)日:2023-07-14
申请号:CN202310447342.7
申请日:2023-04-24
Applicant: 苏州大学
IPC: G10L21/0208 , G10L19/008 , G10L19/02 , G10L25/30
Abstract: 本发明公开了一种全局多头注意力语音增强方法,涉及生成对抗网络领域,包括将含噪音频信号输入至生成器编码器卷积得到卷积特征图谱;将卷积特征图谱输入至全局多头注意力层得到全局多头注意力特征图谱;将全局多头注意力特征图谱输入至生成器编码器得到卷积‑全局多头注意力‑卷积特征图谱;将卷积‑全局多头注意力‑卷积特征图谱与从高斯分布中采样的随机噪声z叠加,然后输入至生成器解码器得到反卷积特征图谱;将反卷积特征图谱输入至全局多头注意力层,得到解码‑全局多头注意力特征图谱;将解码‑全局多头注意力特征图谱输入至生成器解码器得到增强后的音频信号。本发明可以用于语音增强网络并能实现时间依赖性。
-
公开(公告)号:CN119479621A
公开(公告)日:2025-02-18
申请号:CN202510040343.9
申请日:2025-01-10
Applicant: 苏州大学
IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/20 , G10L15/22 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/0985
Abstract: 本发明涉及语音增强技术领域,公开了一种用于语音增强的多自注意力域方法及系统,包括:采集含有噪音的语音信息;构建MSAF模型的网络架构;将所述语音信息并行输入到N个自注意力模块中;将每个自注意力模块的输出与一个可训练的从高斯分布中随机采样的系数#imgabs0#相乘,得到最终输出的增强后干净的语音。通过融合不同位置自注意力层的自注意力模块,能够从多个维度学习到含有噪声的语音中的干净语音特征,从而实现更优的语音增强效果。在提高语音质量方面具有可比性,并且在分段SNR和语音清晰度方面优异。
-
公开(公告)号:CN115294970B
公开(公告)日:2023-03-24
申请号:CN202211226889.6
申请日:2022-10-09
Applicant: 苏州大学
Abstract: 本申请公开了一种针对病理嗓音的语音转换方法、装置和存储介质,涉及声音处理技术领域,所述方法包括:获取训练样本;对于每个样本病理嗓音,获取所述样本病理嗓音的样本梅尔谱图;根据各个样本梅尔谱图获取所述样本病理嗓音的样本基频;获取风格向量;将各个样本梅尔谱图、各个样本基频以及所述风格向量输入至生成器,通过所述生成器输出转换后的各个样本梅尔谱图;根据判别器判别所述生成器生成的转换后的各个样本梅尔谱图的真伪;根据所述判别器的各个判别结果训练所述生成器和所述判别器,训练后的所述生成器用于对目标病理嗓音进行嗓音转换。解决了现有技术中病理嗓音的语音质量较差,无法被理解的问题。
-
公开(公告)号:CN116189703A
公开(公告)日:2023-05-30
申请号:CN202310447342.7
申请日:2023-04-24
Applicant: 苏州大学
IPC: G10L21/0208 , G10L19/008 , G10L19/02 , G10L25/30
Abstract: 本发明公开了一种全局多头注意力语音增强方法,涉及生成对抗网络领域,包括将含噪音频信号输入至生成器编码器卷积得到卷积特征图谱;将卷积特征图谱输入至全局多头注意力层得到全局多头注意力特征图谱;将全局多头注意力特征图谱输入至生成器编码器得到卷积‑全局多头注意力‑卷积特征图谱;将卷积‑全局多头注意力‑卷积特征图谱与从高斯分布中采样的随机噪声z叠加,然后输入至生成器解码器得到反卷积特征图谱;将反卷积特征图谱输入至全局多头注意力层,得到解码‑全局多头注意力特征图谱;将解码‑全局多头注意力特征图谱输入至生成器解码器得到增强后的音频信号。本发明可以用于语音增强网络并能实现时间依赖性。
-
公开(公告)号:CN115294970A
公开(公告)日:2022-11-04
申请号:CN202211226889.6
申请日:2022-10-09
Applicant: 苏州大学
Abstract: 本申请公开了一种针对病理嗓音的语音转换方法、装置和存储介质,涉及声音处理技术领域,所述方法包括:获取训练样本;对于每个样本病理嗓音,获取所述样本病理嗓音的样本梅尔谱图;根据各个样本梅尔谱图获取所述样本病理嗓音的样本基频;获取风格向量;将各个样本梅尔谱图、各个样本基频以及所述风格向量输入至生成器,通过所述生成器输出转换后的各个样本梅尔谱图;根据判别器判别所述生成器生成的转换后的各个样本梅尔谱图的真伪;根据所述判别器的各个判别结果训练所述生成器和所述判别器,训练后的所述生成器用于对目标病理嗓音进行嗓音转换。解决了现有技术中病理嗓音的语音质量较差,无法被理解的问题。
-
公开(公告)号:CN219780303U
公开(公告)日:2023-09-29
申请号:CN202320844075.2
申请日:2023-04-17
Applicant: 苏州大学
IPC: H04R1/02
Abstract: 本实用新型提供了一种便携语音信号处理设备,属于音频处理设备技术领域。该便携语音信号处理设备包括音频处理器主机、转移携带组件和处理器保护组件。转移携带组件包括横条板、卡箍件和把手,两组卡箍件分别卡设在音频处理器主机两端,横条板两端分别与两组卡箍件连接,把手设置在横条板上方;处理器保护组件包括底板、包裹角件和弹性连接板件。本实用新型包裹在音频处理器主机四角的四组包裹角件对音频处理器主机的拐角处有着良好的保护作用。弹性连接板件使得包裹角件有着一定的缓冲性能,对音频处理器主机弯角处有着良好的缓冲保护,即使得音频处理器主机有着良好的防碰撞保护性能。
-
公开(公告)号:CN220604328U
公开(公告)日:2024-03-15
申请号:CN202320492694.X
申请日:2023-03-15
Applicant: 苏州大学
IPC: G10L15/28
Abstract: 本申请涉及一种数字语音信号处理系统,包括音频信号接收模块,用于接收外部的语音信号;主控制模块,与音频信号接收模块连接;以及语音识别模块,连接音频信号接收模块和主控制模块,语音识别模块将音频信号接收模块接收的语音信号进行识别分类并将识别结果输出至主控制模块进行分析转化为控制信号以控制承载数字语音信号处理系统的设备进行相应操作;其中,语音识别模块包括语音识别器,语音识别模块为LD3320芯片;主控制模块为STM32F103C8T6单片机,从而使得该系统可以自定义识别关键词,识别准确度高,整套系统有较高的移植性,只需更改待识别的关键词等少量程序即可与其他MCU进行结合使用实现特定的功能。
-
公开(公告)号:CN220120021U
公开(公告)日:2023-12-01
申请号:CN202320423357.5
申请日:2023-03-08
Applicant: 苏州大学
IPC: G01B7/16
Abstract: 本实用新型涉及微应变测量的技术领域,特别涉及一种微应变测量系统,所述微应变测量系统包括电桥电路、差分放大电路、模数转换电路以及处理单元,电桥电路连接有电阻应变片,电桥电路用于将电阻应变片阻值的变化转换为电压差;差分放大电路与电桥电路电性连接,用于将电压差进行放大处理;模数转换电路电连接于差分放大电路,用于将模拟信号转换为数字信号;处理单元用于处理经过模数转换后的电压,并将相应的值输出。本实用新型技术方案旨在提高微应变测量精度和准确度。
-
-
-
-
-
-
-