-
公开(公告)号:CN116189703A
公开(公告)日:2023-05-30
申请号:CN202310447342.7
申请日:2023-04-24
Applicant: 苏州大学
IPC: G10L21/0208 , G10L19/008 , G10L19/02 , G10L25/30
Abstract: 本发明公开了一种全局多头注意力语音增强方法,涉及生成对抗网络领域,包括将含噪音频信号输入至生成器编码器卷积得到卷积特征图谱;将卷积特征图谱输入至全局多头注意力层得到全局多头注意力特征图谱;将全局多头注意力特征图谱输入至生成器编码器得到卷积‑全局多头注意力‑卷积特征图谱;将卷积‑全局多头注意力‑卷积特征图谱与从高斯分布中采样的随机噪声z叠加,然后输入至生成器解码器得到反卷积特征图谱;将反卷积特征图谱输入至全局多头注意力层,得到解码‑全局多头注意力特征图谱;将解码‑全局多头注意力特征图谱输入至生成器解码器得到增强后的音频信号。本发明可以用于语音增强网络并能实现时间依赖性。
-
公开(公告)号:CN115294970A
公开(公告)日:2022-11-04
申请号:CN202211226889.6
申请日:2022-10-09
Applicant: 苏州大学
Abstract: 本申请公开了一种针对病理嗓音的语音转换方法、装置和存储介质,涉及声音处理技术领域,所述方法包括:获取训练样本;对于每个样本病理嗓音,获取所述样本病理嗓音的样本梅尔谱图;根据各个样本梅尔谱图获取所述样本病理嗓音的样本基频;获取风格向量;将各个样本梅尔谱图、各个样本基频以及所述风格向量输入至生成器,通过所述生成器输出转换后的各个样本梅尔谱图;根据判别器判别所述生成器生成的转换后的各个样本梅尔谱图的真伪;根据所述判别器的各个判别结果训练所述生成器和所述判别器,训练后的所述生成器用于对目标病理嗓音进行嗓音转换。解决了现有技术中病理嗓音的语音质量较差,无法被理解的问题。
-
公开(公告)号:CN116189703B
公开(公告)日:2023-07-14
申请号:CN202310447342.7
申请日:2023-04-24
Applicant: 苏州大学
IPC: G10L21/0208 , G10L19/008 , G10L19/02 , G10L25/30
Abstract: 本发明公开了一种全局多头注意力语音增强方法,涉及生成对抗网络领域,包括将含噪音频信号输入至生成器编码器卷积得到卷积特征图谱;将卷积特征图谱输入至全局多头注意力层得到全局多头注意力特征图谱;将全局多头注意力特征图谱输入至生成器编码器得到卷积‑全局多头注意力‑卷积特征图谱;将卷积‑全局多头注意力‑卷积特征图谱与从高斯分布中采样的随机噪声z叠加,然后输入至生成器解码器得到反卷积特征图谱;将反卷积特征图谱输入至全局多头注意力层,得到解码‑全局多头注意力特征图谱;将解码‑全局多头注意力特征图谱输入至生成器解码器得到增强后的音频信号。本发明可以用于语音增强网络并能实现时间依赖性。
-
公开(公告)号:CN118818665A
公开(公告)日:2024-10-22
申请号:CN202411194305.0
申请日:2024-08-28
Applicant: 苏州大学
Abstract: 本发明涉及一种电控相变型非易失性2×3光波导开关及电控方法。它包括2×3光波导结构,脉冲发生系统;在SOI硅片上制备条形硅波导结构,包括硅‑二氧化硅衬底、三根硅波导、两根由硅材料和相变薄膜组成的复合波导及金属导电电极。利用现场脉冲发生系统的可编程门阵列产生窄带电压脉冲控制电极,实现相变薄膜的电致相变,进而控制光波导结构中光信号的传输通道。本发明采用条形波导结构,结构简单,减少加工难度;提出了利用FPGA同步控制导电电极两端的短脉冲电压输出,诱导相变薄膜的晶化和非晶化两种相态,调控光信号从两个端口输入,三个端口任意输出,拥有更高的数据传输能力,在全光网络中有更好的应用前景。
-
公开(公告)号:CN115294970B
公开(公告)日:2023-03-24
申请号:CN202211226889.6
申请日:2022-10-09
Applicant: 苏州大学
Abstract: 本申请公开了一种针对病理嗓音的语音转换方法、装置和存储介质,涉及声音处理技术领域,所述方法包括:获取训练样本;对于每个样本病理嗓音,获取所述样本病理嗓音的样本梅尔谱图;根据各个样本梅尔谱图获取所述样本病理嗓音的样本基频;获取风格向量;将各个样本梅尔谱图、各个样本基频以及所述风格向量输入至生成器,通过所述生成器输出转换后的各个样本梅尔谱图;根据判别器判别所述生成器生成的转换后的各个样本梅尔谱图的真伪;根据所述判别器的各个判别结果训练所述生成器和所述判别器,训练后的所述生成器用于对目标病理嗓音进行嗓音转换。解决了现有技术中病理嗓音的语音质量较差,无法被理解的问题。
-
公开(公告)号:CN220120021U
公开(公告)日:2023-12-01
申请号:CN202320423357.5
申请日:2023-03-08
Applicant: 苏州大学
IPC: G01B7/16
Abstract: 本实用新型涉及微应变测量的技术领域,特别涉及一种微应变测量系统,所述微应变测量系统包括电桥电路、差分放大电路、模数转换电路以及处理单元,电桥电路连接有电阻应变片,电桥电路用于将电阻应变片阻值的变化转换为电压差;差分放大电路与电桥电路电性连接,用于将电压差进行放大处理;模数转换电路电连接于差分放大电路,用于将模拟信号转换为数字信号;处理单元用于处理经过模数转换后的电压,并将相应的值输出。本实用新型技术方案旨在提高微应变测量精度和准确度。
-
公开(公告)号:CN220604328U
公开(公告)日:2024-03-15
申请号:CN202320492694.X
申请日:2023-03-15
Applicant: 苏州大学
IPC: G10L15/28
Abstract: 本申请涉及一种数字语音信号处理系统,包括音频信号接收模块,用于接收外部的语音信号;主控制模块,与音频信号接收模块连接;以及语音识别模块,连接音频信号接收模块和主控制模块,语音识别模块将音频信号接收模块接收的语音信号进行识别分类并将识别结果输出至主控制模块进行分析转化为控制信号以控制承载数字语音信号处理系统的设备进行相应操作;其中,语音识别模块包括语音识别器,语音识别模块为LD3320芯片;主控制模块为STM32F103C8T6单片机,从而使得该系统可以自定义识别关键词,识别准确度高,整套系统有较高的移植性,只需更改待识别的关键词等少量程序即可与其他MCU进行结合使用实现特定的功能。
-
-
-
-
-
-