Patent search ap:("苏州大学") AND inv:"杨梦涛" Page 1

1.

发明公开
一种全局多头注意力语音增强方法有权

公开(公告)号：CN116189703A

公开(公告)日：2023-05-30

申请号：CN202310447342.7

申请日：2023-04-24

Applicant: 苏州大学

Inventor： 楚明航 , 王靖 , 马瑶瑶 , 黄玉玲 , 杨梦涛 , 范智玮 , 徐超 , 吴迪

IPC: G10L21/0208 , G10L19/008 , G10L19/02 , G10L25/30

Abstract: 本发明公开了一种全局多头注意力语音增强方法，涉及生成对抗网络领域，包括将含噪音频信号输入至生成器编码器卷积得到卷积特征图谱；将卷积特征图谱输入至全局多头注意力层得到全局多头注意力特征图谱；将全局多头注意力特征图谱输入至生成器编码器得到卷积‑全局多头注意力‑卷积特征图谱；将卷积‑全局多头注意力‑卷积特征图谱与从高斯分布中采样的随机噪声z叠加，然后输入至生成器解码器得到反卷积特征图谱；将反卷积特征图谱输入至全局多头注意力层，得到解码‑全局多头注意力特征图谱；将解码‑全局多头注意力特征图谱输入至生成器解码器得到增强后的音频信号。本发明可以用于语音增强网络并能实现时间依赖性。

2.

发明公开
针对病理嗓音的语音转换方法、装置和存储介质有权

公开(公告)号：CN115294970A

公开(公告)日：2022-11-04

申请号：CN202211226889.6

申请日：2022-10-09

Applicant: 苏州大学

Inventor： 吴迪 , 楚明航 , 杨梦涛 , 马瑶瑶 , 王靖 , 徐超 , 范智玮 , 张晓俊 , 陶智

IPC: G10L15/06 , G10L15/16 , G10L19/02 , G10L25/51

Abstract: 本申请公开了一种针对病理嗓音的语音转换方法、装置和存储介质，涉及声音处理技术领域，所述方法包括：获取训练样本；对于每个样本病理嗓音，获取所述样本病理嗓音的样本梅尔谱图；根据各个样本梅尔谱图获取所述样本病理嗓音的样本基频；获取风格向量；将各个样本梅尔谱图、各个样本基频以及所述风格向量输入至生成器，通过所述生成器输出转换后的各个样本梅尔谱图；根据判别器判别所述生成器生成的转换后的各个样本梅尔谱图的真伪；根据所述判别器的各个判别结果训练所述生成器和所述判别器，训练后的所述生成器用于对目标病理嗓音进行嗓音转换。解决了现有技术中病理嗓音的语音质量较差，无法被理解的问题。

3.

发明授权
一种全局多头注意力语音增强方法有权

公开(公告)号：CN116189703B

公开(公告)日：2023-07-14

申请号：CN202310447342.7

申请日：2023-04-24

Applicant: 苏州大学

Inventor： 楚明航 , 王靖 , 马瑶瑶 , 黄玉玲 , 杨梦涛 , 范智玮 , 徐超 , 吴迪

IPC: G10L21/0208 , G10L19/008 , G10L19/02 , G10L25/30

Abstract: 本发明公开了一种全局多头注意力语音增强方法，涉及生成对抗网络领域，包括将含噪音频信号输入至生成器编码器卷积得到卷积特征图谱；将卷积特征图谱输入至全局多头注意力层得到全局多头注意力特征图谱；将全局多头注意力特征图谱输入至生成器编码器得到卷积‑全局多头注意力‑卷积特征图谱；将卷积‑全局多头注意力‑卷积特征图谱与从高斯分布中采样的随机噪声z叠加，然后输入至生成器解码器得到反卷积特征图谱；将反卷积特征图谱输入至全局多头注意力层，得到解码‑全局多头注意力特征图谱；将解码‑全局多头注意力特征图谱输入至生成器解码器得到增强后的音频信号。本发明可以用于语音增强网络并能实现时间依赖性。

4.

发明公开
一种电控相变型非易失性2×3光波导开关及电控方法审中-实审

公开(公告)号：CN118818665A

公开(公告)日：2024-10-22

申请号：CN202411194305.0

申请日：2024-08-28

Applicant: 苏州大学

Inventor： 张桂菊 , 戈涛 , 杨梦涛 , 沈为民

IPC: G02B6/12 , G02B6/122 , G02B6/35

Abstract: 本发明涉及一种电控相变型非易失性2×3光波导开关及电控方法。它包括2×3光波导结构，脉冲发生系统；在SOI硅片上制备条形硅波导结构，包括硅‑二氧化硅衬底、三根硅波导、两根由硅材料和相变薄膜组成的复合波导及金属导电电极。利用现场脉冲发生系统的可编程门阵列产生窄带电压脉冲控制电极，实现相变薄膜的电致相变，进而控制光波导结构中光信号的传输通道。本发明采用条形波导结构，结构简单，减少加工难度；提出了利用FPGA同步控制导电电极两端的短脉冲电压输出，诱导相变薄膜的晶化和非晶化两种相态，调控光信号从两个端口输入，三个端口任意输出，拥有更高的数据传输能力，在全光网络中有更好的应用前景。

5.

发明授权
针对病理嗓音的语音转换方法、装置和存储介质有权

公开(公告)号：CN115294970B

公开(公告)日：2023-03-24

申请号：CN202211226889.6

申请日：2022-10-09

Applicant: 苏州大学

Inventor： 吴迪 , 楚明航 , 杨梦涛 , 马瑶瑶 , 王靖 , 徐超 , 范智玮 , 张晓俊 , 陶智

IPC: G10L15/06 , G10L15/16 , G10L19/02 , G10L25/51

Abstract: 本申请公开了一种针对病理嗓音的语音转换方法、装置和存储介质，涉及声音处理技术领域，所述方法包括：获取训练样本；对于每个样本病理嗓音，获取所述样本病理嗓音的样本梅尔谱图；根据各个样本梅尔谱图获取所述样本病理嗓音的样本基频；获取风格向量；将各个样本梅尔谱图、各个样本基频以及所述风格向量输入至生成器，通过所述生成器输出转换后的各个样本梅尔谱图；根据判别器判别所述生成器生成的转换后的各个样本梅尔谱图的真伪；根据所述判别器的各个判别结果训练所述生成器和所述判别器，训练后的所述生成器用于对目标病理嗓音进行嗓音转换。解决了现有技术中病理嗓音的语音质量较差，无法被理解的问题。

6.

实用新型
微应变测量系统有权转让

公开(公告)号：CN220120021U

公开(公告)日：2023-12-01

申请号：CN202320423357.5

申请日：2023-03-08

Applicant: 苏州大学

Inventor： 吴迪 , 王靖 , 沈成 , 徐超 , 范智玮 , 马瑶瑶 , 楚明航 , 杨梦涛

IPC: G01B7/16

Abstract: 本实用新型涉及微应变测量的技术领域，特别涉及一种微应变测量系统，所述微应变测量系统包括电桥电路、差分放大电路、模数转换电路以及处理单元，电桥电路连接有电阻应变片，电桥电路用于将电阻应变片阻值的变化转换为电压差；差分放大电路与电桥电路电性连接，用于将电压差进行放大处理；模数转换电路电连接于差分放大电路，用于将模拟信号转换为数字信号；处理单元用于处理经过模数转换后的电压，并将相应的值输出。本实用新型技术方案旨在提高微应变测量精度和准确度。

7.

实用新型
数字语音信号处理系统有权

公开(公告)号：CN220604328U

公开(公告)日：2024-03-15

申请号：CN202320492694.X

申请日：2023-03-15

Applicant: 苏州大学

Inventor： 吴迪 , 马瑶瑶 , 钱金阳 , 黄玉玲 , 楚明航 , 范智玮 , 徐超 , 王靖 , 杨梦涛

IPC: G10L15/28

Abstract: 本申请涉及一种数字语音信号处理系统，包括音频信号接收模块，用于接收外部的语音信号；主控制模块，与音频信号接收模块连接；以及语音识别模块，连接音频信号接收模块和主控制模块，语音识别模块将音频信号接收模块接收的语音信号进行识别分类并将识别结果输出至主控制模块进行分析转化为控制信号以控制承载数字语音信号处理系统的设备进行相应操作；其中，语音识别模块包括语音识别器，语音识别模块为LD3320芯片；主控制模块为STM32F103C8T6单片机，从而使得该系统可以自定义识别关键词，识别准确度高，整套系统有较高的移植性，只需更改待识别的关键词等少量程序即可与其他MCU进行结合使用实现特定的功能。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification