Patent search ap:("苏州大学") AND inv:"陶智" Page 1

1.

发明授权
双通道同步复装载脉冲发生方法有权

公开(公告)号：CN112787638B

公开(公告)日：2025-04-11

申请号：CN202011579629.8

申请日：2020-12-28

Applicant: 苏州大学

Inventor： 吴迪 , 王薪贵 , 鲍温霞 , 王靖 , 杨智勇 , 禹明慧 , 郑分刚 , 陶智 , 张晓俊

IPC: H03K7/08

Abstract: 本发明公开了一种双通道同步复装载脉冲发生方法，包括时钟发生模块、同步复装载计数模块和信号边沿触发模块三个部分，所述发生方法的步骤如下：1)时钟发生模块产生两个频率相近的计数时钟信号和同步装载信号；2)将上述计数时钟和同步装载信号输出给同步复装载计数模块；3)当同步复装载计数模块的计数值满足条件时，输出指示信号给信号边沿触发模块生成所需宽度的脉冲信号，实现了纳秒级脉冲信号的FPGA直接输出。通过上述方式，本发明通过两个通道之间产生的游标效应，对指示信号逻辑运算直接生成纳秒级瞬态脉冲，在此基础上，还可以通过更改计数值，实现纳秒级精度的脉冲宽度调制。

2.

发明授权
一种声源定位的高精度实现方法有权

公开(公告)号：CN116859336B

公开(公告)日：2024-09-13

申请号：CN202310862367.3

申请日：2023-07-14

Applicant: 苏州大学

Inventor： 许宜申 , 朱欣程 , 冯慧涛 , 姜余杰 , 邱志昕 , 颜明轩 , 蒋宇阳 , 吴彦昊 , 张晓俊 , 陶智

IPC: G01S5/18 , G06N3/0464 , G06N3/048 , G06F18/213 , G06F18/25

Abstract: 本发明属于声源定位的技术领域，公开了一种声源定位的高精度实现方法，包括利用双通道特性，并基于声源估计算法，计算各麦克风阵列之间的关系函数；通过构建二十面体特征注意力网络模型进行特征提取；对特征进行学习，实现高精度声源定位。本发明提供的一种声源定位的高精度实现方法，通过提出一种二十面体特征注意力网络模型满足了人工智能领域和工业领域对高精度声源定位的迫切需求，减少目前高精度声源定位的实现成本，有着很好的实用性。

3.

发明公开
一种声源定位的高精度实现方法审中-实审

公开(公告)号：CN116859336A

公开(公告)日：2023-10-10

申请号：CN202310862367.3

申请日：2023-07-14

Applicant: 苏州大学

Inventor： 许宜申 , 朱欣程 , 冯慧涛 , 姜余杰 , 邱志昕 , 颜明轩 , 蒋宇阳 , 吴彦昊 , 张晓俊 , 陶智

IPC: G01S5/18 , G06N3/0464 , G06N3/048 , G06F18/213 , G06F18/25

Abstract: 本发明属于声源定位的技术领域，公开了一种声源定位的高精度实现方法，包括利用双通道特性，并基于声源估计算法，计算各麦克风阵列之间的关系函数；通过构建二十面体特征注意力网络模型进行特征提取；对特征进行学习，实现高精度声源定位。本发明提供的一种声源定位的高精度实现方法，通过提出一种二十面体特征注意力网络模型满足了人工智能领域和工业领域对高精度声源定位的迫切需求，减少目前高精度声源定位的实现成本，有着很好的实用性。

4.

发明授权
一种利用声带建模反演的嗓音分类方法有权

公开(公告)号：CN109119094B

公开(公告)日：2023-04-28

申请号：CN201810824379.6

申请日：2018-07-25

Applicant: 苏州大学

Inventor： 孙宝印 , 陶智 , 陈莉媛 , 张晓俊 , 吴迪 , 肖仲喆

IPC: G10L25/27 , G10L25/39 , G10L25/48 , G10L25/51 , G10L25/03 , G10L25/24

Abstract: 本发明公开了一种利用声带建模反演的嗓音分类方法，从发声机理角度对各类语音进行有效区分。本发明主要利用复倒谱相位分解获得实际嗓音声门波作为目标声门波，采用优化算法通过匹配目标和模型声门波特征参数进行声带动力学模型反演操作，选取正常嗓音与特殊嗓音进行识别分类，有较好的准确率。本发明在输入实际语音信号后，提取实际声门波为目标，采用遗传算法进行反演对原有模型进行优化，从而模拟出不同嗓音发声时的声带振动情况。实验结果表明，模型反演后各特征参数匹配相对误差不超过1.95%，反演效果良好。选取正常嗓音与特殊嗓音进行识别分析，有较高的准确率。

5.

发明授权
针对病理嗓音的语音转换方法、装置和存储介质有权

公开(公告)号：CN115294970B

公开(公告)日：2023-03-24

申请号：CN202211226889.6

申请日：2022-10-09

Applicant: 苏州大学

Inventor： 吴迪 , 楚明航 , 杨梦涛 , 马瑶瑶 , 王靖 , 徐超 , 范智玮 , 张晓俊 , 陶智

IPC: G10L15/06 , G10L15/16 , G10L19/02 , G10L25/51

Abstract: 本申请公开了一种针对病理嗓音的语音转换方法、装置和存储介质，涉及声音处理技术领域，所述方法包括：获取训练样本；对于每个样本病理嗓音，获取所述样本病理嗓音的样本梅尔谱图；根据各个样本梅尔谱图获取所述样本病理嗓音的样本基频；获取风格向量；将各个样本梅尔谱图、各个样本基频以及所述风格向量输入至生成器，通过所述生成器输出转换后的各个样本梅尔谱图；根据判别器判别所述生成器生成的转换后的各个样本梅尔谱图的真伪；根据所述判别器的各个判别结果训练所述生成器和所述判别器，训练后的所述生成器用于对目标病理嗓音进行嗓音转换。解决了现有技术中病理嗓音的语音质量较差，无法被理解的问题。

6.

发明授权
基于四焦距相位相干机器视觉的晶体缺陷检测方法和系统有权

公开(公告)号：CN114820617B

公开(公告)日：2022-09-20

申请号：CN202210746133.8

申请日：2022-06-29

Applicant: 苏州大学

Inventor： 吴迪 , 朱涛 , 杨勇 , 高恬曼 , 黄玉玲 , 陶昕辰 , 张晓俊 , 陶智

IPC: G06T7/00 , G06T7/11 , G06T5/00 , G06T7/62 , G06T7/90

Abstract: 本说明书实施例提供一种基于四焦距相位相干机器视觉的晶体缺陷检测方法和系统，属于图像处理技术领域，该方法包括通过相位转换装置将待检测晶体的缺陷转化为相位信息；通过图像采集装置将相位信息转化为待检测晶体的晶体缺陷特征图像；对晶体缺陷特征图像进行预处理，获取预处理后的灰度图像；对预处理后的灰度图像进行灰度分析，确定灰度信息；基于灰度信息，确定缺陷厚度，具有快速且准确地确定晶体缺陷的优点。

7.

发明公开
一种基于多尺度递归量化分析的语音识别方法及系统无效

公开(公告)号：CN114999459A

公开(公告)日：2022-09-02

申请号：CN202210481126.X

申请日：2022-05-05

Applicant: 苏州大学

Inventor： 张晓俊 , 朱欣程 , 赵登煌 , 陶智

IPC: G10L15/02 , G10L15/06 , G10L25/18 , G10L25/24 , G10L25/36

Abstract: 本发明公开了一种基于多尺度递归量化分析的语音识别方法及系统，所述方法包括以下步骤：提取语音信号的声门波信号；利用Gammatone滤波器对声门波信号多频带划分，得到若干个频率通道的声门波信号；通过时间延迟和嵌入维数重建各频率通道的声门波信号的多尺度相空间，并根据相空间中两两相点之间的距离构建递归图；根据递归图量化声门波信号在各频率通道中的非线性动态递归特性，得到各频率通道的声门波信号的若干特征参数；将语音信号分为训练集与测试集，利用训练集的特征参数训练识别模型；利用训练好的识别模型对测试集的特征参数进行预测分类。本发明能够准确量化语音信号中的非线性特征，提高语音识别准确率。

8.

发明公开
一种面向语音识别的特征迁移学习方法及系统有权

公开(公告)号：CN114997266A

公开(公告)日：2022-09-02

申请号：CN202210427775.1

申请日：2022-04-22

Applicant: 苏州大学

Inventor： 张晓俊 , 章溢华 , 钱金阳 , 许宜申 , 陶智

IPC: G06K9/62 , G06N20/00

Abstract: 本发明公开了一种面向语音识别的特征迁移学习方法及系统，包括以下步骤：获取制作为训练集和测试集；计算训练集和测试集的特征边缘分布差异和特征间条件分布差异；建立特征分布差异目标，求解一个映射矩阵，使得训练集和测试集映射到同一子空间上的特征分布差异尽可能小；其中，特征分布差异目标以最小化训练集和测试集的特征边缘分布差异和特征间条件分布差异为基础，将类内距、类间距和图嵌入矩阵作为正则项，使得映射后不同类别的样本的中心投影点之间的距离尽可能地大，同一类别的样本投影后距离应尽可能地小，且保持邻域间样本的相似关系作为分布差异约束。本发明有效减少各种不确定因素对语音信号的干扰，从而提升语音识别率。

9.

发明公开
基于四焦距相位相干机器视觉的晶体缺陷检测方法和系统有权

公开(公告)号：CN114820617A

公开(公告)日：2022-07-29

申请号：CN202210746133.8

申请日：2022-06-29

Applicant: 苏州大学

Inventor： 吴迪 , 朱涛 , 杨勇 , 高恬曼 , 黄玉玲 , 陶昕辰 , 张晓俊 , 陶智

IPC: G06T7/00 , G06T7/11 , G06T5/00 , G06T7/62 , G06T7/90

Abstract: 本说明书实施例提供一种基于四焦距相位相干机器视觉的晶体缺陷检测方法和系统，属于图像处理技术领域，该方法包括通过相位转换装置将待检测晶体的缺陷转化为相位信息；通过图像采集装置将相位信息转化为待检测晶体的晶体缺陷特征图像；对晶体缺陷特征图像进行预处理，获取预处理后的灰度图像；对预处理后的灰度图像进行灰度分析，确定灰度信息；基于灰度信息，确定缺陷厚度，具有快速且准确地确定晶体缺陷的优点。

10.

发明公开
小样本不均衡语音数据库的生成式数据增强方法及系统有权

公开(公告)号：CN114548221A

公开(公告)日：2022-05-27

申请号：CN202210050846.0

申请日：2022-01-17

Applicant: 苏州大学

Inventor： 陶智 , 钱金阳 , 章溢华 , 张晓俊 , 许宜申

IPC: G06K9/62 , G06K9/00 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种小样本不均衡语音数据库的生成式数据增强方法，包括S1、对原始语音数据进行信号预处理，并对预处理后的语音数据划分训练集与测试集；S2、对训练集数据和测试集数据进行压缩；S3：对压缩后的训练集数据和测试集数据进行独热编码；S4、使用独热编码后的训练集数据训练低残差WaveNet神经网络；S5、使用独热编码后的测试集数据和训练好的低残差WaveNet神经网络生成原始数据库中不存在的语音样本。本发明小样本不均衡语音数据库的生成式数据增强方法及系统可以生成准确、多样的语音样本以扩充现有小样本不均衡语音数据库，使数据库能够应用更复杂的机器学习算法。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification