Patent search ap:("苏州大学") AND inv:"张晓俊" Page 3

21.

发明公开
小样本不均衡语音数据库的生成式数据增强方法及系统有权

公开(公告)号：CN114548221A

公开(公告)日：2022-05-27

申请号：CN202210050846.0

申请日：2022-01-17

Applicant: 苏州大学

Inventor： 陶智 , 钱金阳 , 章溢华 , 张晓俊 , 许宜申

IPC: G06K9/62 , G06K9/00 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种小样本不均衡语音数据库的生成式数据增强方法，包括S1、对原始语音数据进行信号预处理，并对预处理后的语音数据划分训练集与测试集；S2、对训练集数据和测试集数据进行压缩；S3：对压缩后的训练集数据和测试集数据进行独热编码；S4、使用独热编码后的训练集数据训练低残差WaveNet神经网络；S5、使用独热编码后的测试集数据和训练好的低残差WaveNet神经网络生成原始数据库中不存在的语音样本。本发明小样本不均衡语音数据库的生成式数据增强方法及系统可以生成准确、多样的语音样本以扩充现有小样本不均衡语音数据库，使数据库能够应用更复杂的机器学习算法。

22.

发明公开
一种利用声带建模反演的嗓音分类方法有权

公开(公告)号：CN109119094A

公开(公告)日：2019-01-01

申请号：CN201810824379.6

申请日：2018-07-25

Applicant: 苏州大学

Inventor： 孙宝印 , 陶智 , 陈莉媛 , 张晓俊 , 吴迪 , 肖仲喆

IPC: G10L25/27 , G10L25/39 , G10L25/48 , G10L25/51 , G10L25/03 , G10L25/24

Abstract: 本发明公开了一种利用声带建模反演的嗓音分类方法，从发声机理角度对各类语音进行有效区分。本发明主要利用复倒谱相位分解获得实际嗓音声门波作为目标声门波，采用优化算法通过匹配目标和模型声门波特征参数进行声带动力学模型反演操作，选取正常嗓音与特殊嗓音进行识别分类，有较好的准确率。本发明在输入实际语音信号后，提取实际声门波为目标，采用遗传算法进行反演对原有模型进行优化，从而模拟出不同嗓音发声时的声带振动情况。实验结果表明，模型反演后各特征参数匹配相对误差不超过1.95%，反演效果良好。选取正常嗓音与特殊嗓音进行识别分析，有较高的准确率。

23.

发明授权
一种NFC手机电子锁门禁装置系统有权转让

公开(公告)号：CN104778768B

公开(公告)日：2017-07-28

申请号：CN201510153692.8

申请日：2015-04-02

Applicant: 苏州大学

Inventor： 孙焕 , 陶智 , 张晓俊 , 吴迪 , 孙宝印

IPC: G07C9/00

Abstract: 本发明是一种NFC手机电子锁门禁装置系统，该系统包括室外部分、室内部分、电子锁体和控制系统，所述室外部分正面依次设置二维码扫描区、NFC扫描区、门开指示灯、低电量指示灯、防钻圈、锁头以及外执手，室外部分左侧设置应急电池接口柱，所述电子锁体侧面设置两个锁舌，所述室内部分正面设置有AA电池仓，AA电池仓下端依次设置内置报警器、设定键、音量调节开关以及自动/手动锁门切换开关，室内部分正面底部设置有门关指示灯、反锁开关以及内执手。本发明功能多样，可以使用手机NFC配对方式开门、手机二维码扫描方式开门、机械钥匙系统开门，具有操作简单、智能性高、安全性高等优点。

24.

发明公开
一种病理嗓音的识别方法无效

公开(公告)号：CN103778913A

公开(公告)日：2014-05-07

申请号：CN201410027836.0

申请日：2014-01-22

Applicant: 苏州大学

Inventor： 张晓俊 , 曹毅 , 陶智 , 黄程韦 , 吴迪 , 肖仲喆

IPC: G10L15/02 , G10L15/10

Abstract: 本发明公开了一种病理嗓音的识别方法，包括特征参数输入模块、特征优化模块、病理嗓音识别模块、匹配判断模块和内容呈现模块，所述特征参数输入模块和特征优化模块对病理嗓音特征库进行采样和优化淘选，所述病理嗓音识别模块根据特征参数计算匹配度Match，所述匹配判断模块用以统计识别结果，所述内容呈现模块用以输出。本发明通过EM算法，消掉隐变量，通过特征优化组合参数，经过分类器，再运用基于期望值最大化的高斯混合模型（GMM-EM）对优化后的嗓音特征进行有效识别，明显提高正确识别率。

25.

发明公开
一种语音识别中的特征参数提取方法失效转让

公开(公告)号：CN102646415A

公开(公告)日：2012-08-22

申请号：CN201210102804.3

申请日：2012-04-10

Applicant: 苏州大学

Inventor： 张晓俊 , 陶智 , 肖仲喆 , 吴迪 , 季晶晶

IPC: G10L15/02 , G10L19/02

Abstract: 本发明公开了一种语音识别中的特征参数提取方法，将数字语音样本采用低通滤波器和高通滤波器进行分割,低通滤波器滤波后的信号采用基于人耳听觉特性的巴克滤波器组方法提取巴克频率倒谱参数，并进行规整化处理；高通滤波器滤波后的信号采用非线性动力学的最大李雅普诺夫参数来描述；所述一种语音识别中的特征参数提取方法包括巴克频率倒谱系数参数的提取和最大李雅普诺夫参数的提取两个步骤。本发明采用低通滤波器和高通滤波器进行分割，使处理之后的信号更加符合人类的听觉特性，从而能够提取出性能更优秀的语音特征参数。

26.

发明授权
一种语音播报药盒识别装置及药盒识别方法有权

公开(公告)号：CN116168376B

公开(公告)日：2023-07-18

申请号：CN202310411759.8

申请日：2023-04-18

Applicant: 苏州大学

Inventor： 张晓俊 , 周嘉成 , 姜余杰 , 邱志昕 , 黄嘉敏 , 陶智

IPC: G06V20/60 , G06V10/20 , G06V20/62 , A61J7/04

Abstract: 本发明涉及一种语音播报药盒识别装置及药盒识别方法，包括基座；滑动组件，其包括丝杆、滑台和移动平台，丝杆转动设置于基座上，丝杆的一端连接驱动源，滑台与丝杆螺纹连接，移动平台设置于滑台上；控制组件，其包括控制器、摄像头和扬声器，控制器设置于基座上，控制器分别连接驱动源、摄像头和扬声器，且摄像头正对移动平台设置；还包括对药盒图像进行处理的获取模块、判断模块和识别模块；本发明的药盒识别方法配合语音播报药盒识别装置，能够精确地找到并识别药盒上的药品信息，通过语音播报药品名称及服药的注意事项，可以辅助盲人等有视力缺陷的群体服药；语音播报药盒识别装置的结构简单，操作方便，容错率高，适于实用。

27.

发明公开
一种低分辨率模糊图像增强方法审中-实审

公开(公告)号：CN114782285A

公开(公告)日：2022-07-22

申请号：CN202210688985.6

申请日：2022-06-17

Applicant: 苏州大学

Inventor： 吴迪 , 陶昕辰 , 高恬曼 , 朱涛 , 黄玉玲 , 张晓俊 , 陶智

IPC: G06T5/00 , G06N3/04 , G06N3/08

Abstract: 本发明提供一种低分辨率模糊图像增强方法，先利用卷积层提取低分辨率模糊图像特征，接着经过若干残差块组成的残差网络提取残差特征，使用两个转置卷积进行上采样后再次送入卷积层提取特征，在卷积层后连接用密集残差块组成的密集残差网络，用于丰富和恢复图像的细节信息，最终输出得到高分辨率的清晰图像，通过在损失函数中添加感知损失，增强了图像的真实性，具有较好的图像增强复原效果，对于后续可能的目标检测任务来说，本文算法可以极大地提升检测准确率与效率，具有广阔的应用前景。

28.

发明公开
基于电压积分翻转电容法的微位移测量装置及方法审中-实审

公开(公告)号：CN114111550A

公开(公告)日：2022-03-01

申请号：CN202111026059.4

申请日：2021-09-02

Applicant: 苏州大学

Inventor： 吴迪 , 王靖 , 陶智 , 张晓俊 , 郑分刚

IPC: G01B7/02

Abstract: 本发明公开了一种基于电压积分翻转电容法的微位移测量装置，包括位移测量系统、运算放大电路模块、滤波电路模块、微控制单元、显示器和外接电源；所述位移测量系统包括两块平行板，通过两块平行板间的微小移动得到微位移数值；所述运算放大电路模块完成对微位移数值的测量，将电容变化值转化为频率变化值输出；所述微控制单元完成对滤波电路模块的输出信号的处理，测算出频率变化时相应的微小位移变化量并显示。通过上述方式，本发明可以测量微小位移的变化，由线性回归分析，与其他位移测量方法相比，线性度误差更小，数据更精确。

29.

发明公开
一种基于声门波信息的语音识别方法有权

公开(公告)号：CN112735386A

公开(公告)日：2021-04-30

申请号：CN202110063110.2

申请日：2021-01-18

Applicant: 苏州大学

Inventor： 陶智 , 伍远博 , 孙宝印 , 张晓俊 , 周长伟 , 范子琦

IPC: G10L15/02 , G10L15/08

Abstract: 本发明公开了一种基于声门波信息的语音识别方法，包括源信号预处理、特征提取和分类识别三个步骤，源信号预处理提取原始语音信号的声门波信号作为特征提取的源信号；特征提取采用动态图像专家组标准MPEG‑7提取音频高阶统计量特征与openSMILE特征和经典声门特征相结合作为声门波信号识别的特征集；分类识别基于随机森林分类器采用十倍交叉验证方法进行语音识别的预测分类。本发明以声门波作为源信号，充分表征声门激励与声带振动机理在语音识别中的作用，并且提出了动态图像专家组标准MPEG‑7提取音频高阶统计量特征与openSMILE特征和经典声门特征相结合作为识别特征集，解决了帧间重复与过拟合的问题同时不依赖于基音频率估计结果。

30.

发明公开
一种动态多频带非线性语音特征提取方法无效

公开(公告)号：CN112562642A

公开(公告)日：2021-03-26

申请号：CN202011198847.7

申请日：2020-10-31

Applicant: 苏州大学

Inventor： 张晓俊 , 伍远博 , 周长伟 , 朱欣程 , 陶智 , 赵鹤鸣

IPC: G10L15/02

Abstract: 本发明公开了一种动态多频带非线性语音特征提取方法，将语音样本采用基于人耳听觉特性的巴克滤波器组进行滤波分频。分频后的24个频带信号通过计算过零率的方式，自适应获得分频因子a。随后在第0至a个频带中，将语音计算频谱、对数运算后采用离散余弦变换方案来提取巴克频率倒谱系数特征；在第a+1至24的频带中，将信号嵌入相空间后提取最大李雅普诺夫指数和关联维特征，随后进行特征统一化处理。本发明采用自适应分频因子，采用分频带处理的方式，使处理之后的信号更加符合人类的听觉特性和实际情况，从而能够提取出性能更优秀的语音特征参数。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification