-
公开(公告)号:CN112185404B
公开(公告)日:2023-09-19
申请号:CN201910601964.4
申请日:2019-07-05
Applicant: 南京工程学院
IPC: G10L21/0216 , G10L21/0264 , G10L25/51
Abstract: 本发明公开了一种基于子带信噪比估计的低复杂度双端检测方法,包括以下步骤。首先将一帧信号通过分解滤波器得到子带信号,并进行降采样处理;其次在每个子带信号的每帧内找最大值,再将其转到对数域,得到阶梯包络;然后分别估计语音包络和噪声包络,得到当前帧的信噪比估计值;最后将子带信噪比映射为双端判决阈值,将自适应判决阈值应用到相关性判决因子上。使系统进入双讲状态时,及时冻结自适应滤波器的更新步长。本发明在复杂的噪声环境下,能有效提高回声抵消器的双端检测的准确率,在音频会议系统中具有良好的应用前景。
-
公开(公告)号:CN114283830A
公开(公告)日:2022-04-05
申请号:CN202111554165.X
申请日:2021-12-17
Applicant: 南京工程学院
IPC: G10L21/0208 , G10L21/0216 , G10L25/27 , G10L25/45 , H04M9/08 , G06N20/00
Abstract: 本发明公开了基于深度学习网络的麦克风信号回声消除模型构建方法。本发明采用归一化最小均方算法消除由多路径和房间声学冲激响应引入的线性回声,然后利用残余回声信号和近端麦克风信号计算IRM作为训练目标,并将经过归一化最小均方算法处理的近端麦克风信号和远端参考信号作为输入,构建具有实时编码器‑解码器结构的CRN模型;最后,将预估残余信号从近端麦克风信号中减去重构语音,本发明联合归一化最小均方算法与基于CRN模型的深度学习网络实时回声消除算法,可以提高麦克风回声消除的性能,具有良好的应用前景。
-
公开(公告)号:CN111968677B
公开(公告)日:2021-09-07
申请号:CN202010854269.1
申请日:2020-08-21
Applicant: 南京工程学院
Abstract: 本发明公开了一种面向免验配助听器的语音质量自评估方法,包括:构建并训练语音质量自评估网络:待测语音通过卷积神经网络提取并输出待测语音的帧级特征;待测语音的帧级特征通过循环神经网络得到并输出待测语音的段级特征;待测语音的段级特征输入至线性映射模型和Softmax分类器,对分类器的输出进行判决确定语音的失真类型,并结合线性映射模型的输出得到客观评分。本发明公开了一种面向免验配助听器的语音质量自评估方法,将卷积神经网络、循环神经网络和Softmax分类器有机地结合成一个整体,结合卷积神经网络的特征挖掘能力和循环神经网络的时序建模能力,提高无参考语音质量客观评价方法准确度,大大简化了处理过程。
-
公开(公告)号:CN110085249B
公开(公告)日:2021-03-16
申请号:CN201910385797.4
申请日:2019-05-09
Applicant: 南京工程学院
IPC: G10L21/0232 , G10L21/0264 , G10L25/18 , G10L25/24 , G10L25/30
Abstract: 本发明公开了一种基于注意力门控的循环神经网络的单通道语音增强方法,包括对带噪的单通道语音进行分帧加窗,提取38维信号特征;构建用于单通道语音增强的深度循环神经网络;利用纯净语音库和噪声库构建训练数据集;训练构建的深度循环神经网络;将提取的带噪语音特征输入训练好的深度循环神经网络,输出带噪语音的频带增益估计值,并进行平滑、内插得到内插增益;将内插增益作用于带噪的单通道语音,得到增强后的语音频谱。本发明能够有效抑制包括非平稳噪声在内的噪声,同时保持足够低的计算复杂度,从而能够用于实时的单通道语音增强,方法巧妙,构思新颖,具有良好的应用前景。
-
公开(公告)号:CN110111803B
公开(公告)日:2021-02-19
申请号:CN201910385769.2
申请日:2019-05-09
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于自注意多核最大均值差异的迁移学习语音增强方法,包括从原始语音中提取GFCC特征,并作为深度神经网络的输入特征;利用带噪语音与干净语音信息计算傅里叶变换域的理想浮值掩蔽,并作为深度神经网络的训练目标;构建基于深层神经网络的语音增强模型;构建自注意多核最大均值差异的迁移学习语音增强模型;训练自注意多核最大均值差异的迁移学习语音增强模型;输入目标域带噪语音的帧级特征,重建增强语音波形。本发明在多核最大均值差异前端添加自注意力算法,通过最小化源域注意到的特征和目标域注意到的特征之间的多核最大均值差异,实现对无标签的目标域的迁移学习,提高语音增强性能,具有良好的应用前景。
-
公开(公告)号:CN110739005A
公开(公告)日:2020-01-31
申请号:CN201911035076.7
申请日:2019-10-28
Applicant: 南京工程学院
IPC: G10L21/0232 , G10L21/0264 , G10L21/0332 , G10L25/03
Abstract: 本发明公开了一种面向瞬态噪声抑制的实时语音增强方法,包括步骤:采用分位噪声估计法来获得稳态噪声谱;利用基于信号重心的方法检测瞬态噪声,并根据是否存在瞬态噪声来修正稳态噪声谱;结合语音特征和谐波分析来估计语音存在概率;在语音概率估计的基础上,计算信号增益并作用于含噪语音,从而实现语音增强。本发明提出的方法,能够对瞬态噪声进行有效抑制,在综合语音增强性能和实时性指标方面,明显优于其它经典的语音增强方法。
-
公开(公告)号:CN109151692A
公开(公告)日:2019-01-04
申请号:CN201810767514.8
申请日:2018-07-13
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于深度学习网络的助听器自验配方法,通过构建患者综合信息库,通过对患者和验配过程的深入分析,发现验配过程中有效的策略,从而构建新的智能助听器自验配模型,提高验配效率;引入深度学习网络,通过大量的数据训练,使网络具有人工智能,能根据患者的基本信息快速生成符合患者听损特性的语音信息,同时还能根据患者的评价反馈,自动调节输入增益,大大缩短验配时间,改善用户满意度。
-
公开(公告)号:CN108520753A
公开(公告)日:2018-09-11
申请号:CN201810159072.9
申请日:2018-02-26
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于卷积双向长短时记忆网络的语音测谎方法,包括将整段语音进行统一归一化处理;根据数据库标签对统一归一化处理的语音进行切分;对切分的语音加窗分帧处理;建立变长数据的计算方式;将卷积操作引入长短时记忆网络中;构建完整的语音测谎网络模型;训练语音测谎网络模型,并加窗分帧处理后的语音进行测谎评测。本发明通过将卷积操作引入长短时记忆网络中,构建完整的语音测谎网络模型,实现深度学习,从原始语音数据中提取适用于谎言检测的特征,以提高谎言检测的性能,具有良好的应用前景。
-
公开(公告)号:CN104053112B
公开(公告)日:2017-09-12
申请号:CN201410292892.7
申请日:2014-06-26
Applicant: 南京工程学院
IPC: H04R29/00
Abstract: 本发明公开了一种助听器自验配方法,该方法首先建立知识库,找出与当前患者最相似的历史患者,获得该历史患者的最优化助听器算法参数,然后当前患者对声音质量进行满意度评估,根据评价指标迭代更新助听器算法参数,并与知识库进行交互,然后根据更新的助听器算法参数生成测试声音给当前患者,直到当前患者满意为止。本发明引入知识库,极大地缩小了助听器算法参数匹配范围,显著提高了助听器验配效率;根据评价指标迭代更新助听器算法参数,最大限度的满足当前患者对助听器的期望值,提高了助听器算法参数的精确性。
-
公开(公告)号:CN106901758A
公开(公告)日:2017-06-30
申请号:CN201710099098.4
申请日:2017-02-23
Applicant: 南京工程学院
IPC: A61B5/16
Abstract: 本发明公开了一种基于卷积神经网络的言语置信度评测方法。该方法首先对采集的语音样本进行分帧,并提取每帧的梅尔倒谱系数,构成单通道梅尔倒谱系数图像;然后构建六层卷积神经网络,构建前三层为使用尺寸不同的卷积滤波器的卷积层,第四层为生成全局特征图的聚合层,第五层和第六层为由2048个线性修正单元的全连层;最后将梅尔倒谱系数图像输入构建的卷积神经网络进行言语置信度评测。实验结果显示,该置信度评测方法对谎言的识别率达到73%。
-
-
-
-
-
-
-
-
-