一种支持语音实时分解/合成的伽马通滤波器组芯片系统

    公开(公告)号:CN106486110B

    公开(公告)日:2019-11-08

    申请号:CN201610921435.9

    申请日:2016-10-21

    Applicant: 清华大学

    Abstract: 本发明提出一种支持语音实时分解/合成的伽马通滤波器组芯片系统,属于数字电路设计领域。该系统由输入模块、参数模块、控制模块、计算模块和输出模块五部分组成;输入模块接收一帧语音数据后激活控制模块,同时根据不同子带上人耳基底膜的延时调整各通道延时后将语音数据提供给计算模块;控制模块控制参数模块读取对应通道的参数,并传输给计算模块;计算模块完成本通道的伽马通滤波算法,将结果存入输出模块;计算模块完成该帧音数据所有通道计算后,输出模块将存储数据供外部进行读取。本发明系统减少了计算各通道的消耗时钟数,节省功耗;实现了参数可配置功能,可根据需要灵活调整系统参数,实现语音的分解和合成操作。

    一种基于听觉感知特性的数字语音实时分解/合成方法

    公开(公告)号:CN106601249A

    公开(公告)日:2017-04-26

    申请号:CN201611026399.6

    申请日:2016-11-18

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于听觉感知特性的数字语音实时分解/合成方法,涉及语音信号处理领域。本方法包括用N级级联的二阶带通滤波器构成一个N阶的伽马通滤波器再构建任意阶的伽马通数字滤波器模型及其参数,语音分解阶段用M路伽马通滤波器采用浮点算法或定点算法将输入语音分解为M路信号;语音合成阶段在伽马通滤波器组中引入延时,以更加符合人耳特性,人耳基底膜延时与频率成反比关,最后进行语音合成操作。本发明参考了人耳的等响度曲线特性,改进了语音分解合成方法,使得最终语音合成效果接近了理想带通滤波器的效果。本发明可应用在手机、人工耳蜗、助听器等语音设备中。

    用于语言学习机的发音质量评价方法

    公开(公告)号:CN100411011C

    公开(公告)日:2008-08-13

    申请号:CN200510114848.8

    申请日:2005-11-18

    Applicant: 清华大学

    Abstract: 本发明涉及用于语言学习机的发音质量评价方法,属于计算机辅助语言学习和语音技术领域,包括用于训练的语音特征提取,标准发音模型训练,标准发音网络的生成,语音端点检测,用于评价的语音特征提取,最优路径搜索,以及发音质量分数的计算各部分;本发明的发音质量评价方法具有与主观评价相关性较高、稳健性好等特点。构成的嵌入式英语学习系统可以用于人机交互教学和自动口语测试。

    一种支持语音实时分解/合成的伽马通滤波器组芯片系统

    公开(公告)号:CN106486110A

    公开(公告)日:2017-03-08

    申请号:CN201610921435.9

    申请日:2016-10-21

    Applicant: 清华大学

    Abstract: 本发明提出一种支持语音实时分解/合成的伽马通滤波器组芯片系统,属于数字电路设计领域。该系统由输入模块、参数模块、控制模块、计算模块和输出模块五部分组成;输入模块接收一帧语音数据后激活控制模块,同时根据不同子带上人耳基底膜的延时调整各通道延时后将语音数据提供给计算模块;控制模块控制参数模块读取对应通道的参数,并传输给计算模块;计算模块完成本通道的伽马通滤波算法,将结果存入输出模块;计算模块完成该帧音数据所有通道计算后,输出模块将存储数据供外部进行读取。本发明系统减少了计算各通道的消耗时钟数,节省功耗;实现了参数可配置功能,可根据需要灵活调整系统参数,实现语音的分解和合成操作。

    一种全频域数字助听方法和设备

    公开(公告)号:CN101593522A

    公开(公告)日:2009-12-02

    申请号:CN200910088578.6

    申请日:2009-07-08

    Applicant: 清华大学

    Abstract: 本发明实施例提供了一种全频域数字助听方法,方法包括:获取前后双麦克风的输入语音信号,并进行分帧和傅里叶变换,以及进行语音场景类别的识别;当为带噪语音时,对分帧语音频域信号进行噪声检测并进行双麦克风波束形成处理、风噪声处理以及其它噪声抑制,然后进行频域动态范围压缩,以及声学反馈抑制;最后,进行反傅里叶变换和重叠相加得到输出语音信号。本发明实施例还提供了一种全频域数字助听设备。通过本发明实施例提供的方案,解决了目前数字助听器侧重于单纯解决听力障碍某一方面,而没有综合考虑影响使用效果各方面因素的问题,同时本发明实施例提供了全频域的数字助听方案,具有处理速度快,占用资源少,能耗低等优点。

    一种协处理器
    7.
    发明授权

    公开(公告)号:CN100489765C

    公开(公告)日:2009-05-20

    申请号:CN200710118430.3

    申请日:2007-07-05

    Applicant: 清华大学

    Abstract: 本发明公开了一种协处理器,属于集成电路设计领域。所述协处理器包括:存储模块、地址产生模块、寄存器组模块、控制电路模块和计算模块。本发明提供的协处理器可以进行基于HMM语音识别算法的马氏距离计算和乘累加运算,能够提高嵌入式语音识别系统的性能,同时可完成通用DSP中的矢量乘累加运算,扩展了其通用性,具有提高性能,降低成本,降低功耗的优点。

    基于语音识别的信息校核方法

    公开(公告)号:CN1293428A

    公开(公告)日:2001-05-02

    申请号:CN00130298.1

    申请日:2000-11-10

    Applicant: 清华大学

    Abstract: 本发明属于语音技术领域,包括:非特定人语音识别模型的预先训练、语音信号的端点检测、语音识别参数提取、基于多子树三元词对文法的帧同步束搜索Viterbi语音识别方法、语音识别置信测度与拒识模型、非特定人语音识别模型的说话人自适应学习、语音提示。本发明的基于语音识别的信息校核方法具有识别率高、稳健性好等特点。构成的语音识别系统可以用于信息查询、语音命令识别、学习机,以及生产环节的控制系统中。

    一种基于二阶微分麦克风阵列的语音增强算法

    公开(公告)号:CN110310650A

    公开(公告)日:2019-10-08

    申请号:CN201910275383.6

    申请日:2019-04-08

    Applicant: 清华大学

    Abstract: 本发明提出一种基于二阶微分麦克风阵列的语音增强算法,属于语音信号处理领域。该方法首先搭建麦克风阵列并采集说话人语音的3路语音信号,使用二阶微分算法提取目标语音波束形成信号和噪声波束形成信号并分帧分频带,任意选取一路语音信号分帧分频带,计算每个时频单元的掩蔽值并进行平滑处理,得到每个时频单元增强后的语音的时频单元值;最后通过逆傅里叶变换,加窗并重叠相加得到说话人语音对应的增强信号。该方法结合波束形成算法与计算听觉场景分析算法,将波束形成结果仅作为目标语音和噪声能量的估计,并对计算听觉场景分析中掩蔽值产生过程进行了优化,使得掩蔽值更加平滑适宜于实际应用场景,使得最终语音合成后增强效果明显。

    一种全频域数字助听方法和设备

    公开(公告)号:CN101593522B

    公开(公告)日:2011-09-14

    申请号:CN200910088578.6

    申请日:2009-07-08

    Applicant: 清华大学

    Abstract: 本发明实施例提供了一种全频域数字助听方法,方法包括:获取前后双麦克风的输入语音信号,并进行分帧和傅里叶变换,以及进行语音场景类别的识别;当为带噪语音时,对分帧语音频域信号进行噪声检测并进行双麦克风波束形成处理、风噪声处理以及其它噪声抑制,然后进行频域动态范围压缩,以及声学反馈抑制;最后,进行反傅里叶变换和重叠相加得到输出语音信号。本发明实施例还提供了一种全频域数字助听设备。通过本发明实施例提供的方案,解决了目前数字助听器侧重于单纯解决听力障碍某一方面,而没有综合考虑影响使用效果各方面因素的问题,同时本发明实施例提供了全频域的数字助听方案,具有处理速度快,占用资源少,能耗低等优点。

Patent Agency Ranking