딥 빌리프 네트워크를 이용한 음성기반 호불호 검출방법 및 장치, 그를 기록한 기록매체
    1.
    发明授权
    딥 빌리프 네트워크를 이용한 음성기반 호불호 검출방법 및 장치, 그를 기록한 기록매체 有权
    利用深度比较网络的语音信号的基于检测方法和装置的特征数据,记录方法的中继记录方案

    公开(公告)号:KR101561651B1

    公开(公告)日:2015-11-02

    申请号:KR1020140062477

    申请日:2014-05-23

    Abstract: 본발명에따르는딥 빌리프네트워크(Deep Belief Network; 이하 DBN라칭함)를이용한음성기반호불호검출방법은, 음성신호들과그에대응되는호불호식별정보들로구성되는학습데이터를제공받아, 음성신호들에대한특징정보를추출하고, 그특징정보를 DBN을통해학습하여 DBN 데이터를생성하고, 그 DBN 데이터에호불호식별정보로구성되는레이블레이어를추가하여 DBN 데이터의생성을완료하는단계; 및상기테스트음성신호가입력되면, 그테스트음성신호에서특징정보를추출하고, 그특징정보에대응되는 DBN 데이터를검출하고, 그검출된 DBN 데이터의레이블레이어에기록된호불호식별정보에따라호불호검출결과를출력하는단계;를구비함을특징으로한다.

    Abstract translation: 本发明涉及一种通过使用深信念网络(以下称为DBN)来检测基于语音的偏好的方法,该方法包括以下步骤:接收由语音信号组成的学习数据和与其对应的偏好识别信息,以提取特征 关于语音信号的信息,通过DBN学习特征信息以生成DBN数据,以及将由偏好识别信息组成的标签层添加到DBN数据以完成DBN数据的生成; 并且当输入测试语音信号时从测试语音信号中提取特征信息以检测对应于特征信息的DBN数据,并根据记录在检测到的DBN数据的标签层上的偏好识别信息输出检测到的偏好的结果。

    DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식장치 및 방법
    2.
    发明授权
    DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식장치 및 방법 有权
    使用DCICA执行基于DNN的特征增强的语音识别设备和方法

    公开(公告)号:KR101720514B1

    公开(公告)日:2017-04-11

    申请号:KR1020160023335

    申请日:2016-02-26

    Abstract: 본발명에따르는 DCICA를이용한 DNN 기반특징향상을수행하는음성인식장치는, 다수의마이크로부터입력되는마이크입력신호들을각각입력받아 STFT(Short-Time Fourier Transform) 처리하는다수의 STFT; 상기다수의 STFT 처리부가출력하는 STFT 처리된마이크입력신호들을입력받아 DCICA 처리를이행하며, 타겟추정신호와잡음추정신호를생성하는 DCICA(Direction of arrival(DOA) Constrained Independent Component Analysis(ICA))부; 상기 STFT 처리된마이크입력신호들중 어느하나인제1마이크입력신호와, 상기 DCICA부가출력하는타겟추정신호와잡음추정신호를입력받아 LMPSC(logarithmic mel-frequency power spectral coefficient) 처리하여스펙트럴형태로변환하여출력하는다수의 LMPSC 처리부; 상기 LMPSC 처리부가출력하는스펙트럴형태로변환되어출력되는제1마이크입력신호와타겟추정신호와잡음추정신호를입력받아특징강화된최종타겟추정신호를생성하는 DNN 기반 FE(DNN-Based Feature Enhancement) 처리부; 및상기최종타겟추정신호를제공받아음성인식을수행하는 ASR(Automatic Speech Recognition) 처리부;로구성됨을특징으로한다. 또한상기방법은, 상기 DCICA부가출력하는잡음추정신호의스케일을가변하는스케일링부; 상기스케일링부가출력하는스케일링된잡음추정신호를입력받아 LMPSC 처리하여스펙트럴형태로변환하여출력하는 LMPSC; 및상기 LMPSC가출력하는스펙트럴형태로변환된스케일링된잡음추정신호와상기 DCICA가출력하는타겟추정신호를입력받아 HMM(hidden markov model) 기반 FE 처리하여특징강화된타켓추정신호를생성하여상기 DNN 기반 FE 처리부로제공하는 HMM 기반 FE 처리부;를더 구비하며, 상기 DNN 기반 FE 처리부는상기제1마이크입력신호와상기특징강화된타켓추정신호와상기잡음추정신호를입력받아특징강화된최종타겟신호를생성하며, 상기 DNN 기반 FE 처리부로입력되는상기제1마이크입력신호와상기특징강화된타켓추정신호와상기잡음추정신호는스펙트럴형태임을특징으로한다.

    Abstract translation: 用于使用DCICA根据本发明,多个STFT来接收和处理来自多个微STFT的麦克风输入信号的输入的每个类型(短时傅立叶变换)执行基于DNN特征增强语音识别装置; 和实施DCICA过程接收STFT经处理的麦克风输入信号向所述多个STFT处理单元输出,该目标估计信号和DCICA的(到达方向(DOA)约束独立成分分析(ICA)),用于产生噪声估计信号部分 。 该STFT并将处理后的麦克风输入信号中的任何一个摄取一个麦克风输入信号,接收目标估计信号和所述噪声估计信号到DCICA相加后的输出通过处理(对数梅尔频率功率频谱系数)LMPSC转换为频谱形状 输出LMPSC的多个LMPSC处理单元; 第一麦克风输入信号和目标估计信号和基于DNN FE(基于DNN特征增强)接收所述噪声估计信号,以产生增强的特征是输出的最终目标估计信号被转换成LMPSC处理单元输出的频谱形状 处理器; 以及ASR(自动语音识别)处理器,用于通过接收最终目标估计信号来执行语音识别。 该方法还可以包括:缩放单元,用于改变DCICA输出的噪声估计信号的比例; LMPSC通过治疗LMPSC频谱形状转换接收缩放的噪声估计信号输出到缩放的输出部; 和LMPSC失控力方面缩放的转换成桶形式噪声估计信号和所述通过接收信号HMM(隐马尔可夫模型)估计DCICA失控力目标和对基础FE过程产生增强的目标估计信号采用了DNN到 用于接收第一麦克风输入信号,特征增强的目标估计信号和噪声估计信号以提供最终增强的目标信号, 并且输入到基于DNN的FE处理器的第一麦克风输入信号,特征增强的目标估计信号和噪声估计信号处于频谱形式。

Patent Agency Ranking