하모닉 주파수 의존성을 이용한 독립벡터분석에 기반한 강한 음성 인식 방법 및 이를 이용한 음성 인식 시스템
    1.
    发明授权
    하모닉 주파수 의존성을 이용한 독립벡터분석에 기반한 강한 음성 인식 방법 및 이를 이용한 음성 인식 시스템 有权
    基于独立向量分析的鲁棒语音识别方法采用谐波频率依赖性和系统使用方法

    公开(公告)号:KR101361034B1

    公开(公告)日:2014-02-11

    申请号:KR1020120048380

    申请日:2012-05-08

    Abstract: 본 발명에 따른 강한 음성 인식 시스템은 전처리(pre-processing) 과정인 MPDR 빔포머를 사용하여 음원을 향상시킨 후, 향상된 음원 신호들과 노이즈 신호들의 합성신호에 대하여 HIVA 학습 알고리즘을 적용하여 음원 신호에 대한 특징 벡터를 추출하는 것을 특징으로 한다. 상기 음성 인식 시스템은 신호 왜곡을 최소화시키고 언믹싱 매트릭스에 대한 컨버전스를 향상시키기 위하여, HIVA 학습 알고리즘을 수행함에 있어서, non-holonomic constraint와 최소 왜곡 원칙(Minimal Distortion Priciple; 이하 'MDP'라 한다)을 적용하는 것을 특징으로 한다. 또한, 상기 음성 인식 시스템은 향상된 음원과 노이즈 음원을 이용하여 학습 과정에서 손실된 특징들(Missing Features)을 파악하고 이를 보상하는 것을 특징으로 한다. 전술한 특징들에 의하여, 본 발명에 따른 강한 음성 인식 시스템은 하모닉 주파수 의존성을 이용한 독립 벡터 분석 알고리즘을 기반으로 하여 노이즈 등에 강한 시스템을 제공하게 된다.

    관심음원 제거방법 및 그에 따른 음성인식방법
    2.
    发明公开
    관심음원 제거방법 및 그에 따른 음성인식방법 有权
    有意义的音频源取消方法和语音识别方法

    公开(公告)号:KR1020130068869A

    公开(公告)日:2013-06-26

    申请号:KR1020110136285

    申请日:2011-12-16

    Inventor: 박형민 오명우

    Abstract: PURPOSE: A method for removing an interested sound source and a method for recognizing a voice are provided to estimate a mixed noise signal effectively, by removing the interested sound source from a mixed signal provided through two microphones installed in an acoustic signal mixed environment. CONSTITUTION: A voice recognition device initializes a vector(12). The device learns the vector to remove an interested sound source from a mixed signal(10). The device is initialized, and generates a mixed noise signal by removing an interested sound source signal from an input mixed signal(14). When the mixed noise signal is generated, the device generates a mask, by comparing the mixed noise signal with the input mixed signal in a time-frequency domain(16). [Reference numerals] (10) Learn a separation vector(w(K)) for separation of a target sound source; (12) Initialize the separation vector(w(K)); (14) Remove a target sound source; (16) Generate a mask using a mixed noise sound source and an input sound source

    Abstract translation: 目的:提供一种消除感兴趣的声源的方法和用于识别语音的方法,通过从通过安装在声信号混合环境中的两个麦克风提供的混合信号中去除感兴趣的声源来有效地估计混合噪声信号。 构成:语音识别装置初始化矢量(12)。 该装置学习矢量以从混合信号中去除感兴趣的声源(10)。 该装置被初始化,并且通过从输入混合信号(14)中去除感兴趣的声源信号来产生混合噪声信号。 当产生混合噪声信号时,器件通过将混合噪声信号与时频域(16)中的输入混合信号进行比较来产生掩模。 (附图标记)(10)学习用于分离目标声源的分离矢量(w(K)); (12)初始化分离向量(w(K)); (14)移除目标声源; (16)使用混合噪声声源和输入声源产生掩模

    관심음원 제거방법 및 그에 따른 음성인식방법
    4.
    发明授权
    관심음원 제거방법 및 그에 따른 음성인식방법 有权
    感兴趣的音源消除方法及其语音识别方法

    公开(公告)号:KR101305373B1

    公开(公告)日:2013-09-06

    申请号:KR1020110136285

    申请日:2011-12-16

    Inventor: 박형민 오명우

    Abstract: 본 발명에 따르는 관심음원 제거방법은, 두 개의 마이크 각각으로부터의 입력 혼합신호를 제공받아 단구간 푸리에 변환하여 시간-주파수 영역으로 변환하는 단계; 상기 시간-주파수 영역의 입력 혼합신호들로부터 관심음원을 제거하기 위한 관심음원제거 벡터를 설정하는 단계; 상기 관심음원제거 벡터를 이용하여 입력 혼합신호에서 관심음원을 제거하여 혼합된 잡음신호를 생성하는 단계;를 구비함을 특징으로 한다.

    Abstract translation: 提供了一种感兴趣的音频源消除方法,使用感兴趣的音频源消除方法的语音识别方法,用于实现该方法的计算机可读记录介质记录程序,以及通过使用感兴趣的音频源消除方法来执行语音识别的语音识别装置 。 感兴趣的音频源消除方法包括以下步骤:从两个麦克风接收输入混合信号,并通过短期傅里叶变换将信号转换成时频域; 设置感兴趣的音频源消除矢量,用于从时频域中的输入混合信号中消除感兴趣的音频源信号; 以及通过使用感兴趣的音频源消除矢量从输入的混合信号中消除感兴趣的音频源信号来产生混合噪声信号。

    하모닉 주파수 의존성을 이용한 독립벡터분석에 기반한 강한 음성 인식 방법 및 이를 이용한 음성 인식 시스템
    5.
    发明公开
    하모닉 주파수 의존성을 이용한 독립벡터분석에 기반한 강한 음성 인식 방법 및 이를 이용한 음성 인식 시스템 有权
    基于使用谐波频率依赖的独立矢量分析的鲁棒语音识别方法和使用该方法的系统

    公开(公告)号:KR1020130125014A

    公开(公告)日:2013-11-18

    申请号:KR1020120048380

    申请日:2012-05-08

    CPC classification number: G10L15/20 G10L15/02 G10L19/0017 G10L19/26 G10L21/02

    Abstract: A robust speech recognition system according to the present invention improves a sound source by using an MPDR beamformer in a pre-processing process, applies an HIVA learning algorithm to the composed signals of the improved sound source signals and noise signals, and extracts a feature vector of the sound source signals. The speech recognition system applies a non-holonomic constraint and a minimal distortion principle when performing the HIVA learning algorithm to minimize signal distortion and improve convergence of a non-mixing matrix. In addition, the speech recognition system checks for missing features in the learning process by using an improved sound source and a noise sound source and compensates for the same. By the aforementioned features, the robust speech recognition system provides a system resistant to noise on the basis of an independent vector analysis algorithm using harmonic frequency dependency. [Reference numerals] (200) Signal input unit;(210) Signal converting unit;(220) Pre-processing unit;(230) Sound source extracting unit;(246) Mask generating unit;(248) Loss property compensation output unit;(250) DCT converting unit;(260) Voice recognition unit;(AA,BB) Log unit

    Abstract translation: 根据本发明的鲁棒语音识别系统通过在预处理过程中使用MPDR波束形成器改进声源,对改进的声源信号和噪声信号的合成信号应用HIVA学习算法,并提取特征向量 的声源信号。 当执行HIVA学习算法时,语音识别系统应用非完整约束和最小失真原理,以最小化信号失真并改善非混合矩阵的收敛。 此外,语音识别系统通过使用改进的声源和噪声声源来检查学习过程中的缺失特征并对其进行补偿。 通过上述特征,鲁棒的语音识别系统在使用谐波频率依赖性的独立矢量分析算法的基础上提供了抗噪声系统。 (200)信号输入单元(210)信号转换单元;(220)预处理单元;(230)声源提取单元;(246)掩码生成单元;(248)损失特性补偿输出单元; (250)DCT转换单元;(260)语音识别单元;(AA,BB)对数单元

    피드 포워드 네트워크를 이용하는 독립 벡터 분석에 따른 블라인드 소스 분리 방법 및 장치

    公开(公告)号:KR1020120133038A

    公开(公告)日:2012-12-10

    申请号:KR1020110051512

    申请日:2011-05-30

    Inventor: 박형민 오명우

    Abstract: PURPOSE: A method for separating a blind source according to independent vector analysis by using a feed forward network and a device thereof are provided to resolve a problem according to independency between frequencies without heuristic technology. CONSTITUTION: An ST(Short-Time) Fourier transformer(100) converts mixed signals of a TD(Time-Domain) into mixed signals of an FD(Frequency-Domain). An FF unmixing filter network(104) separates the mixed signals of the FD into source signals. An inverse ST Fourier transformer(105) converts the separated source signals into source signals of the TD. An MPDR beam-former(102) receives the mixed signals of the FD from the ST Fourier transformer. The MPDR beam-former generates predetermined mixed signals of the FD. The MPDR beam-former provides the generated mixed signals of the FD to the FF unmixing filter network. [Reference numerals] (100) ST Fourier transformer; (102) MPDR beamformer; (104) FF unmixing filter network; (105) Reverse ST Fourier transformer

    Abstract translation: 目的:提供一种根据独立向量分析通过使用前馈网络及其设备分离盲源的方法,以便根据频率之间的独立性解决问题,而无需启发式技术。 构成:ST(短时间)傅里叶变换器(100)将TD(时域)的混合信号转换为FD(频域)的混合信号。 FF解混合滤波器网络(104)将FD的混合信号分离成源信号。 逆ST傅立叶变换器(105)将分离的源信号转换成TD的源信号。 MPDR波束成形器(102)从ST傅立叶变换器接收FD的混合信号。 MPDR波束成形器产生FD的预定混合信号。 MPDR波束成形器将所产生的FD混合信号提供给FF解混合滤波器网络。 (参考数字)(100)ST傅立叶变换器; (102)MPDR波束形成器; (104)FF混合滤波网; (105)反向ST傅里叶变换器

Patent Agency Ranking