음향 채널 추정에 기반한 음원 위치 탐지 방법
    1.
    发明公开
    음향 채널 추정에 기반한 음원 위치 탐지 방법 有权
    基于声学通道估计的声源定位方法

    公开(公告)号:KR1020100107893A

    公开(公告)日:2010-10-06

    申请号:KR1020090026233

    申请日:2009-03-27

    Inventor: 박형민 조지원

    CPC classification number: H04R3/00 H04R2430/20 H04R2460/07 H04S7/30

    Abstract: PURPOSE: A method for detecting a sound source location based on an acoustic channel estimation is provided to improve the accuracy of a time delay difference between a convergence speed and a direct path sample by adding sparcity to a normalized multi-channel minimum mean square method. CONSTITUTION: An adaptive channel filter is initialized(S300). Signals are inputted through each sensor(S310). An error signal due to difference between passed signals is detected(S320). The adaptive channel filters between a sound source and each sensor are updated by using a multi channel minimum mean square method(S330). The adaptive channel filter is finally updated by applying an acoustic channel property to the adaptive channel filter(S340). The delay time and the sound source position are detected by using the detected error signal(S350).

    Abstract translation: 目的:提供一种基于声道估计的用于检测声源位置的方法,通过将标准化多通道最小均方法的稀疏度加到收敛速度和直接路径样本之间来提高精度。 构成:初始化自适应通道滤波器(S300)。 信号通过每个传感器输入(S310)。 检测到由于通过的信号之间的差异引起的误差信号(S320)。 通过使用多通道最小均方法来更新声源与每个传感器之间的自适应信道滤波(S330)。 通过对自适应信道滤波器应用声道特性来最终更新自适应信道滤波器(S340)。 通过使用检测到的误差信号来检测延迟时间和声源位置(S350)。

    독립 벡터 분석 및 모델 기반 특징 향상을 이용한 강인한 음성 인식 방법
    2.
    发明授权
    독립 벡터 분석 및 모델 기반 특징 향상을 이용한 강인한 음성 인식 방법 有权
    基于HMM的特征增强下的独立矢量分析用于强大的语音识别

    公开(公告)号:KR101647059B1

    公开(公告)日:2016-08-10

    申请号:KR1020150037384

    申请日:2015-03-18

    Inventor: 박형민 조지원

    CPC classification number: G10L21/0216 G10L15/142

    Abstract: 본발명은독립벡터분석및 모델기반특징향상방법을이용한강인한음성인식방법에관한것이다. 상기음성인식방법은, (a) 마이크로폰으로입력된신호들에대하여독립벡터분석(Independent Vector Analysys)하여 IVA 타겟음성신호와 IVA 노이즈신호를추정하는단계; (b) 상기추정된 IVA 타겟음성신호및 IVA 노이즈신호를각각입력신호및 노이즈신호로설정하여, 모델기반특징향상(Model-based Feature Enhancement;'MBFE') 방법을적용하여타겟음성신호를추정하는단계; 를구비하여음성인식의정확도를향상시킨다.

    Abstract translation: 本发明涉及使用独立矢量分析和基于模型的特征增强的强声音识别方法。 语音识别方法包括以下步骤:(a)通过分析通过麦克风输入的信号的独立向量来估计独立矢量分析(IVA)目标语音信号和IVA噪声信号; (b)分别设置估计的IVA目标语音信号和IVA噪声信号作为输入信号和噪声信号,并通过应用基于模型的特征增强的方法来估计目标语音信号,从而提高语音的准确性 承认。

    강인음성인식을 위한 손실특징 복원방법 및 장치
    3.
    发明授权
    강인음성인식을 위한 손실특징 복원방법 및 장치 有权
    基于特征向量的HMM的强大的语音识别丢失特征重构

    公开(公告)号:KR101647058B1

    公开(公告)日:2016-08-10

    申请号:KR1020150037383

    申请日:2015-03-18

    Inventor: 박형민 조지원

    CPC classification number: G10L21/02

    Abstract: 본발명에따르는강인음성인식을위한손실특징복원방법은, 스펙트럼벡터형태의관찰데이터가하나의프레임을형성하고, 다수의프레임이시간경과에따라순차적으로나열되어구성된관찰시퀀스를입력받아, 현재프레임에대한상태인덱스에대한정보를토대로신뢰성분은그대로출력하고비신뢰성분은최소화시켜출력하는단계; 및상기비신뢰성분은관찰데이터의비신뢰성분의값보다작고, 모든프레임에신뢰성분의값이주어지고, 현재프레임의상태인덱스가정해졌다면, 모든상태의사후확률을곱한후 더해서최종적인비신뢰성분의값을추정하는단계;를더 구비함을특징으로한다.

    Abstract translation: 根据本发明的用于恢复强烈语音识别的丢失特征的方法包括以下步骤:通过以频谱矢量形式的观测数据形成一帧,接收由多个帧排列的观察序列 随着时间流逝,有序的方式根据当前帧的状态索引的信息输出它们的置信分量,并通过最小化来输出不可信分量; 并且还包括以下步骤:如果所述非置信分量小于所述观测数据的不可信分量的值,则通过将每个状态的后验概率相乘之后相加来估计最终不可信分量的值, 给出每个帧的置信分量,并且确定当前帧的状态索引。 本发明旨在提供一种用于通过使用隐马尔可夫模型的语音的频率和时间依赖性来恢复强的语音识别的损失特征的方法和装置。

    독립 벡터 분석 및 반향 필터 재추정을 이용한 베이시안 특징 향상에 의한 강인한 음성 인식 장치 및 방법

    公开(公告)号:KR101802444B1

    公开(公告)日:2017-11-29

    申请号:KR1020160089966

    申请日:2016-07-15

    Inventor: 박형민 조지원

    Abstract: 본발명은독립벡터분석및 재추정된반향필터파라메터를이용한베이시안특징향상시킨음성인식장치및 방법에관한것이다. 상기음성인식방법은, (a) 외부로부터입력된복수개의음성신호들을단구간푸리에변환하여각각주파수영역의신호로변환하여출력하는단계; (b) 상기주파수영역의음성신호들을독립벡터분석하여 IVA 타겟음성신호와 IVA 노이즈신호를추정하는단계; (c) 상기독립벡터분석에의해추정된 IVA 타겟음성신호로부터 HMM-based BFE 하여음성특징을추출하는단계; (d) 상기 IVA 타겟음성신호를이용하여상기독립벡터분석에의해추정된 IVA 노이즈신호를스케일링한후 스케일링된 IVA 노이즈신호로부터노이즈특징을추출하는단계; (e) 상기음성특징및 반향필터파라메터의초기설정값을이용하여 HMM-based BFE 하여음성특징을강화시켜초기음원신호를추정하는단계; (f) 상기노이즈특징과상기추정된초기음원신호를이용하여반향필터파라메터를재추정하는단계; (g) 상기재추정된반향필터파라메터를이용하여상기음성특징을다시강화시켜음원신호를최종추정하는단계; 를구비한다.

    반향 환경에서의 음성특징 향상방법 및 장치
    5.
    发明授权
    반향 환경에서의 음성특징 향상방법 및 장치 有权
    语音特征增强方法和装置在混响环境中

    公开(公告)号:KR101506547B1

    公开(公告)日:2015-03-30

    申请号:KR1020130092139

    申请日:2013-08-02

    Inventor: 박형민 조지원

    Abstract: 본 발명에 따르는 반향 환경에서의 음성특징 향상방법은, 반향 환경에 대한 대략적인 모델링을 통해 RIR(Room Impulse Response)의 로그 평균 에너지 와 모델 에러 스테이스틱스 를 초기화하고, 초기화된 RIR의 로그 평균 에너지 와 모델 에러 스테이스틱스 를 토대로 향상된 LMPSCs 추정식을 결정하고, 그 향상된 LMPSCs 추정식에 따라 관찰신호 에 대한 향상된 LMPSCs 를 추정하고, 상기 향상된 LMPSCs 와 모델 에러 스테이스틱스 와 관찰신호 를 토대로 상기 RIR의 로그 평균 에너지 를 산출하여 갱신하고, 그 갱신된 RIR의 로그 평균 에너지 와 모델 에러 스테이스틱스 를 토대로 향상된 LMPSCs 추정식을 결정하여, 주파수 종속 반향을 고려하여 향상된 LMPSCs 추정방식을 결정하는 제1단계; 상기 주파수 종속 반향을 고려하여 LMPSCs 추정방식에 따라 입력신호의 음성특징을 향상하는 제2단계;를 특징으로 한다.

    음성신호의 특징정보를 이용한 흥미점수 산출 시스템 및 방법, 그를 기록한 기록매체
    6.
    发明授权
    음성신호의 특징정보를 이용한 흥미점수 산출 시스템 및 방법, 그를 기록한 기록매체 有权
    利息分数计算系统和方法采用语音信号特征数据,记录媒体记录程序的利息分数计算方法

    公开(公告)号:KR101499606B1

    公开(公告)日:2015-03-09

    申请号:KR1020130053176

    申请日:2013-05-10

    Abstract: 본 발명에 따르는 음성신호의 특징정보를 이용한 흥미점수 산출 시스템에 있어서, 질의를 위한 음성신호를 입력받아 특징정보를 검출하고, 상기 질의를 위한 음성신호의 특징정보를 수집된 음성신호들과 그에 대해 미리 설정된 점수정보들을 회귀분석 학습하여 생성한 흥미점수 산출함수에 따라 연산하여 흥미점수를 산출하는 제어장치; 상기 흥미점수 및 상기 흥미점수 산출함수를 저장하며, 상기 제어장치의 프로그램 수행을 위해 요구되는 저장영역을 제공하는 메모리부; 및 상기 제어장치의 제어에 따라 음성신호를 제공받아 특징정보를 생성하는 음성신호의 특징정보 검출부;를 구비함을 특징으로 한다.

    DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식장치 및 방법
    7.
    发明授权
    DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식장치 및 방법 有权
    使用DCICA执行基于DNN的特征增强的语音识别设备和方法

    公开(公告)号:KR101720514B1

    公开(公告)日:2017-04-11

    申请号:KR1020160023335

    申请日:2016-02-26

    Abstract: 본발명에따르는 DCICA를이용한 DNN 기반특징향상을수행하는음성인식장치는, 다수의마이크로부터입력되는마이크입력신호들을각각입력받아 STFT(Short-Time Fourier Transform) 처리하는다수의 STFT; 상기다수의 STFT 처리부가출력하는 STFT 처리된마이크입력신호들을입력받아 DCICA 처리를이행하며, 타겟추정신호와잡음추정신호를생성하는 DCICA(Direction of arrival(DOA) Constrained Independent Component Analysis(ICA))부; 상기 STFT 처리된마이크입력신호들중 어느하나인제1마이크입력신호와, 상기 DCICA부가출력하는타겟추정신호와잡음추정신호를입력받아 LMPSC(logarithmic mel-frequency power spectral coefficient) 처리하여스펙트럴형태로변환하여출력하는다수의 LMPSC 처리부; 상기 LMPSC 처리부가출력하는스펙트럴형태로변환되어출력되는제1마이크입력신호와타겟추정신호와잡음추정신호를입력받아특징강화된최종타겟추정신호를생성하는 DNN 기반 FE(DNN-Based Feature Enhancement) 처리부; 및상기최종타겟추정신호를제공받아음성인식을수행하는 ASR(Automatic Speech Recognition) 처리부;로구성됨을특징으로한다. 또한상기방법은, 상기 DCICA부가출력하는잡음추정신호의스케일을가변하는스케일링부; 상기스케일링부가출력하는스케일링된잡음추정신호를입력받아 LMPSC 처리하여스펙트럴형태로변환하여출력하는 LMPSC; 및상기 LMPSC가출력하는스펙트럴형태로변환된스케일링된잡음추정신호와상기 DCICA가출력하는타겟추정신호를입력받아 HMM(hidden markov model) 기반 FE 처리하여특징강화된타켓추정신호를생성하여상기 DNN 기반 FE 처리부로제공하는 HMM 기반 FE 처리부;를더 구비하며, 상기 DNN 기반 FE 처리부는상기제1마이크입력신호와상기특징강화된타켓추정신호와상기잡음추정신호를입력받아특징강화된최종타겟신호를생성하며, 상기 DNN 기반 FE 처리부로입력되는상기제1마이크입력신호와상기특징강화된타켓추정신호와상기잡음추정신호는스펙트럴형태임을특징으로한다.

    Abstract translation: 用于使用DCICA根据本发明,多个STFT来接收和处理来自多个微STFT的麦克风输入信号的输入的每个类型(短时傅立叶变换)执行基于DNN特征增强语音识别装置; 和实施DCICA过程接收STFT经处理的麦克风输入信号向所述多个STFT处理单元输出,该目标估计信号和DCICA的(到达方向(DOA)约束独立成分分析(ICA)),用于产生噪声估计信号部分 。 该STFT并将处理后的麦克风输入信号中的任何一个摄取一个麦克风输入信号,接收目标估计信号和所述噪声估计信号到DCICA相加后的输出通过处理(对数梅尔频率功率频谱系数)LMPSC转换为频谱形状 输出LMPSC的多个LMPSC处理单元; 第一麦克风输入信号和目标估计信号和基于DNN FE(基于DNN特征增强)接收所述噪声估计信号,以产生增强的特征是输出的最终目标估计信号被转换成LMPSC处理单元输出的频谱形状 处理器; 以及ASR(自动语音识别)处理器,用于通过接收最终目标估计信号来执行语音识别。 该方法还可以包括:缩放单元,用于改变DCICA输出的噪声估计信号的比例; LMPSC通过治疗LMPSC频谱形状转换接收缩放的噪声估计信号输出到缩放的输出部; 和LMPSC失控力方面缩放的转换成桶形式噪声估计信号和所述通过接收信号HMM(隐马尔可夫模型)估计DCICA失控力目标和对基础FE过程产生增强的目标估计信号采用了DNN到 用于接收第一麦克风输入信号,特征增强的目标估计信号和噪声估计信号以提供最终增强的目标信号, 并且输入到基于DNN的FE处理器的第一麦克风输入信号,特征增强的目标估计信号和噪声估计信号处于频谱形式。

    반향 환경에서의 음성특징 향상방법 및 장치
    8.
    发明公开
    반향 환경에서의 음성특징 향상방법 및 장치 有权
    语音特征增强方法和装置在混响环境中

    公开(公告)号:KR1020150015990A

    公开(公告)日:2015-02-11

    申请号:KR1020130092139

    申请日:2013-08-02

    Inventor: 박형민 조지원

    CPC classification number: G10L21/02 G10L15/20

    Abstract: A speech feature enhancement method in a reverberation environment according to the present invention initializes model error statics and log mean energy of a room impulse response (RIP) through an approximate modeling process for the reverberation environment, determines an enhanced LMPSCs estimation formula based on the initialized model error statics and log mean energy of RIP, estimates the LMPSCs estimation formula with regard to an observation signal based on the enhanced LMPSCs estimation formula, calculates and updates the log mean energy of the RIP based on the observation signal, the model error statics, and the enhanced LMPSCs, and determines the enhanced LMPSCs estimation formula based on the updated model error statics and log mean average of the RIP. The present invention includes a first step of determining the enhanced LMPSCs estimation method in consideration of a frequency dependent reverberation and a second step of improving the speech feature of an input signal according to the LMPSCs estimation method in consideration of the frequency dependent reverberation.

    Abstract translation: 根据本发明的混响环境中的语音特征增强方法通过用于混响环境的近似建模过程初始化房间脉冲响应(RIP)的模型误差静态和对数平均能量,基于初始化的LMPSC估计公式确定增强的LMPSC估计公式 RIP的模型误差静态和对数平均能量,基于增强的LMPSC估计公式估计关于观测信号的LMPSC估计公式,基于观测信号计算和更新RIP的对数平均能量,模型误差静态, 和增强的LMPSC,并且基于RIP的更新的模型误差静态和对数平均值来确定增强的LMPSC估计公式。 本发明包括考虑到频率相关混响来确定增强型LMPSC估计方法的第一步骤和考虑到频率依赖性混响的根据LMPSC估计方法改进输入信号的语音特征的第二步骤。

    음성신호의 특징정보를 이용한 흥미점수 산출 시스템 및 방법, 그를 기록한 기록매체
    9.
    发明公开
    음성신호의 특징정보를 이용한 흥미점수 산출 시스템 및 방법, 그를 기록한 기록매체 有权
    利息计算系统和使用语音信号特征数据的方法,记录计数记录方法

    公开(公告)号:KR1020140133257A

    公开(公告)日:2014-11-19

    申请号:KR1020130053176

    申请日:2013-05-10

    CPC classification number: G10L25/63 G10L15/02 G10L25/09

    Abstract: 본 발명에 따르는 음성신호의 특징정보를 이용한 흥미점수 산출 시스템에 있어서, 질의를 위한 음성신호를 입력받아 특징정보를 검출하고, 상기 질의를 위한 음성신호의 특징정보를 수집된 음성신호들과 그에 대해 미리 설정된 점수정보들을 회귀분석 학습하여 생성한 흥미점수 산출함수에 따라 연산하여 흥미점수를 산출하는 제어장치; 상기 흥미점수 및 상기 흥미점수 산출함수를 저장하며, 상기 제어장치의 프로그램 수행을 위해 요구되는 저장영역을 제공하는 메모리부; 및 상기 제어장치의 제어에 따라 음성신호를 제공받아 특징정보를 생성하는 음성신호의 특징정보 검출부;를 구비함을 특징으로 한다.

    Abstract translation: 根据本发明,使用语音信号的特征数据的兴趣点计算系统包括:控制单元,接收用于查询的语音信号以检测特征数据,并通过操作语音信号的特征数据来计算兴趣得分, 根据通过学习和回归分析收集的语音信号和为信号预设的分数数据产生的兴趣分数计算函数进行查询; 存储单元,存储利息分数和利益分数计算功能,并提供执行控制单元的程序所需的存储; 以及语音信号特征数据检测单元,其根据控制单元的控制接收语音信号以生成特征数据。

    음향 채널 추정에 기반한 음원 위치 탐지 방법
    10.
    发明授权
    음향 채널 추정에 기반한 음원 위치 탐지 방법 有权
    基于声道估计的声源定位方法

    公开(公告)号:KR101021800B1

    公开(公告)日:2011-03-17

    申请号:KR1020090026233

    申请日:2009-03-27

    Inventor: 박형민 조지원

    Abstract: 본 발명은 음향 채널 추정에 기반한 음원 위치 탐지 방법에 관한 것이다. 상기 음향 채널 추정에 기반한 음원 위치 탐지 방법은, (a) 적응 채널 필터를 초기화하는 단계; (b) 각 센서로부터 신호들을 입력받는 단계: (c) 각 센서로부터 입력된 신호들을 이전에 갱신된 적응 채널 필터들을 통과시킨 후, 상기 통과된 신호들 간의 차이에 따른 오류 신호를 검출하는 단계: (d) 상기 오류 신호를 이용하여 음원과 각 센서들 사이의 적응 채널 필터들을 다채널 최소 평균 제곱법에 의해 갱신하는 단계: (e) 갱신된 적응 채널 필터를 실제 채널 필터의 선험적 정보를 이용하여 최종 갱신하는 단계: (f) 적응 채널 필터로부터 직접경로의 시간 지연을 파악하고 센서간 시간 지연 차이로부터 음원 위치를 추정하는 단계: 를 구비하고, 상기 (e)단계에서 적응 채널 필터를 갱신할 때 음향 채널 특성을 적용한다. 상기 음향 채널 특성은 채널 필터 계수들이 '성김(sparsity)' 분포를 갖는 특성을 이용함으로써, 보다 더 정확하게 직접경로의 시간 지연을 추정할 수 있게 된다.
    음원 위치 탐지, 음향 채널, 추정

Patent Agency Ranking