심화 신경망을 이용한 통계모델 기반의 음성 검출 방법 및 이를 수행하는 음성 검출 장치
    31.
    发明公开
    심화 신경망을 이용한 통계모델 기반의 음성 검출 방법 및 이를 수행하는 음성 검출 장치 有权
    基于使用深度神经网络的统计模型和执行其的语音活动检测装置的语音活动检测方法

    公开(公告)号:KR1020160073874A

    公开(公告)日:2016-06-27

    申请号:KR1020140182736

    申请日:2014-12-17

    CPC classification number: G10L25/78 G10L25/30

    Abstract: 본발명은심화신경망을이용한통계모델기반의음성검출방법및 이를수행하기위한음성검출장치에관한것으로서, 보다구체적으로는음성검출장치가, (1) 학습단계에서, 주변잡음에의해오염된음성신호를입력받고, 입력된음성신호의분산값에기초하여, 사전(a priori) 신호대 잡음비(SNR), 사후(a posteriori) 신호대 잡음비(SNR) 및우도비(likelihood ratio, LR)를이용한특징벡터를추출하는단계; (2) 상기학습단계에서, 상기추출된특징벡터의결과를이용하여, 복수의비선형은닉층을갖는심화신경망의가중치및 바이어스를초기화하여상기심화신경망을선행학습시키는단계; (3) 상기학습단계에서, 상기추출된특징벡터의결과와음성의존재/부재에대한레이블링값을이용하여, 기울기하강기반의역전이알고리즘에기초하여상기심화신경망을최적화시키는단계; 및 (4) 분류단계에서, 상기특징벡터추출방법을통해서얻어진특징벡터로부터상기학습된심화신경망을통해서얻어진결과를이용한결정함수에기초하여, 상기입력된음성신호를음성구간또는잡음구간으로분류하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는심화신경망을이용한통계모델기반의음성검출방법및 이를수행하는음성검출장치에따르면, 학습단계에서, 주변잡음에의해오염된음성신호를입력받고, 입력된음성신호의분산값에기초하여, 사전(a priori) 신호대 잡음비(SNR), 사후(a posteriori) 신호대 잡음비(SNR) 및우도비(likelihood ratio, LR)를이용한특징벡터를추출하며, 상기추출된특징벡터의결과를이용하여, 복수의비선형은닉층을갖는심화신경망의가중치및 바이어스를초기화하여상기심화신경망을선행학습시키고, 상기추출된특징벡터의결과와음성의존재/부재에대한레이블링값을이용하여, 기울기하강기반의역전이알고리즘에기초하여상기심화신경망을최적화시키며, 분류단계에서, 상기특징벡터추출방법을통해서얻어진특징벡터로부터상기학습된심화신경망을통해서얻어진결과를이용한결정함수에기초하여, 상기입력된음성신호를음성구간또는잡음구간으로분류함으로써, 다수의비선형은닉층을이용하여음성이존재하는경우와존재하지않는경우에대한우도비의분포를보다효과적으로모델링할수 있고, 음성검출성능을향상시킬수 있으며, 계산소요시간을감소시킬수 있다.

    Abstract translation: 本发明涉及一种基于使用深神经网络的统计模型和执行该神经网络的语音检测装置的语音检测方法。 该方法包括以下步骤:(1)使用先验信噪比(SNR),后验信噪比(SNR)和似然比(LR)提取特征向量; (2)提前深入学习神经网络; (3)基于梯度下降计数器转移算法优化深神经网络; 和(4)将输入的语音信号分成语音部分或噪声部分。

    딥 뉴럴 네트워크 기반 특징 보상 기법을 이용한 음성 인식 방법
    32.
    发明授权
    딥 뉴럴 네트워크 기반 특징 보상 기법을 이용한 음성 인식 방법 有权
    使用基于深层神经网络的特征补偿的语音识别方法

    公开(公告)号:KR101624926B1

    公开(公告)日:2016-05-27

    申请号:KR1020140182745

    申请日:2014-12-17

    CPC classification number: G10L15/16 G10L15/20 G10L25/30 Y10S706/90

    Abstract: 본발명은딥 뉴럴네트워크기반특징보상기법을이용한음성인식방법에관한것으로서, 보다구체적으로는 (1) 잡음이혼합된학습데이터를이용해딥 뉴럴네트워크(Deep Neural Network; DNN)를학습하는단계; (2) 테스트데이터를상기학습된딥 뉴럴네트워크에적용하여보상된특징벡터또는스테이트사후확률을도출하는단계; 및 (3) 상기단계 (2)에서도출된보상된특징벡터또는스테이트사후확률을이용해, 음성인식결과를도출하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는딥 뉴럴네트워크기반특징보상기법을이용한음성인식방법에따르면, 잡음이혼합된학습데이터를이용해딥 뉴럴네트워크를학습함으로써, 잡음과깨끗한음성과의관계를자동으로학습할수 있으며, 학습된딥 뉴럴네트워크에테스트데이터를적용하여보상된특징벡터또는스테이트사후확률을도출하고, 이를이용해음성인식결과를도출함으로써, 어떤잡음에서도정확한특징보상이이루어질수 있고, 이를통해향상된음성인식결과를얻을수 있다. 또한, 본발명에따르면, 특징벡터또는스테이트사후확률에대하여딥 뉴럴네트워크를학습하고, 학습된딥 뉴럴네트워크를통해보상된특징벡터또는스테이트사후확률을얻을수 있으므로, 디코더의종류에따라다양한방식으로음성인식에적용될수 있다.

    Abstract translation: 本发明涉及一种通过使用基于深神经网络(DNN)的特征补偿技术的语音识别方法。 更具体地说,本发明包括:(1)通过使用与噪声混合的学习数据来学习DNN的步骤; (2)通过将测试数据应用于所学习的DNN来计算补偿特征向量或后验状态概率的步骤; 和(3)通过使用在步骤(2)中计算的补偿特征向量或后验状态概率来绘制语音识别结果的步骤。 根据通过使用基于本发明提出的DNN的特征补偿技术的语音识别方法,可以通过使用与噪声混合的学习数据学习DNN来自动学习噪声与干净语音之间的关系 并用任何噪声进行精确的特征补偿,从而通过将测试数据应用于学习的DNN并通过使用相同的语音识别结果绘制补偿特征向量或后验状态概率来获得改进的语音识别结果 。 此外,本发明能够根据解码器类型以各种模式应用于语音识别,因为本发明能够根据特征向量或后验状态概率学习DNN,并获得补偿后的特征向量或 通过学习的DNN的后验状态概率。

    마스킹 효과를 고려한 음파 통신 시스템 및 방법, 그리고 이에 적용되는 장치
    35.
    发明公开
    마스킹 효과를 고려한 음파 통신 시스템 및 방법, 그리고 이에 적용되는 장치 有权
    用于实施具有掩蔽效应的声波通信的系统和方法,以及适用于其的设备

    公开(公告)号:KR1020120050155A

    公开(公告)日:2012-05-18

    申请号:KR1020100111522

    申请日:2010-11-10

    Abstract: PURPOSE: A sound wave communication system and a method thereof are provided to minimize errors for detecting information within a sound source of audio content due to masking effect. CONSTITUTION: A transmission unit(100) generates a modulation audio signal which amplitude size is controlled based on a masking threshold value. The transmission unit determines sound variation of the audio signal. The transmission unit re-controls amplitude of a signal band. A reception unit(200) receives an output audio signal. The reception unit outputs information data of the output audio signal.

    Abstract translation: 目的:提供一种声波通信系统及其方法,以最小化由于掩蔽效应而检测音频内容的声源内的信息的错误。 构成:发送单元(100)生成基于掩蔽阈值来控制振幅大小的调制音频信号。 发送单元确定音频信号的声音变化。 传输单元重新控制信号频带的幅度。 接收单元(200)接收输出音频信号。 接收单元输出输出音频信号的信息数据。

    음성 인식을 위한 전처리 장치, 및 이를 이용한 음성 인식 장치 및 방법
    36.
    发明公开
    음성 인식을 위한 전처리 장치, 및 이를 이용한 음성 인식 장치 및 방법 审中-实审
    用于语音识别的前端处理器,以及使用该语音识别的装置和语音识别方法

    公开(公告)号:KR1020120040649A

    公开(公告)日:2012-04-27

    申请号:KR1020110098935

    申请日:2011-09-29

    CPC classification number: G10L19/265 G10L15/02 G10L15/28

    Abstract: PURPOSE: A pre processing device for voice recognition, a device thereof, and a method thereof are provided to convert the voice of a test environment by a linear dynamic system, thereby increasing the recognition rate of the voice recognition device. CONSTITUTION: A voice input unit divides an first input voice to a fixed frame(S10). A voice converting unit applies conversion rules to the frame of the first voice. The voice converting unit converts the frame of the first voice to a frame of a second voice(S20). A recognizing unit identifies verbal meaning by recognizing frames of the second voice(S30).

    Abstract translation: 目的:提供一种用于语音识别的预处理装置,其装置及其方法,用于通过线性动态系统转换测试环境的语音,从而增加语音识别装置的识别率。 构成:语音输入单元将第一输入语音划分为固定帧(S10)。 语音转换单元将转换规则应用于第一语音的帧。 语音转换单元将第一语音的帧转换为第二语音的帧(S20)。 识别单元通过识别第二语音的帧来识别语言意义(S30)。

    가청주파수 대역 음향통신에서의 데이터 수신에러 감소 시스템 및 방법, 그리고 이에 적용되는 장치
    37.
    发明公开
    가청주파수 대역 음향통신에서의 데이터 수신에러 감소 시스템 및 방법, 그리고 이에 적용되는 장치 有权
    用于降低基于频率基带的声音通信中的数据的接收错误的系统和方法,适用于其的装置

    公开(公告)号:KR1020110071542A

    公开(公告)日:2011-06-29

    申请号:KR1020090128146

    申请日:2009-12-21

    CPC classification number: G10L21/02 H04B11/00

    Abstract: PURPOSE: A system and a method for reducing data reception errors in audible frequency band-based sound communication, and an apparatus applied to the same are provided to improve the reliability of data transmission by employing a bit determination method proper for sound based communication. CONSTITUTION: A system for reducing data reception errors in audible frequency band-based sound communication comprises a transmitter(100) and a receiver(200). The transmitter transmits an audio signal through audible frequency band-based sound communication. The receiver receives an audio signal and converts the signal into a frequency axis signal through the preset conversion method, performs correlation operation for detecting a synchronous signal, presents a data signal on complex number coordinates, groups the data signal values presented on the complex number coordinates, and determines a bit for the data signal based on the groups.

    Abstract translation: 目的:提供一种用于减小可听频带的声音通信中的数据接收错误的系统和方法,以及应用于其的装置,通过采用适用于基于声音的通信的比特确定方法来提高数据传输的可靠性。 构成:用于在可听频带的声音通信中减少数据接收错误的系统包括发射机(100)和接收机(200)。 发射机通过基于声频的频带声音通信发送音频信号。 接收机接收音频信号,并通过预设的转换方式将信号转换成频率轴信号,执行检测同步信号的相关运算,呈现复数坐标上的数据信号,对复数坐标上呈现的数据信号进行分组 并且基于组确定数据信号的位。

Patent Agency Ranking