음성 인식을 위한 전처리 장치, 및 이를 이용한 음성 인식 장치 및 방법
    1.
    发明公开
    음성 인식을 위한 전처리 장치, 및 이를 이용한 음성 인식 장치 및 방법 审中-实审
    用于语音识别的前端处理器,以及使用该语音识别的装置和语音识别方法

    公开(公告)号:KR1020120040649A

    公开(公告)日:2012-04-27

    申请号:KR1020110098935

    申请日:2011-09-29

    CPC classification number: G10L19/265 G10L15/02 G10L15/28

    Abstract: PURPOSE: A pre processing device for voice recognition, a device thereof, and a method thereof are provided to convert the voice of a test environment by a linear dynamic system, thereby increasing the recognition rate of the voice recognition device. CONSTITUTION: A voice input unit divides an first input voice to a fixed frame(S10). A voice converting unit applies conversion rules to the frame of the first voice. The voice converting unit converts the frame of the first voice to a frame of a second voice(S20). A recognizing unit identifies verbal meaning by recognizing frames of the second voice(S30).

    Abstract translation: 目的:提供一种用于语音识别的预处理装置,其装置及其方法,用于通过线性动态系统转换测试环境的语音,从而增加语音识别装置的识别率。 构成:语音输入单元将第一输入语音划分为固定帧(S10)。 语音转换单元将转换规则应用于第一语音的帧。 语音转换单元将第一语音的帧转换为第二语音的帧(S20)。 识别单元通过识别第二语音的帧来识别语言意义(S30)。

    심화 학습 모델을 이용한 목표 화자의 적응형 목소리 변환 방법 및 이를 구현하는 음성 변환 장치
    3.
    发明授权
    심화 학습 모델을 이용한 목표 화자의 적응형 목소리 변환 방법 및 이를 구현하는 음성 변환 장치 有权
    目标扬声器自适应语音转换方法使用深度学习模型和语音转换设备实现相同

    公开(公告)号:KR101666930B1

    公开(公告)日:2016-10-24

    申请号:KR1020150060949

    申请日:2015-04-29

    Abstract: 본발명은심화학습모델을이용한목표화자의적응형목소리변환방법및 이를구현하는음성변환장치에관한것으로서, 보다구체적으로는, 사용자맞춤형음성보정장치가, (1) 원시화자의음성문장을포함하는데이터베이스에저장된음성데이터에대하여, 파형보간법을이용하여, 음성문장각각의프레임에대해특징벡터들을추출하는단계; (2) 상기데이터베이스에저장된음성데이터에대하여, 각각의화자에대해서로다른값을갖는코드벡터들을추출하는단계; (3) 추출된특징벡터들및 코드벡터들을이용하여미리설정된딥 러닝모델을학습시키는단계; 및 (4) 학습된딥 러닝모델에, 상기원시화자의특징벡터및 코드벡터와, 목표화자의코드벡터를입력한결과에기초하여, 목표화자의음성을생성하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는심화학습모델을이용한목표화자의적응형목소리변환방법및 이를구현하는음성변환장치에따르면, 사용자맞춤형음성보정장치가, 원시화자의음성문장을포함하는데이터베이스에저장된음성데이터에대하여, 파형보간법을이용하여음성문장각각의프레임에대해특징벡터들을추출하고, 데이터베이스에저장된음성데이터에대하여, 각각의화자에대해서로다른값을갖는코드벡터들을추출하며, 추출된특징벡터들및 코드벡터들을이용하여미리설정된딥 러닝모델을학습시키고, 학습된딥 러닝모델에원시화자의특징벡터및 코드벡터와, 목표화자의코드벡터를입력한결과에기초하여, 목표화자의음성을생성함으로써, 상대적으로적은음성데이터만으로추출된목표화자의코드벡터를이용하여목표화자가발화하지않은문장들도목표화자의음성특징을반영하여새로운음성으로생성할수 있다. 또한, 추출되는특징벡터를이용하여화자에독립적인성분과비독립적인성분을구별함으로써, 화자에독립적인파라미터가추정에러에의해받는영향을감소시킬수 있다.

    학습 기법을 적용한 사전 학습 알고리즘 기반의 음원 분리 방법
    4.
    发明授权
    학습 기법을 적용한 사전 학습 알고리즘 기반의 음원 분리 방법 有权
    使用感应算法进行基于语义学习的目标分离

    公开(公告)号:KR101620866B1

    公开(公告)日:2016-05-13

    申请号:KR1020140182741

    申请日:2014-12-17

    CPC classification number: G10L21/0272 G10L25/30 G10L25/84 Y10S707/99931

    Abstract: 본발명은학습기법을적용한사전학습알고리즘기반의음원분리방법에관한것으로서, 보다구체적으로는 (1) 음원에대하여사전학습(Dictionary learning) 알고리즘을학습하는단계; (2) 음원을이용해혼합음원을생성하고, 상기혼합음원과타깃음원들사이의관계를학습하는단계; 및 (3) 상기단계 (2)에서학습된관계를이용해, 입력음원을타깃음원들로분리하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는학습기법을적용한사전학습알고리즘기반의음원분리방법에따르면, 사전학습알고리즘을이용하되, 혼합음원과타깃음원사이의관계를학습하고학습된관계를이용해입력음원을타깃음원들로분리함으로써, 타깃음원들이유사한특성을지닐때에도효과적으로음원분리를할 수있고, 다양한잡음특성을충분히반영하여우수한음원분리성능을가질수 있다.

    Abstract translation: 本发明涉及一种基于字典学习算法分离声源的学习技术应用方法。 更具体地说,该方法包括:(1)关于声源学习字典学习算法的步骤; (2)通过使用声源来创建混合声源并学习混合声源与目标声源之间的关系的步骤; 以及(3)通过使用在步骤(2)中学到的关系将输入声源分离成目标声源的步骤。 根据本发明提出的基于字典学习算法分离声源的学习技术应用方法,即使目标声源具有类似的特征,也可以有效地分离声源,并且具有优良的声源分离性能 通过使用字典学习算法充分结合各种噪声特性,并通过学习混合声源和目标声源之间的关系并使用学习关系将输入声源分离成目标声源。

Patent Agency Ranking