-
1.
公开(公告)号:KR1020120040649A
公开(公告)日:2012-04-27
申请号:KR1020110098935
申请日:2011-09-29
Applicant: 삼성전자주식회사 , 서울대학교산학협력단
CPC classification number: G10L19/265 , G10L15/02 , G10L15/28
Abstract: PURPOSE: A pre processing device for voice recognition, a device thereof, and a method thereof are provided to convert the voice of a test environment by a linear dynamic system, thereby increasing the recognition rate of the voice recognition device. CONSTITUTION: A voice input unit divides an first input voice to a fixed frame(S10). A voice converting unit applies conversion rules to the frame of the first voice. The voice converting unit converts the frame of the first voice to a frame of a second voice(S20). A recognizing unit identifies verbal meaning by recognizing frames of the second voice(S30).
Abstract translation: 目的:提供一种用于语音识别的预处理装置,其装置及其方法,用于通过线性动态系统转换测试环境的语音,从而增加语音识别装置的识别率。 构成:语音输入单元将第一输入语音划分为固定帧(S10)。 语音转换单元将转换规则应用于第一语音的帧。 语音转换单元将第一语音的帧转换为第二语音的帧(S20)。 识别单元通过识别第二语音的帧来识别语言意义(S30)。
-
公开(公告)号:KR101862352B1
公开(公告)日:2018-05-30
申请号:KR1020110098935
申请日:2011-09-29
Applicant: 삼성전자주식회사 , 서울대학교산학협력단
Abstract: (a) 음성인식장치에입력되는제1음성을소정의프레임으로분할하는단계; (b) 상기분할된각각의프레임에변환규칙을적용하여상기제1음성의프레임을제2음성의프레임으로변환하는단계; 및 (c) 상기음성인식장치가상기변환된제2음성의프레임을인식하는단계를포함하되, 상기 (b) 단계는, 상기제1음성의프레임의이전에위치한프레임들중 적어도하나를반영하여상기제1음성의프레임을상기제2음성의프레임으로변환하는단계를포함하는본 발명의일 실시예에따른음성인식방법이개시된다.
-
3.심화 학습 모델을 이용한 목표 화자의 적응형 목소리 변환 방법 및 이를 구현하는 음성 변환 장치 有权
Title translation: 目标扬声器自适应语音转换方法使用深度学习模型和语音转换设备实现相同公开(公告)号:KR101666930B1
公开(公告)日:2016-10-24
申请号:KR1020150060949
申请日:2015-04-29
Applicant: 서울대학교산학협력단
IPC: G10L13/033 , G10L13/04
Abstract: 본발명은심화학습모델을이용한목표화자의적응형목소리변환방법및 이를구현하는음성변환장치에관한것으로서, 보다구체적으로는, 사용자맞춤형음성보정장치가, (1) 원시화자의음성문장을포함하는데이터베이스에저장된음성데이터에대하여, 파형보간법을이용하여, 음성문장각각의프레임에대해특징벡터들을추출하는단계; (2) 상기데이터베이스에저장된음성데이터에대하여, 각각의화자에대해서로다른값을갖는코드벡터들을추출하는단계; (3) 추출된특징벡터들및 코드벡터들을이용하여미리설정된딥 러닝모델을학습시키는단계; 및 (4) 학습된딥 러닝모델에, 상기원시화자의특징벡터및 코드벡터와, 목표화자의코드벡터를입력한결과에기초하여, 목표화자의음성을생성하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는심화학습모델을이용한목표화자의적응형목소리변환방법및 이를구현하는음성변환장치에따르면, 사용자맞춤형음성보정장치가, 원시화자의음성문장을포함하는데이터베이스에저장된음성데이터에대하여, 파형보간법을이용하여음성문장각각의프레임에대해특징벡터들을추출하고, 데이터베이스에저장된음성데이터에대하여, 각각의화자에대해서로다른값을갖는코드벡터들을추출하며, 추출된특징벡터들및 코드벡터들을이용하여미리설정된딥 러닝모델을학습시키고, 학습된딥 러닝모델에원시화자의특징벡터및 코드벡터와, 목표화자의코드벡터를입력한결과에기초하여, 목표화자의음성을생성함으로써, 상대적으로적은음성데이터만으로추출된목표화자의코드벡터를이용하여목표화자가발화하지않은문장들도목표화자의음성특징을반영하여새로운음성으로생성할수 있다. 또한, 추출되는특징벡터를이용하여화자에독립적인성분과비독립적인성분을구별함으로써, 화자에독립적인파라미터가추정에러에의해받는영향을감소시킬수 있다.
-
公开(公告)号:KR101620866B1
公开(公告)日:2016-05-13
申请号:KR1020140182741
申请日:2014-12-17
Applicant: 서울대학교산학협력단
IPC: G10L21/0272
CPC classification number: G10L21/0272 , G10L25/30 , G10L25/84 , Y10S707/99931
Abstract: 본발명은학습기법을적용한사전학습알고리즘기반의음원분리방법에관한것으로서, 보다구체적으로는 (1) 음원에대하여사전학습(Dictionary learning) 알고리즘을학습하는단계; (2) 음원을이용해혼합음원을생성하고, 상기혼합음원과타깃음원들사이의관계를학습하는단계; 및 (3) 상기단계 (2)에서학습된관계를이용해, 입력음원을타깃음원들로분리하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는학습기법을적용한사전학습알고리즘기반의음원분리방법에따르면, 사전학습알고리즘을이용하되, 혼합음원과타깃음원사이의관계를학습하고학습된관계를이용해입력음원을타깃음원들로분리함으로써, 타깃음원들이유사한특성을지닐때에도효과적으로음원분리를할 수있고, 다양한잡음특성을충분히반영하여우수한음원분리성능을가질수 있다.
Abstract translation: 本发明涉及一种基于字典学习算法分离声源的学习技术应用方法。 更具体地说,该方法包括:(1)关于声源学习字典学习算法的步骤; (2)通过使用声源来创建混合声源并学习混合声源与目标声源之间的关系的步骤; 以及(3)通过使用在步骤(2)中学到的关系将输入声源分离成目标声源的步骤。 根据本发明提出的基于字典学习算法分离声源的学习技术应用方法,即使目标声源具有类似的特征,也可以有效地分离声源,并且具有优良的声源分离性能 通过使用字典学习算法充分结合各种噪声特性,并通过学习混合声源和目标声源之间的关系并使用学习关系将输入声源分离成目标声源。
-
-
-