-
公开(公告)号:KR1020140059545A
公开(公告)日:2014-05-16
申请号:KR1020120126111
申请日:2012-11-08
Applicant: 한국전자통신연구원
IPC: G10L15/14
CPC classification number: G10L15/14 , G10L15/005 , G10L2015/025
Abstract: The present invention relates to a retraining method by complementing insufficient audio data for a particular language and without changing the structure of the acoustic model simultaneously using a joint phone which is included in the multilingual audio data. Speech data for each language must be fully prepared in order to create an acoustic model of a multi-continuous speech recognition device but consumes a lot of costs and time in general. And the present invention can define common phonemes to be used for a phoneme symbol which is acoustically same between multiple languages. Provided is a selective retraining method using the common phoneme in the language which has a large amount of the audio data in order to train the language of insufficient memory on the basis of above.
Abstract translation: 本发明涉及一种通过补充特定语言的不足的音频数据并且不使用包括在多语言音频数据中的联合电话同时改变声学模型的结构的再培训方法。 必须对每种语言的语音数据进行全面准备,以创建多连续语音识别设备的声学模型,但通常会消耗大量成本和时间。 并且本发明可以定义要用于在多种语言之间声学上相同的音素符号的共同音素。 提供了一种选择性再培训方法,其使用具有大量音频数据的语言中的公共音素,以便基于上述来训练不足的存储器的语言。
-
12.핸즈프리 자동 통역 서비스를 위한 단말 장치 및 핸즈프리 장치와, 핸즈프리 자동 통역 서비스 방법 有权
Title translation: 一种用于免提自动口译服务的终端设备和免提设备以及免提自动口译服务方法公开(公告)号:KR101834546B1
公开(公告)日:2018-04-13
申请号:KR1020140022712
申请日:2014-02-26
Applicant: 한국전자통신연구원
CPC classification number: G06F17/289 , G06F17/2854 , G10L13/033 , G10L15/00 , H04M1/6041
Abstract: 핸즈프리자동통역서비스를위한자동통역시스템에관한것이다. 핸즈프리기반의자동통역시스템은핸즈프리장치, 단말장치및 통역서버를포함할수 있다. 이때, 단말장치는핸즈프리장치의요청에따라통역환경을초기화하는통역환경초기화부와, 사용자및 상대방의통역결과를중개하는통역중개부및 상대방의통역결과를설정된통역환경에기초하여음성으로합성하여핸즈프리장치에전송하는통역처리부를포함할수 있다. 이와같이, 핸즈프리장치를통하여통역서비스를제공함으로써사용자편의성이향상될수 있다.
Abstract translation: 用于免提自动翻译服务的自动翻译系统。 基于免提的自动翻译系统可以包括免提设备,终端设备和解释服务器。 此时,通过合成基于初始化在免提环境初始化单元,用户和介导解释结果的解释器调停部的另一方,并且所述解释器环境的另一侧的请求的解释环境的解释语音终端装置被设置为解释结果 以及用于向免提装置发送的解释处理单元。 这样,通过免提设备提供翻译服务可以提高用户的便利性。
-
13.원시 발화자의 목소리와 유사한 특성을 갖는 합성음을 생성하는 자동 통역 시스템 및 그 동작 방법 审中-实审
Title translation: 一种自动解释系统,用于生成具有类似于母语者的特征的合成语音及其操作方法公开(公告)号:KR1020170103209A
公开(公告)日:2017-09-13
申请号:KR1020160025685
申请日:2016-03-03
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2872 , G06F17/289 , G10L13/0335 , G10L13/06 , G10L15/26 , G10L25/03 , G10L25/24 , G10L25/48 , G10L25/75
Abstract: 본발명은원시발화자의목소리와유사한특성을갖는합성음을생성하는자동통역시스템및 그동작방법에관한것으로서, 본발명의실시예에따른원시발화자의목소리와유사한특성을갖는합성음을생성하는자동통역시스템은원시발화자의원시음성신호에대한음성인식을수행하여텍스트데이터를생성하고, 상기원시음성에대한음높이(Pitch) 정보, 발성강도(Intensity) 정보, 발화속도(Speed) 정보및 성도(Vocal Tract) 특징정보중 적어도하나의특성정보를추출하는음성인식모듈, 상기텍스트데이터를번역하여합성대상번역문을생성하는자동번역모듈, 및상기합성대상번역문에대한합성음을생성하는음성합성모듈을포함한다.
Abstract translation: 本发明涉及一种同声翻译系统,并产生具有相似性质的作为原料讲话者的声音,用于产生具有根据本发明的一个实施例相似的特性作为原料讲话者声音的合成声音同声翻译系统的合成声音及其操作方法 并且对于在原始语音执行期间eunwon音频信号产生文本数据的城市讲话者诊所语音识别,并且间距(间距)信息,语音强度(强度)的信息,发声速度(速度)的信息和成都(发音通道) 功能包括语音识别模块,自动翻译模块,以及用于生成合成语音的合成目标翻译翻译的文本数据,生成合成目标翻译中提取的至少一个属性的信息的信息的语音合成模块。
-
公开(公告)号:KR1020170007114A
公开(公告)日:2017-01-18
申请号:KR1020160076806
申请日:2016-06-20
Applicant: 한국전자통신연구원
Abstract: 본발명의일 실시예에따른음성신호처리장치는사용자의음성신호를입력받는입력부, 보조신호를감지하는감지부, 및제 1 동작모드에서상기음성신호를외부단말로전송하고, 제 2 동작모드에서상기음성신호및 보조신호를동일한프로토콜또는서로다른프로토콜을이용하여상기외부단말로전송하는신호처리부를포함할수 있다.
-
公开(公告)号:KR1020170007107A
公开(公告)日:2017-01-18
申请号:KR1020160064193
申请日:2016-05-25
Applicant: 한국전자통신연구원
Abstract: 본발명은사용자에게수동으로발성할언어를선택하기위한버튼의사용등 사용자등록이나인식언어설정을위한별도의과정없이, 발성한사람의음성인식동안에자동으로음성언어의식별이가능하게하여다국어음성인식을효과적으로처리할수 있으며, 하나의단말기를사용해각기다른언어의사람이발성하여도자동으로각 언어의음성인식을수행하도록지원하여사용자의편의성을높일수 있는음성인식시스템및 방법에관한것이다.
-
公开(公告)号:KR1020160062666A
公开(公告)日:2016-06-02
申请号:KR1020150094041
申请日:2015-07-01
Applicant: 한국전자통신연구원
Abstract: 본발명은 PC, 또는핸드폰, 스마트폰, PDA, Laptop 등휴대가가능한기기와통신하거나직접자동통역단말기에활용되는자동통역시스템에관한것으로서, 상기자동통역시스템은, 발화자의음성인식용마이크신호, 골도마이크신호및 발화자의제스쳐신호를네트워크를통해전송하고, 네트워크를통해수신된통역결과신호를출력하는웨어러블자동통역입출력장치; 및상기웨어러블자동통역입출력장치로부터네트워크를통해전송된골도마이크신호또는제스쳐신호를이용하여상기음성인식용마이크신호에서음성데이터구간을검출하고, 검출된구간내의음성데이터의음성인식및 통역을수행한후, 통역결과신호를네트워크를통해상기웨어러블자동통역입출력장치로전송하는서버를포함한다.
Abstract translation: 本发明涉及能够通信诸如PC,智能电话,PDA,笔记本电脑等便携式设备或应用于自动解释终端的自动解释系统。 自动解释系统包括:可穿戴自动解释输入/输出设备和服务器。 可穿戴自动解释输入/输出装置通过网络发送麦克风信号用于语音识别呼叫者,骨传导麦克风信号和呼叫者的手势信号,并输出通过网络接收的解释结果信号。 服务器通过使用来自可穿戴自动解释输入/输出设备的骨传导麦克风信号或通过网络发送的手势信号,从用于语音识别的麦克风信号中检测语音数据部分; 并且在检测到的部分中的语音数据的语音识别和解释之后,通过网络将解释结果信号发送到可穿戴自动解释输入/输出设备。
-
-
公开(公告)号:KR101805976B1
公开(公告)日:2017-12-07
申请号:KR1020150028913
申请日:2015-03-02
Applicant: 한국전자통신연구원
Abstract: 음성인식장치및 음성인식방법이제공된다. 음성인식방법은입력신호를음향모델데이터로변환하는단계, 상기음향모델데이터를음성모델그룹및 비음성모델그룹으로분리하고상기음성모델그룹에대응하는제1 최대우도및 상기비음성모델그룹에대응하는제2 최대우도를계산하는단계, 상기제1 최대우도및 상기제2 최대우도사이의우도비율에기초하여음성을검출하는단계, 상기음성이검출되기시작한경우에디코더의출력데이터에기초하여발화정지정보를획득하고상기발화정지정보에기초하여상기입력신호를복수의음성구간으로분리하는단계, 상기음향모델데이터의사전확률분포의정보에기초하여상기복수의음성구간각각의신뢰도를계산하는단계및 상기복수의음성구간중에서상기신뢰도가문턱치보다작은음성구간을제거하는단계를포함한다.
Abstract translation: 提供语音识别装置和语音识别方法。 语音识别方法,包括以下步骤:将输入信号转换成声学模型数据,将所述声学模型数据在语音模型组和非语音模型组,并对应于第一最大似然,并且对应于语音模型组非语音模型组, 基于解码器的输出数据基于第一最大似然性和第二最大似然性之间的似然比来计算第二最大似然性, 获得停止信息以及基于所述输入信号分离成多个语音段的先验分布的信息,所述声学模型数据计算所述基于点火停止信息多个声音间隔,每个间隔可靠性的 并且去除多个语音区间中可靠性小于阈值的语音区间。
-
公开(公告)号:KR1020160106270A
公开(公告)日:2016-09-12
申请号:KR1020150028913
申请日:2015-03-02
Applicant: 한국전자통신연구원
Abstract: 음성인식장치및 음성인식방법이제공된다. 음성인식방법은입력신호를음향모델데이터로변환하는단계, 상기음향모델데이터를음성모델그룹및 비음성모델그룹으로분리하고상기음성모델그룹에대응하는제1 최대우도및 상기비음성모델그룹에대응하는제2 최대우도를계산하는단계, 상기제1 최대우도및 상기제2 최대우도사이의우도비율에기초하여음성을검출하는단계, 상기음성이검출되기시작한경우에디코더의출력데이터에기초하여발화정지정보를획득하고상기발화정지정보에기초하여상기입력신호를복수의음성구간으로분리하는단계, 상기음향모델데이터의사전확률분포의정보에기초하여상기복수의음성구간각각의신뢰도를계산하는단계및 상기복수의음성구간중에서상기신뢰도가문턱치보다작은음성구간을제거하는단계를포함한다.
Abstract translation: 根据本发明,提供一种用于识别语音的装置和方法,以执行语音检测和语音部分的选择。 该方法包括以下步骤:将输入信号转换成声音模型数据; 将声音模型数据分离成语音模型组和非语音模型组,并且计算对应于语音模型组的第一最大似然和与非语音模型组对应的第二最大似然; 基于第一和第二最大似然比之间的似然比来检测语音; 当语音开始被检测时,基于解码器的输出数据获取讲话停止信息,并且基于说话停止信息将输入信号划分成多个话音部分; 基于声音模型数据的先验概率分布来计算每个语音段的可靠性; 以及在语音部分中去除具有低于阈值的可靠性的语音部分。
-
公开(公告)号:KR1020160081244A
公开(公告)日:2016-07-08
申请号:KR1020140194777
申请日:2014-12-31
Applicant: 한국전자통신연구원
CPC classification number: G06F17/289 , G10L15/26 , G10L17/14
Abstract: 본발명은자원통역시스템및 이의동작방법에관한것으로, 상기시스템은, 입력되는음성및 텍스트를바탕으로화자적응된음향모델및 입력텍스트와유사문장에적응된언어모델을제공하는개인화모듈; 상기개인화모듈에의해제공되는음향모델및 언어모델을바탕으로, 입력되는음성및 텍스트에대해자동음성인식및 번역을수행하는자동통역모듈; 상기자동통역모듈로부터출력되는음성인식결과와번역결과에대한신뢰도를바탕으로신뢰도값을출력하는신뢰도결정모듈; 및상기음성인식결과, 상기번역결과및 상기신뢰도값을외부표시장치로전송하는서버를포함한다.
Abstract translation: 本发明涉及一种自动解释系统及其操作方法。 自动解释系统包括:个性化模块,其基于输入的语音和文本提供适合于声音模型的扬声器,以及适合于与输入文本类似的句子的语言模型; 自动解释模块,基于由个人化模块提供的声学模型和语言模块,执行关于输入语音和文本的自动语音识别和翻译; 可靠性确定模块,基于从所述自动解释模块输出的语音识别结果和翻译结果的可靠性输出可靠性值; 以及向外部显示装置发送语音识别结果,翻译结果和可靠性值的服务器。
-
-
-
-
-
-
-
-
-