-
公开(公告)号:KR1020160107735A
公开(公告)日:2016-09-19
申请号:KR1020150030920
申请日:2015-03-05
Applicant: 한국전자통신연구원
IPC: G10L15/08
CPC classification number: G10L15/08
Abstract: 본발명은원어민특성에최적화된음향모델과발음모델뿐아니라비원어민학습자의발성특성이반영된음향모델및 발음모델을사용하여학습자의발음을평가할수 있도록한 음성인식기반발음평가방법에관한것으로, 상기방법은, 발성스크립트와, 발성스크립트에대응되는학습자발음에대한음성신호가입력되면, 입력되는발성스크립트와학습자음성신호를기 설정된원어민음향모델및 비원어민음향모델을이용하여각각음성인식을수행하는단계; 상기원어민음향모델을이용한음성인식결과값과, 비원어민음향모델을이용한음성인식결과값에대한각각의신뢰도값을측정하는단계; 및상기측정된각각의신뢰도값을비교하여그 결과에따른학습자발음평가점수를계산하여출력하는단계를포함한다.
Abstract translation: 本发明涉及一种基于语音识别的发音评估方法,该方法使用对母语者的特征优化的声音模型和发音模型以及反映非母语者的说话特性的声音模型和发音模型 ,以评估学习者的言语。 根据本发明,该方法包括以下步骤:使用预定的母语者和非母语的扬声器声音模型,以便在用户发音的讲话和语音信号时,对所输入的说话脚本和学习者语音信号进行语音识别 对应于说话脚本; 使用母语言声音模型和非母语者声音模型来测量关于语音识别结果值的可靠性值; 并且根据比较结果比较测量的可靠性值以计算和输出发音评估分数。
-
公开(公告)号:KR1020160008949A
公开(公告)日:2016-01-25
申请号:KR1020150008800
申请日:2015-01-19
Applicant: 한국전자통신연구원
IPC: G06Q50/20
CPC classification number: G06Q50/20
Abstract: 음성대화기반의외국어학습방법및 이를위한장치가개시된다. 본발명에따른음성대화기반의외국어학습장치는학습자가발화한문장을인식하여텍스트로변환하는음성인식부와; 텍스트로변환된발화문장에대한발화의도를추정하고, 상기발화문장을구성하는각 어휘에대한언어학적구조분석을수행하는언어분석및 이해부와; 및추정된발화의도에기초하여상기발화문장에대한응답을생성하고, 언어학적구조분석결과에기초하여상기발화문장에포함되어있는오류를인식하고, 상기오류에대한교정피드백을제공하는대화처리부를포함한다.
Abstract translation: 公开了一种基于口语对话的外语学习方法及其装置。 根据本发明的基于口语对话的外语学习装置包括:语音识别单元,用于识别学习者所讲的句子并将句子转换为文本; 一种语言分析和理解单元,用于估计关于口头句子的语言意图,其被转换成文本并且对于形成口语句子的每个单词进行语言结构分析; 以及对话处理单元,基于所估计的语音意图产生口语句子的答案,基于语言结构分析结果识别包含在口语句中的错误,并为错误提供校正反馈。
-
公开(公告)号:KR1020160004886A
公开(公告)日:2016-01-13
申请号:KR1020140162396
申请日:2014-11-20
Applicant: 한국전자통신연구원
IPC: G10L15/30
Abstract: 모바일단말의마이크로폰을이용한 PC환경에서동작하는음성인식시스템이개시된다. 본발명의일 면에따른모바일기기를이용한음성인식시스템은, 마이크로폰을내장하고, 상기마이크로폰에입력된음성신호를유/무선네트워크로연결된컴퓨터장치로전달하는모바일기기와; 및음성인식을위한응용프로그램이설치되고, 유/무선네트워크로연결된상기모바일기기를음성입력장치로자동으로인식하고, 상기모바일기기로부터전달된음성신호를처리하여음성인식을수행하는컴퓨터장치를포함한다.
Abstract translation: 本发明涉及使用移动终端的麦克风并在PC环境中操作的语音识别系统。 根据本发明的实施例,该系统包括:移动设备,其具有内置麦克风并将输入到麦克风的语音信号传送到通过有线/无线网络连接的计算设备; 并且具有安装在其中的用于语音识别的应用程序的计算设备自动识别通过有线/无线网络连接的移动设备作为语音输入设备,并且处理从移动设备发送的语音信号以执行语音识别操作 。
-
公开(公告)号:KR1020150021283A
公开(公告)日:2015-03-02
申请号:KR1020130098444
申请日:2013-08-20
Applicant: 한국전자통신연구원
IPC: G06Q50/20
Abstract: 스마트 안경을 이용한 외국어 학습 시스템 및 방법을 공개한다. 본 발명은 학습자가 착용 가능한 안경형태로 구현되고, 학습자의 시야에 대응하는 영상을 획득하여 영상 신호를 생성하고, 학습 영상과 합성음을 수신하여 출력하는 스마트 안경, 스마트 안경으로부터 영상 신호를 수신하고, 상기 영상 신호에 포함된 사물에 대한 사물 인식을 수행하고, 인식된 사물에 대응하는 사물 정보를 전송하는 사물 인식 서버 및 사물 인식 서버로부터 사물 정보를 수신하여 사물 정보에 대응하는 외국어 단어로 변환하고, 외국어 단어를 표시하기 위한 학습 영상과 외국어 단어에 대응하는 발음을 합성음으로 생성하여 스마트 안경으로 전송하는 외국어 변환 서버를 포함한다.
Abstract translation: 公开了使用智能眼镜的外语学习系统及其方法。 本发明由可佩带的智能眼镜完成。 本发明包括:用户可以佩戴的智能眼镜,用于通过获取与用户的视图对应的图像并接收和输出学习图像和复合音调来产生图像信号; 物体识别服务器,用于从智能眼镜接收图像信号,对包含在图像信号中的对象进行对象识别,并发送与识别对象相对应的对象信息; 以及外部语言转换服务器,用于从对象识别服务器接收对象信息,将其转换成与对象信息相对应的外来字,产生与外来字和学习图像的发音相对应的复合音,以显示外字 并将其发送到智能眼镜。
-
公开(公告)号:KR1020150014236A
公开(公告)日:2015-02-06
申请号:KR1020130089650
申请日:2013-07-29
Applicant: 한국전자통신연구원
Abstract: 인터랙티브 캐릭터 기반 외국어 학습 장치 및 방법을 공개한다. 본 발명은 학습자가 평상시에 사용하는 언어로 기설정된 생활 언어 및 학습 대상 언어 중 하나로 학습자가 발화하는 음성 입력을 수신하고, 합성음 및 학습 평가 결과 중 적어도 하나를 출력하는 입출력부, 음성 입력을 인가받아 음성 인식을 수행하여 음성 인식 결과 텍스트를 출력하는 음성 인식부, 음성 인식 결과 텍스트를 수신하여 음성 인식 결과 텍스트의 오류를 교정하고 유사 문장을 생성하는 문장 분석 및 교정부, 문장 분석 및 교정부에서 오류가 교정된 음성 인식 결과 텍스트의 언어와 출력 언어가 서로 상이한 경우, 음성 인식 결과 텍스트를 출력 언어에 대응하여 자동 번역하여 자동 번역 텍스트를 생성하는 다국어 자동 번역 모듈, 오류 교정된 음성 인식 결과 텍스트 및 자동 번역 텍스트 중 적어도 하나를 수신하고, 수신된 텍스트에 대응� ��는 음성을 기설정된 인터랙티브 캐릭터의 특성에 따라 합성하여 합성음을 입출력부로 출력하는 다국어 음성 합성 모듈 및 학습자의 언어 사용 능력을 평가하고, 평가 결과를 입출력부로 출력하는 학습 평가부를 포함한다.
Abstract translation: 本发明提供了一种基于交互式角色学习外语的装置和方法,其可以识别由用户产生的本地语言语音或外语语音,并输出翻译的语音,或者可以校正错误或发音并馈送 校正结果回到学习者身上。 公开了一种基于交互式角色学习外语的装置和方法。 根据本发明,外语学习装置包括输入和输出单元,其接收学习者以一种语言在日常语言中产生的语音输入,该日常语言预定为学习者在普通时间使用的语言和要学习的语言, 输出合成语音和学习评估结果中的至少一个; 语音识别单元接收语音输入并执行语音识别以输出语音识别结果文本; 句子分析和校正单元接收语音识别结果文本以纠正语音识别结果文本的错误并产生类似的句子; 多语言自动翻译模块在语言识别结果文本与句子分析和校正单元中已被纠正错误的语言不同时,自动将语音识别结果文本翻译成输出语言,从而自动生成 翻译文字 一种多语言语音合成模块,用于在已经修正了错误的语音识别结果文本和自动翻译的文本中接收至少一个文本,并根据预定的交互式角色的属性来合成与已接收的文本相对应的语音,以输出 合成语音输入输出单元; 以及评估学习者的语言能力并将评估结果输出到输入和输出单元的学习评估单元。
-
公开(公告)号:KR1020130068598A
公开(公告)日:2013-06-26
申请号:KR1020110135888
申请日:2011-12-15
Applicant: 한국전자통신연구원
CPC classification number: G09B19/06 , G09B5/04 , G09B7/04 , G10L15/005 , G10L15/26
Abstract: PURPOSE: A pronunciation evaluation device and a method are provided to evaluate foreign language pronunciations using an acoustic model of a foreign language learner, pronunciations generated using a pronunciation model in which pronunciation errors are reflected, and an acoustic model of a native speaker, thereby increasing the accuracy of the pronunciation generated for the sound of the foreign language learner. CONSTITUTION: A pronunciation evaluation device(100) includes a sound input part(110), a sentence input part(120), a storage part(130), a pronunciation generation part(140), a pronunciation evaluation part(150), and an output part(160). The sound input part receives the sound of a foreign language learner, and the sentence input part receives a sentence corresponding to the sound of the foreign language learner. The storage part stores an acoustic model for the sound of the foreign language learner and a pronunciation dictionary for the sound of the foreign language learner. The pronunciation generation part performs sound recognition based on the acoustic model and pronunciation dictionary for the sound of the foreign language learner stored in the storage part. The pronunciation evaluation part detects the vocalization errors by analyzing the pronunciations for the sound of the foreign language learner. The output part outputs the vocalization errors of the foreign language learner detected from the pronunciation evaluation part. [Reference numerals] (110) Sound input part; (120) Sentence input part; (130) Storage part; (140) Pronunciation generation part; (150) Pronunciation evaluation part; (160) Output part
Abstract translation: 目的:提供一种发音评价装置和方法,以使用外语学习者的声学模型评估外语发音,使用其中反映发音错误的发音模型产生的发音和母语者的声学模型,从而增加 为外语学习者的声音产生的发音的准确性。 发音评价装置(100)包括声音输入部(110),句子输入部(120),存储部(130),发音生成部(140),发音评价部(150) 输出部分(160)。 声音输入部分接收外语学习者的声音,并且句子输入部分接收与外语学习者声音相对应的句子。 存储部分存储外语学习者的声音的声学模型和用于外语学习者的声音的发音词典。 发音生成部基于存储在存储部中的外语学习者的声音的声学模型和发音字典进行声音识别。 发音评价部分通过分析外语学习者的声音发音来检测发音错误。 输出部分输出从发音评价部分检测到的外语学习者的发声错误。 (附图标记)(110)声音输入部; (120)句子输入部分; (130)储存部分; (140)发音生成部分; (150)发音评价部分; (160)输出部分
-
公开(公告)号:KR102204975B1
公开(公告)日:2021-01-19
申请号:KR1020160008167
申请日:2016-01-22
Applicant: 한국전자통신연구원
Abstract: 본발명의일면에따른심층신경망기반음성인식방법은, 음성신호를입력받는단계; 상기음성신호를주파수신호로변환하는단계; 상기주파수신호로이루어진벡터신호와가중치벡터(Weight Vector)와의가중치합(Weighted Sum)으로다음단계은닉층(Hidden Layer)의각 노드에대응하는복수의맥스-풀링(Max-Pooling) 입력노드값을구하는단계; 및상기복수의맥스-풀링입력노드값가운데가장큰 값을상기다음단계은닉층의노드값으로결정하는단계;를포함하되, 상기가중치벡터는시간축래핑정도에기초해결정된임계값을기준으로나눠지는프레임인덱스의범위에따라학습에의해미리설정된기준가중치벡터를주파수밴드인덱스, 프레임길이, 및프레임순서중 적어도하나를인수로하여시간축으로압축하여구하는것을특징으로한다
-
公开(公告)号:KR1020170108622A
公开(公告)日:2017-09-27
申请号:KR1020160032817
申请日:2016-03-18
Applicant: 한국전자통신연구원
Abstract: 본발명은영어말하기의운율및 유창성평가장치및 그방법에관한것으로, 본발명의일실시예에따른영어말하기의운율및 유창성평가장치는, 음성신호로부터인식된발화문장의 '구문별문장종류별억양및 강세패턴'을추출하기위한문장분석부; 상기음성신호로부터추출된억양및 강세의형태정보와, 상기 '구문별문장종류별억양및 강세패턴'을기반으로측정된억양및 강세점수를이용하여운율평가를수행하기위한운율평가부; 상기음성신호로부터통계적유창성특징요소를추출하기위한통계적특징추출부; 및상기운율평가결과와상기통계적유창성특징요소에따라유창성을평가하기위한유창성평가부;를포함한다.
Abstract translation: 本发明涉及一种测量仪,和流畅估计装置和英语语音,米的方法,和流畅性评估装置来说根据本发明,语句”通过从语音信号语句类型语调识别烧制句子的一个实施例 还有一种压力模式; 从语音信号中提取音调和重音的类型的信息,以及用于执行通过声明类型的语调和应力图案基于单元中的“语句测量的语调和重音符号评价韵律评价米; 统计特征提取单元,用于从语音信号中提取统计流畅性特征元素; 并且根据节奏评估的结果和统计流畅性特征元素评估流畅性评估单元。
-
公开(公告)号:KR101740636B1
公开(公告)日:2017-05-26
申请号:KR1020150030920
申请日:2015-03-05
Applicant: 한국전자통신연구원
IPC: G10L15/08
Abstract: 본발명은원어민특성에최적화된음향모델과발음모델뿐아니라비원어민학습자의발성특성이반영된음향모델및 발음모델을사용하여학습자의발음을평가할수 있도록한 음성인식기반발음평가방법에관한것으로, 상기방법은, 발성스크립트와, 발성스크립트에대응되는학습자발음에대한음성신호가입력되면, 입력되는발성스크립트와학습자음성신호를기 설정된원어민음향모델및 비원어민음향모델을이용하여각각음성인식을수행하는단계; 상기원어민음향모델을이용한음성인식결과값과, 비원어민음향모델을이용한음성인식결과값에대한각각의신뢰도값을측정하는단계; 및상기측정된각각의신뢰도값을비교하여그 결과에따른학습자발음평가점수를계산하여출력하는단계를포함한다.
Abstract translation: 本发明涉及一种声学模型和发音模型作为使用以及非天然的学习者的语音特性被反射声学模型和发音模型学习者的基于识别的发音的语音发音的评价方法进行评价优化本质特征,所述 方法,和语音的脚本,当对应于该发出的脚本输入,使用预先设定的语音脚本学习者的语音和学习者的语音信号的语音信号被输入本机声学模型和非天然的声学模型分别进行语音识别, 步骤; 使用本地语音模型和语音识别结果值,使用非本地语音模型来测量语音识别结果值的可靠性值; 并且根据比较结果比较测量的可靠性值并计算和输出学习者的发音评估分数。
-
公开(公告)号:KR101444410B1
公开(公告)日:2014-10-01
申请号:KR1020110135892
申请日:2011-12-15
Applicant: 한국전자통신연구원
Abstract: 본 발명은 학습자의 발성 문장에 의해, 입력되는 음성 신호를 인식하는 음성 인식부; 상기 인식된 음성 신호로부터 음성 특징 정보를 추출하는 음성 특징 추출부; 상기 추출된 음성 특징 정보를 이용하여 상기 음성 신호의 현재 신뢰도 값을 측정하는 음성 신뢰도 측정부; 상기 측정된 현재 신뢰도 값과 과거 측정된 신뢰도 값을 비교하고, 그 비교 결과에 근거하여 임계치 값을 갱신하는 임계치 갱신부; 및 상기 갱신된 임계치 값과 상기 현재 측정된 신뢰도 값을 비교하여, 발음 평가 결과를 제공하는 발음 평가 제공부;를 포함한다.
-
-
-
-
-
-
-
-
-