타국인 발화 음성을 위한 음성 인식 장치

    公开(公告)号:KR101729972B1

    公开(公告)日:2017-04-25

    申请号:KR1020130055449

    申请日:2013-05-16

    Inventor: 오유리 이윤근

    Abstract: 본발명에따른음성인식장치는, 입력된음성에서인식에유용한정보를추출하여특징벡터로변환하는특징추출부; 소정의음향모델을저장하는음향모델데이터베이스; 소정의언어모델을저장하는언어모델데이터베이스; 원어민의발음모델에타국인이범할수 있는문법오류에의해발생하는변이발음이더욱포함된발음모델을저장하는발음모델데이터베이스; 상기특징벡터를토대로상기음향모델데이터베이스, 상기발음모델데이터베이스, 및상기언어모델데이터베이스를이용하여가장확률이높은단어열을찾는탐색부; 및상기탐색부의출력을이용하여상기입력된음성의인식결과를제공하는인식결과출력부를포함하는것을특징으로한다.

    음향 모델 생성 방법 및 그 장치
    12.
    发明授权
    음향 모델 생성 방법 및 그 장치 有权
    用于产生声学模型的方法及其装置

    公开(公告)号:KR101697649B1

    公开(公告)日:2017-01-18

    申请号:KR1020120125935

    申请日:2012-11-08

    Abstract: 음향모델생성방법및 그장치가개시된다. 본발명의일 실시예에따른음향모델생성방법은미리수집된훈련용음성데이터를이용하여음향모델을생성하는단계; 상기생성된상기음향모델과상기훈련용음성데이터에기초하여트리기반상태클러스터링을수행하는단계; 상기트리기반상태클러스터링을통해상태트리를생성하는단계; 및사용자의음성으로부터획득된로그음성데이터와상기생성된상기상태트리를이용하여최종음향모델을생성하는단계를포함하고, 상기수행하는단계는상기훈련용음성데이터로부터획득된문맥종속음소의통계값과음성학적지식기반을통해획득된질문셋에기초하여상기트리기반상태클러스터링을수행함으로써, 실제사용환경에최적화된음향모델을생성하고, 이를통해음성인식성능을개선할수 있다.

    Abstract translation: 公开了一种声学模型生成方法及其装置。 根据本发明的一个实施例,声学模型生成方法包括:使用预先收集的训练声学数据产生声学模型的步骤; 基于所生成的声学模型和训练声学数据执行基于树状态的聚类的步骤; 通过基于树状态聚类形成状态树的步骤; 以及使用从用户的语音和所生成的状态树获取的对数声学数据来生成最终声学模型的步骤。 执行聚类的步骤基于从训练声学数据获取的上下文相关音素的统计值和通过语音知识获取的查询集合来执行基于树状态的聚类,使得可以生成优化的声学模型 为实际使用环境,从而提高语音识别性能。

    잡음 환경에서의 음성 인식을 위한 특징 보상 장치 및 방법
    13.
    发明公开
    잡음 환경에서의 음성 인식을 위한 특징 보상 장치 및 방법 审中-实审
    噪声环境下语音识别的特征补偿装置及方法

    公开(公告)号:KR1020160112793A

    公开(公告)日:2016-09-28

    申请号:KR1020150039098

    申请日:2015-03-20

    CPC classification number: G10L15/20 G10L15/02 G10L21/0216 G10L15/142

    Abstract: 본발명에따른잡음환경에서의음성인식을위한특징보상장치는둘 이상의프레임으로구성된잡음이부가된오염된음성신호로부터음성신호특징정보를추출하는특징추출부, 추출된음성신호특징정보및 보상된음성특징으로부터잡음특징정보를추정하는잡음추정부, 둘이상의프레임으로구성된잡음이부가된오염된음성신호의인접프레임간의상관도를산출하는확률산출부및 오염된음성신호의인접프레임간의상관도및 추정된잡음특징정보를고려하여추출된음성신호특징정보의잡음특징을제거하여상기보상된음성특징을생성하는음성특징보상부를포함한다.

    Abstract translation: 本发明涉及一种在嘈杂环境中进行语音识别的特征补偿装置和方法。 根据本发明的用于噪声环境中的语音识别的特征补偿装置包括:特征提取单元,从已经添加了由两个或更多个帧组成的噪声的污染语音信号中提取语音信号特征信息; 噪声估计单元,其基于所提取的语音信号特征信息和经补偿的语音特征来估计噪声特征信息; 计算与由两个以上的帧组成的噪声相邻的污染语音信号相邻的帧之间的相关性的概率计算单元; 以及语音特征补偿单元,其通过考虑与污染的语音信号相邻的帧与估计的噪声特征信息之间的相关性,从提取的语音信号特征信息中去除噪声特征来生成补偿的语音特征。

    실시간 단어별 지속시간 모델링을 이용한 발화검증 장치 및 방법
    14.
    发明公开
    실시간 단어별 지속시간 모델링을 이용한 발화검증 장치 및 방법 审中-实审
    基于词汇时间的UTTERANCE验证的装置和方法

    公开(公告)号:KR1020160109942A

    公开(公告)日:2016-09-21

    申请号:KR1020150035245

    申请日:2015-03-13

    CPC classification number: G10L15/01 G10L15/06 G10L15/14 G10L15/187

    Abstract: 본발명에따른대용량음성인식시스템의실시간단어별지속시간모델링을이용한발화검증장치는수신된훈련신호의음소별지속시간의평균, 단어별지속시간의평균및 분산을계산하고, 상기단어별지속시간의평균및 분산의관계를회귀분석으로모델링하여회귀모델을생성하는훈련신호관리부, 수신된음성신호를문맥종속음소모델에적용하여음성인식결과를출력하는음성신호처리부및 기설정된단어빈도수의임계치에기초하여상기단어별지속시간의평균및 분산또는음소별지속시간의평균및 회귀모델에기초하여신뢰도측정값을생성하는발화검증부를포함한다.

    Abstract translation: 根据本发明,一种用于在大众语音识别系统中使用实时字持续时间建模的话语验证装置,包括:训练信号管理单元,用于计算音位持续时间的平均值,以及词的平均和方差 接收到的训练信号的持续时间,以及通过使用回归分析来生成回归模型来建模单词持续时间的平均值和方差之间的关系; 语音信号处理单元,用于将接收的语音信号应用于上下文相关音素模型以输出语音识别结果; 以及话音验证单元,用于基于词频的预设阈值来生成词持续时间的平均值和方差,或音素持续时间的平均值,并且基于回归模型生成可靠性测量值。

    음성 대화 기반의 외국어 학습 방법 및 이를 위한 장치
    15.
    发明公开
    음성 대화 기반의 외국어 학습 방법 및 이를 위한 장치 审中-实审
    基于SPOKEN对话的外语学习的装置和方法

    公开(公告)号:KR1020160008949A

    公开(公告)日:2016-01-25

    申请号:KR1020150008800

    申请日:2015-01-19

    CPC classification number: G06Q50/20

    Abstract: 음성대화기반의외국어학습방법및 이를위한장치가개시된다. 본발명에따른음성대화기반의외국어학습장치는학습자가발화한문장을인식하여텍스트로변환하는음성인식부와; 텍스트로변환된발화문장에대한발화의도를추정하고, 상기발화문장을구성하는각 어휘에대한언어학적구조분석을수행하는언어분석및 이해부와; 및추정된발화의도에기초하여상기발화문장에대한응답을생성하고, 언어학적구조분석결과에기초하여상기발화문장에포함되어있는오류를인식하고, 상기오류에대한교정피드백을제공하는대화처리부를포함한다.

    Abstract translation: 公开了一种基于口语对话的外语学习方法及其装置。 根据本发明的基于口语对话的外语学习装置包括:语音识别单元,用于识别学习者所讲的句子并将句子转换为文本; 一种语言分析和理解单元,用于估计关于口头句子的语言意图,其被转换成文本并且对于形成口语句子的每个单词进行语言结构分析; 以及对话处理单元,基于所估计的语音意图产生口语句子的答案,基于语言结构分析结果识别包含在口语句中的错误,并为错误提供校正反馈。

    모바일 기기를 이용한 음성인식 시스템
    16.
    发明公开
    모바일 기기를 이용한 음성인식 시스템 审中-实审
    使用移动终端麦克风的语音识别系统

    公开(公告)号:KR1020160004886A

    公开(公告)日:2016-01-13

    申请号:KR1020140162396

    申请日:2014-11-20

    CPC classification number: G10L15/30 G06F3/167 G10L15/22

    Abstract: 모바일단말의마이크로폰을이용한 PC환경에서동작하는음성인식시스템이개시된다. 본발명의일 면에따른모바일기기를이용한음성인식시스템은, 마이크로폰을내장하고, 상기마이크로폰에입력된음성신호를유/무선네트워크로연결된컴퓨터장치로전달하는모바일기기와; 및음성인식을위한응용프로그램이설치되고, 유/무선네트워크로연결된상기모바일기기를음성입력장치로자동으로인식하고, 상기모바일기기로부터전달된음성신호를처리하여음성인식을수행하는컴퓨터장치를포함한다.

    Abstract translation: 本发明涉及使用移动终端的麦克风并在PC环境中操作的语音识别系统。 根据本发明的实施例,该系统包括:移动设备,其具有内置麦克风并将输入到麦克风的语音信号传送到通过有线/无线网络连接的计算设备; 并且具有安装在其中的用于语音识别的应用程序的计算设备自动识别通过有线/无线网络连接的移动设备作为语音输入设备,并且处理从移动设备发送的语音信号以执行语音识别操作 。

    대화 방법 및 이를 위한 시스템
    17.
    发明授权
    대화 방법 및 이를 위한 시스템 有权
    通信方法和系统

    公开(公告)号:KR101522837B1

    公开(公告)日:2015-05-26

    申请号:KR1020100129360

    申请日:2010-12-16

    CPC classification number: G09B19/06 G09B5/06

    Abstract: 대화방법및 이를위한시스템이개시된다. 사용자로부터교육도메인및 상기교육도메인에서의목표완수조건을수신하고, 사용자로부터발화된사용자발화를수신하는학습시작부, 발화정보를이용하여수신된사용자발화를발화텍스트로변환하는음성인식부, 변환된발화텍스트를이용하여사용자의발화행위를결정하고, 결정된발화행위에해당하는슬롯표현과상기교육도메인에정의된슬롯표현을이용하여논리표현을생성하는언어이해부, 동적대화그래프에서최종시스템발화정점(Vertex)과연결된복수개의발화정점의발화패턴과논리표현이유사한발화정점을결정하여해당발화정점과연결된복수개의발화정점들중 하나의발화정점을다음발화로결정하는대화및 진도관리부, 결정된다음발화에해당하는발화정점과연결된발화패턴들을검색하여시스템발화문장을생성하는시스템대화생성부및 생성된시스템발화문장에음성을합성하여출력하는음성합성부를포함하여구성될수 있다. 따라서, 학습자의학습진행에따라다양한대화흐름이가능하도록제어하여학습자에게다양한영어체험이가능하게하며학습자진도에따라시스템발화수준을제어할수 있다.

    스마트 안경을 이용한 외국어 학습 시스템 및 방법
    18.
    发明公开
    스마트 안경을 이용한 외국어 학습 시스템 및 방법 审中-实审
    使用智能玻璃学习外国语言的系统和方法

    公开(公告)号:KR1020150021283A

    公开(公告)日:2015-03-02

    申请号:KR1020130098444

    申请日:2013-08-20

    CPC classification number: G06Q50/20 G09B19/06 G10L15/22

    Abstract: 스마트 안경을 이용한 외국어 학습 시스템 및 방법을 공개한다. 본 발명은 학습자가 착용 가능한 안경형태로 구현되고, 학습자의 시야에 대응하는 영상을 획득하여 영상 신호를 생성하고, 학습 영상과 합성음을 수신하여 출력하는 스마트 안경, 스마트 안경으로부터 영상 신호를 수신하고, 상기 영상 신호에 포함된 사물에 대한 사물 인식을 수행하고, 인식된 사물에 대응하는 사물 정보를 전송하는 사물 인식 서버 및 사물 인식 서버로부터 사물 정보를 수신하여 사물 정보에 대응하는 외국어 단어로 변환하고, 외국어 단어를 표시하기 위한 학습 영상과 외국어 단어에 대응하는 발음을 합성음으로 생성하여 스마트 안경으로 전송하는 외국어 변환 서버를 포함한다.

    Abstract translation: 公开了使用智能眼镜的外语学习系统及其方法。 本发明由可佩带的智能眼镜完成。 本发明包括:用户可以佩戴的智能眼镜,用于通过获取与用户的视图对应的图像并接收和输出学习图像和复合音调来产生图像信号; 物体识别服务器,用于从智能眼镜接收图像信号,对包含在图像信号中的对象进行对象识别,并发送与识别对象相对应的对象信息; 以及外部语言转换服务器,用于从对象识别服务器接收对象信息,将其转换成与对象信息相对应的外来字,产生与外来字和学习图像的发音相对应的复合音,以显示外字 并将其发送到智能眼镜。

    인터랙티브 캐릭터 기반 외국어 학습 장치 및 방법
    19.
    发明公开
    인터랙티브 캐릭터 기반 외국어 학습 장치 및 방법 审中-实审
    基于互动字符学习外语的装置和方法

    公开(公告)号:KR1020150014236A

    公开(公告)日:2015-02-06

    申请号:KR1020130089650

    申请日:2013-07-29

    Abstract: 인터랙티브 캐릭터 기반 외국어 학습 장치 및 방법을 공개한다. 본 발명은 학습자가 평상시에 사용하는 언어로 기설정된 생활 언어 및 학습 대상 언어 중 하나로 학습자가 발화하는 음성 입력을 수신하고, 합성음 및 학습 평가 결과 중 적어도 하나를 출력하는 입출력부, 음성 입력을 인가받아 음성 인식을 수행하여 음성 인식 결과 텍스트를 출력하는 음성 인식부, 음성 인식 결과 텍스트를 수신하여 음성 인식 결과 텍스트의 오류를 교정하고 유사 문장을 생성하는 문장 분석 및 교정부, 문장 분석 및 교정부에서 오류가 교정된 음성 인식 결과 텍스트의 언어와 출력 언어가 서로 상이한 경우, 음성 인식 결과 텍스트를 출력 언어에 대응하여 자동 번역하여 자동 번역 텍스트를 생성하는 다국어 자동 번역 모듈, 오류 교정된 음성 인식 결과 텍스트 및 자동 번역 텍스트 중 적어도 하나를 수신하고, 수신된 텍스트에 대응� ��는 음성을 기설정된 인터랙티브 캐릭터의 특성에 따라 합성하여 합성음을 입출력부로 출력하는 다국어 음성 합성 모듈 및 학습자의 언어 사용 능력을 평가하고, 평가 결과를 입출력부로 출력하는 학습 평가부를 포함한다.

    Abstract translation: 本发明提供了一种基于交互式角色学习外语的装置和方法,其可以识别由用户产生的本地语言语音或外语语音,并输出翻译的语音,或者可以校正错误或发音并馈送 校正结果回到学习者身上。 公开了一种基于交互式角色学习外语的装置和方法。 根据本发明,外语学习装置包括输入和输出单元,其接收学习者以一种语言在日常语言中产生的语音输入,该日常语言预定为学习者在普通时间使用的语言和要学习的语言, 输出合成语音和学习评估结果中的至少一个; 语音识别单元接收语音输入并执行语音识别以输出语音识别结果文本; 句子分析和校正单元接收语音识别结果文本以纠正语音识别结果文本的错误并产生类似的句子; 多语言自动翻译模块在语言识别结果文本与句子分析和校正单元中已被纠正错误的语言不同时,自动将语音识别结果文本翻译成输出语言,从而自动生成 翻译文字 一种多语言语音合成模块,用于在已经修正了错误的语音识别结果文本和自动翻译的文本中接收至少一个文本,并根据预定的交互式角色的属性来合成与已接收的文本相对应的语音,以输出 合成语音输入输出单元; 以及评估学习者的语言能力并将评估结果输出到输入和输出单元的学习评估单元。

    음성인식을 이용한 외국어 말하기 능력의 훈련 및 평가 방법과 그 장치
    20.
    发明公开
    음성인식을 이용한 외국어 말하기 능력의 훈련 및 평가 방법과 그 장치 审中-实审
    使用语音识别来评估和培训外国语言语音能力的系统和方法

    公开(公告)号:KR1020150001189A

    公开(公告)日:2015-01-06

    申请号:KR1020130073987

    申请日:2013-06-26

    Abstract: 본 발명은 음성인식을 이용한 외국어 말하기 능력 훈련 및 평가 방법에 관한 것으로, 보다 상세하게는 컴퓨터 또는 기타 측정장치를 이용하여 외국어 말하기 능력을 사용자 스스로 훈련하고 평가하는 방법에 관한 것이다.
    본 발명의 음성인식을 이용한 외국어 말하기 능력 훈련 및 평가 방법은 제1사용자로부터 발성된 외국어 음성신호를 입력 받는 단계, 입력 받은 음성신호를 레코딩하는 단계, 레코딩된 음성신호를 재생하여 제2사용자에게 제공하는 단계, 제공된 음성신호에 대응되는 텍스트 데이터를 제2사용자로부터 입력 받는 단계, 입력 받은 텍스트 데이터와 상기 레코딩된 음성신호를 비교하여 정확도를 측정하는 단계, 및 측정된 정확도에 따른 평가결과를 상기 제1사용자에게 제공하는 단계를 포함한다.

    Abstract translation: 本发明涉及使用语音识别的外语能力的训练和评估方法,更具体地,涉及一种允许用户通过使用计算机亲自训练和评估外语能力的方法, 其他测量设备。 根据本发明,使用语音识别的使用外语的能力的训练和评估方法包括以下步骤:接收从第一用户发音的外语的语音信号; 记录已经接收到的语音信号; 再生已经记录的语音信号并向第二用户提供语音信号; 接收与从第二用户提供的语音信号对应的文本数据; 比较已经接收的文本数据和已记录的语音信号来测量精度; 并根据测量的精度向第一用户提供评估结果。

Patent Agency Ranking