Patent search ap:("한국전자통신연구원") AND inv:"강병옥" Page 5

41.

发明公开
혼동 행렬 기반 발화 검증 방법 및 장치 失效
Title translation: 基于混沌矩阵的验证方法和装置

公开(公告)号：KR1020090055320A

公开(公告)日：2009-06-02

申请号：KR1020070122185

申请日：2007-11-28

Applicant: 한국전자통신연구원

Inventor： 강점자 , 이윤근 , 강병옥 , 김갑기 , 이성주 , 전형배 , 정호영 , 조훈영 , 박전규 , 정훈

IPC: G10L15/01 , G10L15/10 , G10L15/187

Abstract: A confusion matrix based utterance verification method and an apparatus thereof are provided to select a phoneme with high discrimination by using a probability value of a confusion matrix as a weight for a likelihood value of a mono phone model. By performing viterbi decoding by using a context dependent phoneme mode, an inputted voice is recognized(307). A likelihood value of each phoneme, included in a pre-trained context independence phoneme model, and each phoneme, included in the voice-recognized character string as a voice recognition result, is calculated(309). Reliability for the voice-recognized character string is measured based on the calculated likelihood value of each phoneme and the pre-calculated probability value of the confusion matrix(311). It is determined whether to grant or reject the voice-recognized character string based on the measured reliability(313,315,317).

Abstract translation: 提供了一种基于混淆矩阵的话音验证方法及其装置，通过使用混淆矩阵的概率值作为单声道电话机型的似然值的权重来选择具有高辨别力的音素。通过使用与上下文相关的音素模式进行维特比解码，识别输入的语音（307）。计算包括在预先训练的上下文独立音素模型中的每个音素的可能性值，以及包括在作为语音识别结果的语音识别字符串中的每个音素（309）。基于所计算的每个音素的似然值和混淆矩阵的预先计算的概率值来测量语音识别字符串的可靠性（311）。确定是否基于测量的可靠性来授予或拒绝语音识别的字符串（313,315,317）。

42.

发明授权
대화체 및 낭독체 대어휘 연속음성인식시스템의 고빈도어휘열 인식단위 생성장치 및 그 방법 有权
Title translation: 一种用于生成连续语音识别系统的高频词汇热识别单元的设备及其方法

公开(公告)号：KR100614933B1

公开(公告)日：2006-08-25

申请号：KR1020050041497

申请日：2005-05-18

Applicant: 한국전자통신연구원

Inventor： 강병옥 , 박준

IPC: G10L15/08

Abstract: 본 발명은 고빈도 의사형태소열을 하나의 인식단위로 활용하여, 의사형태소와 어절의 중간형태의 인식단위를 생성하도록 하는 대화체 및 낭독체 대어휘 연속음성인식시스템의 고빈도 어휘열 인식단위 생성장치 및 그 방법에 관한 것이다. 이와 같은 본 발명은 의사형태소 태깅된 텍스트 코퍼스로부터 연속된 어휘쌍 빈도정보를 추출하는 빈도정보 추출부(301)와, 상기 빈도정보 추출부(301)에서 추출된 빈도정보와 상기 각 어휘쌍의 길이정보을 바탕으로 결합할 어휘셋을 선정하는 결합 어휘셋 선정부(302)와, 상기 결합 어휘셋 선정부(302)에서 선정된 어휘셋을 기반으로 상기 텍스트 코퍼스를 수정한 후, 고빈도 연속 어휘쌍을 하나로 결합하여 수정된 텍스트 코퍼스를 생성하는 의사형태소 결합 정보 수정부(303)와, 상기 의사형태소 결합 정보 수정부(303)에서 생성된 텍스트 코퍼스를 바탕으로 고빈도 어휘열 인식단위를 생성하는 인식단위 생성부(304)로 구성된다.
대화체 및 낭독체 대어휘, 텍스트 코퍼스, 어휘사전, 언어모델, 발음사전

Abstract translation: 本发明是一种高频伪梗打开一个作为识别单位，决定梗与会话和读取身体大词汇量连续语音识别系统的高频词汇热生成Eojeol识别单元生成单元的识别单元的中间形式及其方法。本发明提取用于提取从医生形态学标记文本语料库（301）连续的由频率信息提取部301提取出的词汇对频率的信息，和所述频率信息的长度及相应的词汇对的频率信息组合词汇集选择单元302，用于基于由组合词汇集选择单元302选择的信息和词汇集来选择要组合的词汇集; 一个组合要以生成修改的文本语料库医生词素组合信息单元303和伪词素组合信息校正基于在303与高识别产生的文本语料库来生成的频率词汇热识别单元单元生成单元304。

43.

发明授权
다중 발음사전을 이용한 대화체 연속 음성인식 시스템 및방법 有权
Title translation: 自发连续语音识别系统和使用多重发音词典的方法

公开(公告)号：KR100484493B1

公开(公告)日：2005-04-20

申请号：KR1020020079264

申请日：2002-12-12

Applicant: 한국전자통신연구원

Inventor： 강병옥

IPC: G10L15/183 , G10L15/06 , G10L15/00

Abstract: 본 발명은 다중 발음사전을 이용한 대화체 연속 음성인식 시스템 및 방법에 관한 것으로서, 더 상세하게는 대화체 연속음성인식 과정에서 사용되는 발음사전이 일반적인 발음변이를 포용하도록 한 다중 발음사전의 개념을 확장하여 대화체 발화에 빈번하게 나타나는 불규칙한 발음변이 현상을 포용하도록 확장된 발음사전을 적용하여 대화체 연속 음성인식에서 인식성능을 향상시키고, 정형화된 출력패턴을 얻을 수 있도록 한 다중 발음사전을 이용한 대화체 연속 음성인식 시스템 및 방법에 관한 것이다.
즉, 본 발명은 대화체에서 나타나는 음운 축약, 음운 탈락, 전형적인 오발화, 발화 오류 등을 발음사전에 수용할 때 각각의 대표어휘에 대한 변이발음으로 처리하고; 언어모델과 어휘사전은 대표어휘만을 이용해 구성하도록 하며; 음성인식기의 탐색부에서는 각각의 변이발음의 발음열도 탐색하되 대표어휘로 언어모델을 참조하도록 하고, 인식결과를 출력하도록 함으로써, 음성인식 성능을 향상시키고, 정형화된 출력패턴을 얻을 수 있도록 한다.

44.

发明授权
음성인식 장치 및 방법 有权

公开(公告)号：KR102069699B1

公开(公告)日：2020-01-23

申请号：KR1020160005755

申请日：2016-01-18

Applicant: 한국전자통신연구원

Inventor： 강병옥 , 박전규 , 송화전 , 이윤근 , 정의석

IPC: G10L15/16 , G10L15/06 , G10L15/14 , G10L17/04

45.

发明授权
음향모델 생성 장치 및 방법 有权

公开(公告)号：KR101971696B1

公开(公告)日：2019-04-25

申请号：KR1020160158129

申请日：2016-11-25

Applicant: 한국전자통신연구원

Inventor： 강병옥 , 박전규 , 오유리 , 이성주 , 이윤근

IPC: G10L15/183 , G10L17/04 , G06F17/28

46.

发明公开
자연어 음성인식의 성능향상을 위한 데이터 증강방법 审中-实审
Title translation: 提高自然语音识别性能的数据增强方法

公开(公告)号：KR1020170107283A

公开(公告)日：2017-09-25

申请号：KR1020160031050

申请日：2016-03-15

Applicant: 한국전자통신연구원

Inventor： 이성주 , 강병옥 , 송화전 , 정호영 , 정훈

IPC: G10L15/16 , G10L15/18 , G10L15/20 , G10L15/06 , G10L15/04

Abstract: 심층신경망기반의음성인식시스템에서자연어음성인식의성능향상을위한데이터증강방법이개시된다. 심층신경망기반의음성인식시스템에서자연어음성인식의성능향상을위한데이터증강방법은, 자연어발화변이특성중 발화속도변이에대한음성데이터를증강시키는단계와, 상기자연어발화변이특성중 부정확한발음에대한음성데이터를증강시키는단계및 상기발화속도변이와부정확한발음에대하여증강된음성데이터를이용하여심층신경망기반의음성인식시스템을학습하는단계를포함한다. 따라서, 음성인식시스템의성능을향상시킬수 있다.

Abstract translation: 公开了一种用于增强基于深度神经网络的语音识别系统中的自然语言语音识别的性能的数据增强方法。用于改进的自然语言语音识别性能在深度基于神经网络的语音识别系统，包括加强对所述自然语言话语的变化特性的发声速度变化的声音数据的步骤，对于所述自然语言话语的变化特性的子正确的发音数据增强方法基于神经网络使用针对语速变化和不正确发音的增强语音数据来增强语音数据并学习语音识别系统。因此，可以提高语音识别系统的性能。

47.

发明公开
심층 신경망 기반 음성인식 방법 및 그 장치 审中-实审
Title translation: 基于深度神经网络的语音识别方法和装置

公开(公告)号：KR1020170088165A

公开(公告)日：2017-08-01

申请号：KR1020160008167

申请日：2016-01-22

Applicant: 한국전자통신연구원

Inventor： 전형배 , 송화전 , 강병옥 , 오유리

IPC: G10L15/16 , G10L15/02 , G10L15/20 , G10L25/30

Abstract: 본발명의일면에따른심층신경망기반음성인식방법은, 음성신호를입력받는단계; 상기음성신호를주파수신호로변환하는단계; 상기주파수신호로이루어진벡터신호와가중치벡터(Weight Vector)와의가중치합(Weighted Sum)으로다음단계은닉층(Hidden Layer)의각 노드에대응하는복수의맥스-풀링(Max-Pooling) 입력노드값을구하는단계; 및상기복수의맥스-풀링입력노드값가운데가장큰 값을상기다음단계은닉층의노드값으로결정하는단계;를포함하되, 상기가중치벡터는학습에의해미리설정된기준가중치벡터를시간축으로압축하여구하는것을특징으로한다

Abstract translation: 根据本发明的一个方面，提供了一种基于深度语音神经网络的语音识别方法，包括：接收语音信号; 将语音信号转换成频率信号; 矢量信号，并用以下步骤隐藏层（隐蔽层）对应于uigak由汇集（MAX-池）步骤以获得所述输入节点值的频率信号的节点的多个最大的权重向量（权重矢量）与加权和（加权和）。和多个最大 - 确定所述合并的输入节点值，以下面的步骤的节点值中的最大值：隐藏;由所述加权矢量是通过学习时间轴，包括压缩到预定的基准的权重向量被获取，但特征

48.

发明公开
음성인식 장치 및 방법 审中-实审
Title translation: 语音识别装置和方法

公开(公告)号：KR1020170086214A

公开(公告)日：2017-07-26

申请号：KR1020160005755

申请日：2016-01-18

Applicant: 한국전자통신연구원

Inventor： 강병옥 , 박전규 , 송화전 , 이윤근 , 정의석

IPC: G10L15/16 , G10L15/06 , G10L15/14 , G10L17/04

CPC classification number: G10L15/16 , G10L15/063 , G10L15/07 , G10L2015/022 , G10L2015/0636

Abstract: 본발명에따른심층신경망음향모델에기초한음성인식장치는메모리및 상기메모리에저장된프로그램을실행시키는프로세서를포함하되, 상기프로세서는상기프로그램을실행시킴에따라, 다중집합훈련음성데이터에포함된복수의집합훈련음성데이터각각에대응하는음향모델상태집합을생성하고, 상기음향모델상태집합으로부터다중집합상태클러스터를생성하며, 상기다중집합훈련음성데이터를입력노드로설정하고, 상기다중집합상태클러스터를출력노드로설정하여, 심층신경망구조파라미터를학습하며, 사용자인터페이스를통해사용자의음성및 상기음성의특성정보를입력받으면, 상기다중집합훈련음성데이터중 상기음성의특성정보에대응하는집합훈련음성데이터를입력노드로설정하고, 상기집합훈련음성데이터에대응하는음향모델상태집합을출력노드로설정하여, 상기학습된심층신경망구조파라미터에기초하여사용자의음성을인식한다.

Abstract translation: 根据本发明的基于深度神经网络声学模型的语音识别设备包括存储器和用于执行存储在存储器中的程序的处理器，其中处理器执行程序以产生多个生成与每个设置的训练声音数据相对应的一组声学模型状态，从声学模型状态组生成多组状态组，将多组训练声音数据设置为输入节点，训练数据节点，学习神经网络结构参数，通过用户界面接收用户的语音和语音的特征信息;然后，将多语言训练数据中与语音特征信息对应的训练语音数据集合，并将与所设置的训练语音数据对应的一组声学模型状态设置到输出节点任命，并认识基础上，深入学习神经网络结构参数的用户的声音。

49.

发明授权
음향 모델 생성 방법 및 그 장치 有权
Title translation: 用于产生声学模型的方法及其装置

公开(公告)号：KR101697649B1

公开(公告)日：2017-01-18

申请号：KR1020120125935

申请日：2012-11-08

Applicant: 한국전자통신연구원

Inventor： 강병옥 , 전형배 , 정호영 , 박전규 , 이윤근

IPC: G10L15/14 , G10L15/06

Abstract: 음향모델생성방법및 그장치가개시된다. 본발명의일 실시예에따른음향모델생성방법은미리수집된훈련용음성데이터를이용하여음향모델을생성하는단계; 상기생성된상기음향모델과상기훈련용음성데이터에기초하여트리기반상태클러스터링을수행하는단계; 상기트리기반상태클러스터링을통해상태트리를생성하는단계; 및사용자의음성으로부터획득된로그음성데이터와상기생성된상기상태트리를이용하여최종음향모델을생성하는단계를포함하고, 상기수행하는단계는상기훈련용음성데이터로부터획득된문맥종속음소의통계값과음성학적지식기반을통해획득된질문셋에기초하여상기트리기반상태클러스터링을수행함으로써, 실제사용환경에최적화된음향모델을생성하고, 이를통해음성인식성능을개선할수 있다.

Abstract translation: 公开了一种声学模型生成方法及其装置。根据本发明的一个实施例，声学模型生成方法包括：使用预先收集的训练声学数据产生声学模型的步骤; 基于所生成的声学模型和训练声学数据执行基于树状态的聚类的步骤; 通过基于树状态聚类形成状态树的步骤; 以及使用从用户的语音和所生成的状态树获取的对数声学数据来生成最终声学模型的步骤。执行聚类的步骤基于从训练声学数据获取的上下文相关音素的统计值和通过语音知识获取的查询集合来执行基于树状态的聚类，使得可以生成优化的声学模型为实际使用环境，从而提高语音识别性能。

50.

发明公开
음성인식 성능향상 방법 审中-实审
Title translation: 语音识别性能改进方法

公开(公告)号：KR1020140077422A

公开(公告)日：2014-06-24

申请号：KR1020120146227

申请日：2012-12-14

Applicant: 한국전자통신연구원

Inventor： 이성주 , 강병옥 , 정훈 , 이윤근

IPC: G10L15/14

CPC classification number: G10L15/14 , G10L19/038 , G10L21/02 , G10L2015/025

Abstract: A method for improving a voice recognition performance according to an embodiment of the present invention is provided to improve a voice recognition performance for a voice inputted under noise circumstances based on at least a single voice recognition feature vector. The method for improving a voice recognition performance according to an embodiment of the present invention includes the steps of: extracting at least two or more feature vectors according to at least two or more sound models which are set by each phoneme for an inputted Korean voice; extracting an observation probability value by each phoneme through the previous feature vectors of at least two or more sound models and at least two or more feature vectors which are preset for an integrated sound model activated in a viterbi decoder; and resetting the integrated sound model based on the extracted observation probability value by each phoneme, and re-recognizing the Korean voice by each phoneme.

Abstract translation: 提供了根据本发明的实施例的用于提高语音识别性能的方法，用于基于至少单个语音识别特征向量来改善在噪声环境下输入的语音的语音识别性能。根据本发明实施例的用于提高语音识别性能的方法包括以下步骤：根据由输入的韩语语音的每个音素设置的至少两个或多个声音模型提取至少两个或更多个特征向量; 通过至少两个或多个声音模型的先前特征向量和至少两个或更多个为维特比解码器中激活的综合声音模型预设的特征向量提取每个音素的观测概率值; 并根据每个音素提取的观察概率值重新设置综合声音模型，并通过每个音素重新识别韩语声音。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification