Patent search ap:("한국전자통신연구원") AND inv:"김종진" Page 4

31.

发明公开
발화 검증 장치 및 그 방법 有权
Title translation: UTTERANCE验证装置及其方法

公开(公告)号：KR1020100062824A

公开(公告)日：2010-06-10

申请号：KR1020090026297

申请日：2009-03-27

Applicant: 한국전자통신연구원

Inventor： 정훈 , 이윤근 , 박전규 , 정호영 , 전형배 , 이성주 , 강점자 , 정의석 , 왕지현 , 김종진 , 강병옥 , 박기영

IPC: G10L15/10 , G10L15/01 , G10L15/02 , G10L15/04

Abstract: PURPOSE: An utterance verification apparatus and a method thereof are provided, which can improve the reliability about the voice recognition result by performing the whole utterance verification about the word after the performance of the partial utterance verification about each sub word. CONSTITUTION: A sub word likelihood ratio calculator(204) calculates the sub word likelihood ratio about the divided sub word. A likelihood ratio weight applying unit(206) applies the weighted value of likelihood ratio according to the recognition reliability to the calculated sub word likelihood ratio. A word likelihood ratio calculator(208) calculates the word likelihood ratio by using the sub word likelihood ratio. A speech verification decision unit(210) decides the output of the word after the utterance verification with the calculated word likelihood ratio.

Abstract translation: 目的：提供一种话语验证装置及其方法，通过在关于每个子字的部分话语验证之后执行关于该单词的整个话语验证，可提高语音识别结果的可靠性。构成：子字似然比计算器（204）计算关于分割子字的子字似然比。似然比权重赋予单元（206）将识别可靠性的似然比的加权值应用于计算出的子字似然比。字似然比计算器（208）通过使用子字似然比来计算字似然比。语音验证判定单元（210）用所计算的字似然比来确定在话语验证之后的单词的输出。

32.

发明授权
３차원 아바타 생성 기능을 구비한 이동통신 단말기 및３차원 아바타 생성 방법 失效
Title translation: 具有创建3D AVATA模型功能的移动通信终端及其方法

公开(公告)号：KR100912877B1

公开(公告)日：2009-08-18

申请号：KR1020070123247

申请日：2007-11-30

Applicant: 한국전자통신연구원

Inventor： 김종진

IPC: H04B1/40

Abstract: 본 발명은 이동통신 단말기의 카메라로 촬영한 얼굴 화상을 이용하여 실제 인물을 모델로 하는 3차원 아바타를 생성할 수 있는 장치 및 방법에 관한 것으로, 3차원 아바타 생성을 위한 표준 3차원 얼굴 모델을 저장하고 있는 메모리와; 이동통신 단말기의 카메라를 통해 획득된 정면 얼굴 이미지와 측면 얼굴 이미지를 조합하는 영상처리부와; 상기 메모리에 저장되어 있는 상기 표준 3차원 얼굴모델 및 상기 영상처리부로부터 조합된 정면 얼굴 이미지와 측면 얼굴 이미지를 이용하여 3차원 아바타 모델을 생성하는 3D 모델변환부와; 상기 3D 모델변환부에서 생성된 3차원 아바타 모델과 추가로 입력되는 텍스트 혹은 음성을 조합하여 3차원 아바타 애니메이션 데이터를 생성하는 애니메이션 조합부와; 상기 애니메이션 조합부에서 생성된 복수개의 3차원 아바타 애니메이션 데이터들을 조합·편집하여 애니메이션 데이터를 생성하는 애니메이션 데이터 생성부를 포함하여 구성된다.
3차원 아바타, 얼굴 화상,애니메이션, 컨텐츠, 얼굴 모델

33.

发明公开
외래어 판별 방법 无效
Title translation: 分类外语的方法

公开(公告)号：KR1020050036300A

公开(公告)日：2005-04-20

申请号：KR1020030071934

申请日：2003-10-15

Applicant: 한국전자통신연구원

Inventor： 김종진 , 이영직 , 김상훈

IPC: G10L13/06

Abstract: 본 발명은 텍스트를 입력받아 그에 대응하는 합성 음성을 출력하는 음성합성 분야, 음성합성 데이터베이스 알고리즘 등에 적용 가능한 외래어 판별 방법에 관한 것이다. 본 발명의 외래어 판별 방법에 따르면, 입력 문장을 띄어쓰기 단위로 어절열로 변환하고, 각 어절에 대해서 형태소 분석 과정을 거쳐 미등록어를 검출하며, 해당 미등록어에 대해 한국어에서 음소 unigram, bigram, trigram, 음절 unigram의 출현 확률과 외래어에서 음소 unigram, bigram, trigram, 음절 unigram의 출현 확률을 이용하여 한국어인지 외래어인지 판별한다.

34.

发明公开
판별 및 회귀 트리를 이용한 끊어읽기 강도 자동 레이블링방법 失效
Title translation: 使用分类和回归树自动标记断裂强度的方法

公开(公告)号：KR1020030033628A

公开(公告)日：2003-05-01

申请号：KR1020010065703

申请日：2001-10-24

Applicant: 한국전자통신연구원

Inventor： 김상훈 , 김종진 , 이영직

IPC: G10L13/06

Abstract: PURPOSE: A method for automatically labeling break strength using a classification and regression tree is provided to increase speed of labeling break strength and improve the accuracy of labeling break strength. CONSTITUTION: Voice data is received in sentences to be recorded(S11-S12). Phonemes are divided and accent is extracted from the input voice data(S13-S14). Phoneme duration and an accent value corresponding to the phoneme are extracted to extract the mean duration by phonemes and the mean accent of a speaker(S15). Seven rhythmical features are extracted by using phoneme division information and the accent value(S16). The extracted seven rhythmical features are normalized as a final mean value(S17). A result of labeling break manually is obtained(S18). A training of a classification and regression tree is executed by using the rhythmical features and the result of labeling break manually(S19). A cross confirming test is performed to measure the accuracy of labeling break strength(S20). A break strength automatic labeling rule is generated by a binary decision tree(S21). A program is terminated(S22).

Abstract translation: 目的：提供一种使用分类和回归树自动标记断裂强度的方法，以提高标签断裂强度的速度，提高标签断裂强度的准确性。构成：在要记录的句子中接收语音数据（S11-S12）。音素被分割，并且从输入语音数据中提取口音（S13-S14）。提取音素持续时间和对应于音素的重音值，以通过音素和扬声器的均匀音调提取平均持续时间（S15）。通过使用音素分割信息和重音值提取七个节奏特征（S16）。提取的七个节奏特征被归一化为最终平均值（S17）。获得手动标记断裂的结果（S18）。通过使用节奏特征和手动标记中断的结果来执行分类和回归树的训练（S19）。执行交叉确认测试以测量标签断裂强度的准确性（S20）。由二进制决策树产生断裂强度自动标记规则（S21）。程序终止（S22）。

35.

发明授权
복수개의 인식 결과를 생성하기 위한 음성 인식 장치 有权
Title translation: 用于产生N-Best的装置导致语音识别

公开(公告)号：KR101341644B1

公开(公告)日：2013-12-16

申请号：KR1020090127819

申请日：2009-12-21

Applicant: 한국전자통신연구원

Inventor： 전형배 , 박전규 , 정훈 , 정호영 , 강점자 , 이성주 , 이윤근 , 강병옥 , 박기영 , 정의석 , 왕지현 , 김종진 , 박상규

IPC: G10L15/183 , G10L15/28

Abstract: 본발명에따른연속어음성인식장치는, 음향모델및 언어모델을이용하여입력음성데이터의음성인식을수행하고상기입력음성데이터와가장유사한단어열을인식결과로출력하는연속어음성인식부와, 상기연속어음성인식부로부터출력된인식결과를발음사전을참조하여음소열로변환하는음소열변환부와, 상기음소열로변환된인식결과에기반하여상기언어모델로부터상기인식결과와음소열거리가근접한복수개의단어열을탐색하는음소열기반탐색부를포함한다.

36.

发明授权
음성 인식 장치 및 방법 有权
Title translation: 语音识别装置及其方法

公开(公告)号：KR101329281B1

公开(公告)日：2013-11-13

申请号：KR1020100104894

申请日：2010-10-26

Applicant: 한국전자통신연구원

Inventor： 박전규 , 정훈 , 전형배 , 정의석 , 김종진 , 정호영 , 강병옥 , 강점자 , 박기영 , 이성주 , 이윤근 , 송화전

IPC: G10L15/14

Abstract: 본 발명에 따른 음성 인식 장치는, 전역 특징 벡터, 전역 어휘 모델, 및 전역 음향 모델로 구성된 전역 데이터베이스부; 복수의 개별 인식부로 구성된 인식부; 상기 각 개별 인식부들에 각기 대응하는 복수의 개별 언어 모델로 구성된 개별 데이터베이스부; 및 상기 각 개별 인식부들의 인식결과를 수집하고 평가하는 수집평가부를 포함하고, 상기 개별 인식부 각각은, 상기 전역 특징 벡터, 상기 전역 어휘 모델, 상기 전역 음향 모델, 및 상기 대응하는 개별 언어 모델만을 이용하여 입력신호를 인식할 수 있다. 본 발명은 음성 인식의 인식 속도를 향상시키고, 언어 모델 적용범위를 제고하는 효과가 있다.

37.

发明授权
고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치 失效
Title translation: 用于隔离词识别结果的UTTERANCE验证方法和设备

公开(公告)号：KR101217524B1

公开(公告)日：2013-01-18

申请号：KR1020080131755

申请日：2008-12-22

Applicant: 한국전자통신연구원

Inventor： 강점자 , 이윤근 , 박전규 , 정호영 , 전형배 , 정훈 , 이성주 , 정의석 , 왕지현 , 강병옥 , 박기영 , 김종진

IPC: G10L15/02 , G10L15/08 , G10L15/20

CPC classification number: G10L15/187 , G10L15/10

Abstract: 본 발명은 고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치에 있어서, 엔베스트 음성인식을 통해 단어수준에서 인식된 결과에 대해 엔베스트 발화검증을 통해서 신뢰도를 측정하고, 동적 시간 와핑에 의한 음소간 유사도를 측정하여 신뢰도와 유사도를 기반으로 음성인식의 수락/거절 또는 판단불가 등을 표시함으로써 보다 신뢰성 높은 음성인식이 가능하도록 한다.
엔베스트, 발화검증, 음성, 인식, 신뢰도, 유사도

38.

发明公开
코퍼스 오류 교정 장치 및 그 방법 无效
Title translation: 用于纠正股票错误的装置和方法

公开(公告)号：KR1020120045906A

公开(公告)日：2012-05-09

申请号：KR1020100107785

申请日：2010-11-01

Applicant: 한국전자통신연구원

Inventor： 정의석 , 전형배 , 김종진 , 박전규

IPC: G06F17/27

CPC classification number: G06F17/273

Abstract: PURPOSE: A corpus error correcting device and a method thereof are provided to correct an error and analyze a morpheme by domain words which are collected by a target corpus. CONSTITUTION: A domain word reflecting unit(140) analyzes domain words of an inputted corpus based on domain word data. A morpheme word analyzing and reflecting unit(150) analyzes a morpheme of a corpus in which the domain words are analyzed. An error correcting unit(160) corrects word spacing errors of an analyzed corpus based on a language model.

Abstract translation: 目的：提供语料库纠错装置及其方法，以纠正错误，并通过由目标语料库收集的域词来分析语素。构成：域字反映单元（140）基于域字数据分析输入语料库的域字。语素词分析和反映单元（150）分析语域的语素，其中分析域词。纠错单元（160）基于语言模型来校正分析语料库的字间隔误差。

39.

发明授权
연속 숫자의 음성 인식에 있어서 혼동행렬과 신뢰도치 기반의 다중 인식후보 생성 장치 및 방법 有权
Title translation: 基于混合矩阵和连续数字语音识别中的置信度度量生成N最优假设的装置和方法

公开(公告)号：KR101095864B1

公开(公告)日：2011-12-21

申请号：KR1020090027532

申请日：2009-03-31

Applicant: 한국전자통신연구원

Inventor： 박전규 , 이윤근 , 정호영 , 강병옥 , 이성주 , 박기영 , 정훈 , 왕지현 , 김종진 , 전형배 , 정의석 , 강점자

IPC: G10L15/06 , G10L15/10 , G10L15/28

Abstract: 본 발명은 연속으로 발성되는 한국어 숫자음성에 대한 음성인식을 수행하여 그 인식 결과에 대해 혼동행렬과 신뢰도 치에 기반하여 다수의 음성인식 후보를 생성하는 기술에 관한 것으로, 혼동행렬은 숫자음성에 대해 오인식이 발생하는 숫자들로 구성되므로, 사전에 실험용 데이터베이스를 사용하여 인식을 수행한다. 또한 음성인식의 결과로 도출되는 숫자별 인식 점수인 통계적 우도를 그 단어의 지속시간 지수인 프레임 수로 나눈 로그 우도비를 신뢰도 치로써 사용하는 것을 특징으로 한다. 본 발명에 의하면, 음성인식 알고리즘에서 성능의 저하 없이 N-best를 생성하기 위해 사용하는 기억장치 사용량과 탐색시간을 절약함으로써 음성인식 엔진의 효율을 높일 수 있다.
음성인식, 숫자음성, N-best, 신뢰도치, 혼동행렬

40.

发明授权
음성/음악 판별장치 및 방법 失效
Title translation: 从音乐中辨认语音的装置和方法

公开(公告)号：KR101073934B1

公开(公告)日：2011-10-17

申请号：KR1020080131759

申请日：2008-12-22

Applicant: 한국전자통신연구원

Inventor： 이성주 , 이윤근 , 강병옥 , 강점자 , 김종진 , 박기영 , 박전규 , 왕지현 , 전형배 , 정의석 , 정호영 , 정훈

IPC: G10L25/81 , G10L25/03

Abstract: 본발명에서는음성과음악이혼합된오디오신호로부터음성과음악을판별함에있어서, 입력오디오신호의프레임으로부터 MFCC(Mel-Frequency Cepstral Coefficient) 특징벡터와음성과음악의판별을위한새로운특징벡터값을추출한후, 각각의특징벡터별로구성되는 GMM 모델을이용한유사도를검사하고, 유사도검사값을이용하여 2차의복합특징벡터값을구성한후, 이를이용하고해당 GMM과비교하는다단계검증과정을거쳐입력오디오신호의구간별음성과음악을판별한다.

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification