Patent search ap:("한국전자통신연구원") AND inv:"송화전" Page 1

1.

发明专利
KR20210034308A - Method and apparatus for learning procedural knowledge, and method for providing service using the same 审中-公开

公开(公告)号：KR20210034308A

公开(公告)日：2021-03-30

申请号：KR1020190116089A

申请日：2019-09-20

Applicant: 한국전자통신연구원

Inventor： 송화전 , 김현우 , 정의석 , 정호영 , 이윤근

IPC: G06N5/02

CPC classification number: G06N5/022 , G06F16/3329 , G06N3/0445 , G06N3/0454 , G06N3/08 , G06N5/025 , G09B7/04

Abstract: 절차적 지식 학습 장치는 사용자와의 상호 작용을 통해 각 에피소드를 수행한 단위 지식들을 연결하여 절차적 지식 데이터를 생성하고, 상기 각 에피소드로부터 생성된 절차적 지식 데이터를 단기 메모리에 저장하며, 상기 단기 메모리에 저장된 절차적 지식 데이터로부터 장기 메모리화할 데이터를 추정한 후, 추정된 데이터를 장기 기억 데이터로 전환하여 장기 메모리에 저장한다.

2.

发明专利
KR20210034486A - Learning method of neural network model for language generation and apparatus for the learning method 审中-公开

公开(公告)号：KR20210034486A

公开(公告)日：2021-03-30

申请号：KR1020200110295A

申请日：2020-08-31

Applicant: 한국전자통신연구원

Inventor： 정의석 , 김현우 , 송화전 , 오유리 , 유병현 , 한란

IPC: G10L15/183 , G06N3/04 , G10L15/16

CPC classification number: G10L15/183 , G06N3/04 , G10L15/16

Abstract: 본 발명은 적대적 학습 방법을 이용하여 기존 모델의 정규화를 강화한 새로운 학습 방법을 제시한다. 또한 기존 기술은 워드 임베딩 의존성이 큰 접근 방법으로 특히 단일 의미만을 지닌 워드 임베딩의 문제점을 가지고 있지만, 본 발명은 자가-주의집중 모델을 적용하여 종래 문제점을 해결한다.

3.

发明公开
심층신경망 기반 언어모델 보간을 이용한 음성인식 리스코어링 시스템 审中-实审
Title translation: 基于深度神经网络的语言模型插值识别语音识别系统

公开(公告)号：KR1020170083850A

公开(公告)日：2017-07-19

申请号：KR1020160003240

申请日：2016-01-11

Applicant: 한국전자통신연구원

Inventor： 정의석 , 송화전 , 강병옥 , 박전규 , 이윤근 , 전형배

IPC: G10L15/16 , G10L15/02 , G10L15/32 , G10L15/183

Abstract: 본발명은음성인식리스코어링시스템에관한것으로, 상기시스템은, 입력되는사용자발성에대한인식결과로서, 음향모델값과언어모델값을포함하는문장을출력하는음성인식기; 입력되는대용량텍스트를바탕으로토픽언어모델및 어휘들별 벡터값을생성하고, 상기토픽언어모델및 상기벡터값을바탕으로토픽언어모델보간 DNN(Deep Neural Network)를생성하는토픽언어모델보간 DNN 생성부; 상기토픽언어모델보간 DNN을가중치로이용하여, 상기문장을구성하는각 어휘별언어모델확률값들을계산하고, 계산된언어모델확률값들의평균값을새로운언어모델값으로생성하는언어모델보간부; 및상기음향모델값과상기언어모델보간부에의해생성되는언어모델값을통합한값으로인식결과를재정렬하여, 수정된인식결과를생성하는리스코어링부를포함한다.

Abstract translation: 语音识别召回系统本发明涉及一种语音识别召回系统，其包括：语音识别器，用于输出包括声学模型值和语言模型值的语句作为输入的用户话语的识别结果; 基于输入的大量文本生成每个词典的主题语言模型和矢量值，并基于主题语言模型和矢量值生成主题语言模型插值DNN（深度神经网络）部分; 一种语言模型解释器，用于使用主题语言模型插值DNN作为权重计算构成句子的每个词位的语言模型概率值，并生成计算出的语言模型概率值的平均值作为新的语言模型值; 以及召回单元，用于通过整合由语言模型解释器生成的声学模型值和语言模型值来重新识别识别结果，以生成修改的识别结果。

4.

发明公开
음성 인식 시스템에서의 발화 검증 장치 및 그 방법 审中-实审
Title translation: 语音识别系统中的语音识别装置和方法

公开(公告)号：KR1020170083391A

公开(公告)日：2017-07-18

申请号：KR1020160002792

申请日：2016-01-08

Applicant: 한국전자통신연구원

Inventor： 강점자 , 송화전 , 박전규 , 정훈

IPC: G10L15/187 , G10L15/10 , G10L15/02

CPC classification number: G10L25/87 , G10L15/02 , G10L15/1815 , G10L15/197 , G10L15/22 , G10L25/48

Abstract: 본발명은자연어음성인식시스템에서의발화검증을수행하기위하여다중이벤트검출정보를기반으로한 발화검증장치및 그방법에관한것으로서, 상기장치는, 입력되는음성신호에대한잡음을처리하는잡음처리부; 잡음처리된음성데이터에대한특징을추출하는특징추출부; 상기잡음처리된데이터와추출된특징데이터를이용하여해당음성데이터에서발생되는다수의음성특성에대한이벤트를검출하는이벤트검출부; 상기추출된특징데이터에대하여기 설정된다수의음성인식모델을이용하여음성인식을수행하는탐색부; 및상기이벤트검출부에서검출된다중이벤트정보와기 설정된발화검증모델을이용하여단어단위와문장단위별로신뢰도측정값을계산하고, 계산된신뢰도측정값에따라발화검증을수행하는발화검증부를포함한다.

Abstract translation: 本发明涉及一种用于基于多个事件检测信息来验证和验证语音的设备及其方法，用于在自然语言语音识别系统中执行语音验证，该设备包括：噪声处理单元，用于处理输入语音信号上的噪声; 特征提取单元，用于提取经过噪声处理的语音数据的特征; 事件检测器，用于使用噪声处理数据和提取的特征数据来检测在语音数据中产生的多个语音特性的事件; 搜索单元，用于使用用于所提取的特征数据的多个预定语音识别模型来执行语音识别; 以及话语验证单元，用于使用由事件检测单元检测到的事件信息和预定话语验证模型来计算每个单词单位和句子单位的可靠性测量值，并且根据计算出的可靠性测量值执行话语验证。

5.

发明公开
협업형 상황 인지 시스템 및 그 방법 审中-实审
Title translation: 协同系统和方法的上下文意识

公开(公告)号：KR1020160093860A

公开(公告)日：2016-08-09

申请号：KR1020150014707

申请日：2015-01-30

Applicant: 한국전자통신연구원

Inventor： 정호영 , 박전규 , 송화전

IPC: G08B13/00 , G08B13/02 , G08B13/16

CPC classification number: G08B13/02 , G08B13/1672

Abstract: 본발명은협업형상황인지시스템및 방법을제공한다. 상기협업형상황인지시스템은혼합된오디오신호를분리하고상기분리된각각의오디오신호를분산시켜제공하는오디오신호분리단말, 상기오디오신호분리단말에의해분리된각각의오디오신호를인식해이벤트정보를생성하는복수개의이벤트정보생성단말들및 상기복수개의이벤트정보생성단말들이생성한이벤트정보를통합하여상황을인지하는상황인지단말을포함한다.

Abstract translation: 本发明提供了协同上下文感知系统和方法。协同上下文感知系统包括：音频信号分离终端，被配置为分离混合音频信号并分散并提供每个分离的音频信号; 多个事件信息生成终端，被配置为识别由音频信号分离终端分离的每个音频信号，以生成事件信息; 以及上下文感知终端，被配置为将由所述多个事件信息生成终端生成的事件信息集成以知道上下文。

6.

发明公开
음성인식을 위한 특징 추출 장치 및 방법 有权
Title translation: 提取语音识别功能的装置和方法

公开(公告)号：KR1020150004513A

公开(公告)日：2015-01-13

申请号：KR1020130077494

申请日：2013-07-03

Applicant: 한국전자통신연구원

Inventor： 이성주 , 강병옥 , 정훈 , 정호영 , 송화전 , 오유리 , 이윤근

IPC: G10L15/02

CPC classification number: G10L15/02 , G10L15/26

Abstract: 본 발명에 따른, 음성인식을 위한 특징 추출 장치는, 입력되는 음성신호를 소정 사이즈의 프레임 단위로 분리하는 프레임 형성부; 상기 음성신호의 각 프레임 별로 정적 특징 벡터를 추출하는 정적 특징 추출부; 기저함수 또는 기저벡터를 이용하여, 상기 추출된 정적 특징 벡터의 시간에 따른 변화를 나타내는 동적 특징 벡터를 추출하는 동적 특징 추출부; 및 상기 추출된 정적 특징 벡터와 동적 특징 벡터를 결합하여 특징 벡터 스트림을 구성하는 특징 벡터 결합부를 포함한다.

Abstract translation: 根据本发明，一种用于提取用于语音识别的特征的装置包括：帧形成单元，其将输入的语音信号分成预定大小的帧单位; 静态特征提取单元，其向语音信号的每个帧提取静态特征向量; 动态特征提取单元，其通过使用基函数或基向量来提取表示所提取的静态特征向量随时间的变化的动态特征向量; 以及特征向量组合单元，其组合提取的静态特征向量和提取的动态特征向量，并形成特征向量流。

7.

发明公开
이동통신 단말기 및 그 동작방법 审中-实审
Title translation: 移动通信终端和操作方法

公开(公告)号：KR1020140099702A

公开(公告)日：2014-08-13

申请号：KR1020130012429

申请日：2013-02-04

Applicant: 한국전자통신연구원

Inventor： 송화전 , 정호영 , 이윤근

IPC: H04B1/40 , G06K9/46 , H04R1/08

CPC classification number: H04M1/72519 , G10L15/25 , H04M2250/52 , H04M2250/74

Abstract: In one embodiment of the present invention, provided is a mobile communications terminal which includes a camera module which photographs an image of a set region, a microphone module which extracts a sound generation location and sound intensity corresponding to a sound when a sound including a voice of a user is inputted, and a control module which recognizes the sound of the user based on at least one of voice intensity and a voice generation location by estimating the lip location of the user and extracting the voice intensity from the sound intensity and the voice generation location from the sound generation location corresponding to the lip location of the user.

Abstract translation: 在本发明的一个实施例中，提供了一种移动通信终端，其包括拍摄设置区域的图像的相机模块，当包括声音的声音时提取声音生成位置和与声音相对应的声音强度的麦克风模块以及控制模块，其通过估计用户的唇部位置并从声音强度和声音提取语音强度，基于语音强度和语音产生位置中的至少一个来识别用户的声音来自声音生成位置的生成位置对应于用户的唇部位置。

8.

发明公开
결합 쌍일차 변환 공간 기반의 화자 적응 방법 및 장치 无效
Title translation: 基于联合双线变换空间的扬声器适应方法及其设备

公开(公告)号：KR1020130022513A

公开(公告)日：2013-03-07

申请号：KR1020110084856

申请日：2011-08-24

Applicant: 한국전자통신연구원

Inventor： 송화전

IPC: G10L17/00

CPC classification number: G10L17/04

Abstract: PURPOSE: A speaker adaptation method based on a combination bilinear conversion space and a device thereof are provided to remove heterogeneity between speaker adaptation methods by sharing the same base or a homogeneous advance model when performing speaker adaptation. CONSTITUTION: A speaker model generating unit(110) generates an SI(Speaker Independent) model. The speaker model generating unit generates an MLLR(Maximum Likelihood Linear Regression) conversion matrix by speaker. A measurement matrix generating unit(120) generates a two types of measurement matrixes. A bilinear conversion space model generating unit(132) generates a BITS(Bilinear Transformation Space) base based on SVD(Singular Value Decomposition). A speaker adaptation model generating unit(140) generates a speaker adaptation model according to a form of estimated SF. [Reference numerals] (110) Block 1; (111) Speaker; (112) SI model; (113) Modeling for each speaker; (120) Block 2; (130) Block 3; (131) Generating a bilinear conversion space; (132) Bilinear conversion space model; (140) Block 4; (141) Applying a combined bilinear conversion space based speaker; (142) Speaker adaptation model; (150) Block 5; (AA) Training data; (BB) Speaker 1 MLLR conversion matrix; (CC) Speaker S MLLR conversion matrix; (DD) Generating a measurement matrix; (EE) Voice for speaker adaptation; (FF) Test voice; (GG) Voice recognizer; (HH) Recognition result

Abstract translation: 目的：提供一种基于组合双线性转换空间及其装置的扬声器适配方法，以便通过在执行说话者适应时共享相同的基础或均匀的超前模型来消除说话者适应方法之间的异质性。构成：扬声器模型生成单元（110）生成SI（独立于扬声器）模型。扬声器模型生成单元通过扬声器生成MLLR（最大似然线性回归）转换矩阵。测量矩阵生成单元（120）生成两种类型的测量矩阵。双线性转换空间模型生成单元（132）基于SVD（奇异值分解）生成BITS（双线性变换空间）基础。扬声器适配模型生成单元（140）根据估计的SF的形式生成说话者适应模型。（附图标记）（110）块1; （111）演讲人; （112）SI模型; （113）每个演讲者的建模; （120）块2; （130）块3; （131）生成双线性转换空间; （132）双线性转换空间模型; （140）块4; （141）应用组合双线性转换空间的演讲者; （142）演讲者适应模式; （150）第5座; （AA）培训资料; （BB）扬声器1 MLLR转换矩阵; （CC）扬声器S MLLR转换矩阵; （DD）生成测量矩阵; （EE）扬声器适配语音; （FF）测试声音; （GG）语音识别器; （HH）识别结果

9.

发明公开
음성 인식 방법 및 이를 위한 시스템 有权
Title translation: 识别语音和系统的方法

公开(公告)号：KR1020120066523A

公开(公告)日：2012-06-22

申请号：KR1020100127898

申请日：2010-12-14

Applicant: 한국전자통신연구원

Inventor： 송화전 , 강병옥 , 이윤근 , 박전규 , 정훈 , 이성주 , 정호영 , 박기영 , 강점자 , 정의석 , 전형배 , 김종진

IPC: G10L15/18

Abstract: PURPOSE: A voice recognition system for personal customized natural language is provided to create various voice searching services through vocalization of the natural language. CONSTITUTION: A voice recognition system comprises: a control unit(123) which provides a customized model to a voice recognition unit(143) in case that a user is registered and controls provision of the customized model in cast that the user is not registered; and a service processing unit(133) which controls updating locutionary act and voice recognition result in case that the user agrees the result.

Abstract translation: 目的：提供个人定制自然语言的语音识别系统，通过自然语言的发声来创建各种语音搜索服务。构成：语音识别系统包括：控制单元，其在用户注册的情况下向语音识别单元（143）提供定制模型，并控制用户未注册的定制模型的提供; 以及在用户同意结果的情况下控制更新定位动作和语音识别结果的服务处理单元（133）。

10.

发明授权
음성 인식 시스템에서의 발화 검증 장치 및 그 방법 有权

公开(公告)号：KR102018331B1

公开(公告)日：2019-09-04

申请号：KR1020160002792

申请日：2016-01-08

Applicant: 한국전자통신연구원

Inventor： 강점자 , 송화전 , 박전규 , 정훈

IPC: G10L15/187 , G10L15/10 , G10L15/02

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification