심층신경망 기반 언어모델 보간을 이용한 음성인식 리스코어링 시스템
    3.
    发明公开
    심층신경망 기반 언어모델 보간을 이용한 음성인식 리스코어링 시스템 审中-实审
    基于深度神经网络的语言模型插值识别语音识别系统

    公开(公告)号:KR1020170083850A

    公开(公告)日:2017-07-19

    申请号:KR1020160003240

    申请日:2016-01-11

    Abstract: 본발명은음성인식리스코어링시스템에관한것으로, 상기시스템은, 입력되는사용자발성에대한인식결과로서, 음향모델값과언어모델값을포함하는문장을출력하는음성인식기; 입력되는대용량텍스트를바탕으로토픽언어모델및 어휘들별 벡터값을생성하고, 상기토픽언어모델및 상기벡터값을바탕으로토픽언어모델보간 DNN(Deep Neural Network)를생성하는토픽언어모델보간 DNN 생성부; 상기토픽언어모델보간 DNN을가중치로이용하여, 상기문장을구성하는각 어휘별언어모델확률값들을계산하고, 계산된언어모델확률값들의평균값을새로운언어모델값으로생성하는언어모델보간부; 및상기음향모델값과상기언어모델보간부에의해생성되는언어모델값을통합한값으로인식결과를재정렬하여, 수정된인식결과를생성하는리스코어링부를포함한다.

    Abstract translation: 语音识别召回系统本发明涉及一种语音识别召回系统,其包括:语音识别器,用于输出包括声学模型值和语言模型值的语句作为输入的用户话语的识别结果; 基于输入的大量文本生成每个词典的主题语言模型和矢量值,并基于主题语言模型和矢量值生成主题语言模型插值DNN(深度神经网络) 部分; 一种语言模型解释器,用于使用主题语言模型插值DNN作为权重计算构成句子的每个词位的语言模型概率值,并生成计算出的语言模型概率值的平均值作为新的语言模型值; 以及召回单元,用于通过整合由语言模型解释器生成的声学模型值和语言模型值来重新识别识别结果,以生成修改的识别结果。

    음성 인식 시스템에서의 발화 검증 장치 및 그 방법
    4.
    发明公开
    음성 인식 시스템에서의 발화 검증 장치 및 그 방법 审中-实审
    语音识别系统中的语音识别装置和方法

    公开(公告)号:KR1020170083391A

    公开(公告)日:2017-07-18

    申请号:KR1020160002792

    申请日:2016-01-08

    Abstract: 본발명은자연어음성인식시스템에서의발화검증을수행하기위하여다중이벤트검출정보를기반으로한 발화검증장치및 그방법에관한것으로서, 상기장치는, 입력되는음성신호에대한잡음을처리하는잡음처리부; 잡음처리된음성데이터에대한특징을추출하는특징추출부; 상기잡음처리된데이터와추출된특징데이터를이용하여해당음성데이터에서발생되는다수의음성특성에대한이벤트를검출하는이벤트검출부; 상기추출된특징데이터에대하여기 설정된다수의음성인식모델을이용하여음성인식을수행하는탐색부; 및상기이벤트검출부에서검출된다중이벤트정보와기 설정된발화검증모델을이용하여단어단위와문장단위별로신뢰도측정값을계산하고, 계산된신뢰도측정값에따라발화검증을수행하는발화검증부를포함한다.

    Abstract translation: 本发明涉及一种用于基于多个事件检测信息来验证和验证语音的设备及其方法,用于在自然语言语音识别系统中执行语音验证,该设备包括:噪声处理单元,用于处理输入语音信号上的噪声; 特征提取单元,用于提取经过噪声处理的语音数据的特征; 事件检测器,用于使用噪声处理数据和提取的特征数据来检测在语音数据中产生的多个语音特性的事件; 搜索单元,用于使用用于所提取的特征数据的多个预定语音识别模型来执行语音识别; 以及话语验证单元,用于使用由事件检测单元检测到的事件信息和预定话语验证模型来计算每个单词单位和句子单位的可靠性测量值,并且根据计算出的可靠性测量值执行话语验证。

    협업형 상황 인지 시스템 및 그 방법
    5.
    发明公开
    협업형 상황 인지 시스템 및 그 방법 审中-实审
    协同系统和方法的上下文意识

    公开(公告)号:KR1020160093860A

    公开(公告)日:2016-08-09

    申请号:KR1020150014707

    申请日:2015-01-30

    CPC classification number: G08B13/02 G08B13/1672

    Abstract: 본발명은협업형상황인지시스템및 방법을제공한다. 상기협업형상황인지시스템은혼합된오디오신호를분리하고상기분리된각각의오디오신호를분산시켜제공하는오디오신호분리단말, 상기오디오신호분리단말에의해분리된각각의오디오신호를인식해이벤트정보를생성하는복수개의이벤트정보생성단말들및 상기복수개의이벤트정보생성단말들이생성한이벤트정보를통합하여상황을인지하는상황인지단말을포함한다.

    Abstract translation: 本发明提供了协同上下文感知系统和方法。 协同上下文感知系统包括:音频信号分离终端,被配置为分离混合音频信号并分散并提供每个分离的音频信号; 多个事件信息生成终端,被配置为识别由音频信号分离终端分离的每个音频信号,以生成事件信息; 以及上下文感知终端,被配置为将由所述多个事件信息生成终端生成的事件信息集成以知道上下文。

    음성인식을 위한 특징 추출 장치 및 방법
    6.
    发明公开
    음성인식을 위한 특징 추출 장치 및 방법 有权
    提取语音识别功能的装置和方法

    公开(公告)号:KR1020150004513A

    公开(公告)日:2015-01-13

    申请号:KR1020130077494

    申请日:2013-07-03

    CPC classification number: G10L15/02 G10L15/26

    Abstract: 본 발명에 따른, 음성인식을 위한 특징 추출 장치는, 입력되는 음성신호를 소정 사이즈의 프레임 단위로 분리하는 프레임 형성부; 상기 음성신호의 각 프레임 별로 정적 특징 벡터를 추출하는 정적 특징 추출부; 기저함수 또는 기저벡터를 이용하여, 상기 추출된 정적 특징 벡터의 시간에 따른 변화를 나타내는 동적 특징 벡터를 추출하는 동적 특징 추출부; 및 상기 추출된 정적 특징 벡터와 동적 특징 벡터를 결합하여 특징 벡터 스트림을 구성하는 특징 벡터 결합부를 포함한다.

    Abstract translation: 根据本发明,一种用于提取用于语音识别的特征的装置包括:帧形成单元,其将输入的语音信号分成预定大小的帧单位; 静态特征提取单元,其向语音信号的每个帧提取静态特征向量; 动态特征提取单元,其通过使用基函数或基向量来提取表示所提取的静态特征向量随时间的变化的动态特征向量; 以及特征向量组合单元,其组合提取的静态特征向量和提取的动态特征向量,并形成特征向量流。

    이동통신 단말기 및 그 동작방법
    7.
    发明公开
    이동통신 단말기 및 그 동작방법 审中-实审
    移动通信终端和操作方法

    公开(公告)号:KR1020140099702A

    公开(公告)日:2014-08-13

    申请号:KR1020130012429

    申请日:2013-02-04

    CPC classification number: H04M1/72519 G10L15/25 H04M2250/52 H04M2250/74

    Abstract: In one embodiment of the present invention, provided is a mobile communications terminal which includes a camera module which photographs an image of a set region, a microphone module which extracts a sound generation location and sound intensity corresponding to a sound when a sound including a voice of a user is inputted, and a control module which recognizes the sound of the user based on at least one of voice intensity and a voice generation location by estimating the lip location of the user and extracting the voice intensity from the sound intensity and the voice generation location from the sound generation location corresponding to the lip location of the user.

    Abstract translation: 在本发明的一个实施例中,提供了一种移动通信终端,其包括拍摄设置区域的图像的相机模块,当包括声音的声音时提取声音生成位置和与声音相对应的声音强度的麦克风模块 以及控制模块,其通过估计用户的唇部位置并从声音强度和声音提取语音强度,基于语音强度和语音产生位置中的至少一个来识别用户的声音 来自声音生成位置的生成位置对应于用户的唇部位置。

    결합 쌍일차 변환 공간 기반의 화자 적응 방법 및 장치
    8.
    发明公开
    결합 쌍일차 변환 공간 기반의 화자 적응 방법 및 장치 无效
    基于联合双线变换空间的扬声器适应方法及其设备

    公开(公告)号:KR1020130022513A

    公开(公告)日:2013-03-07

    申请号:KR1020110084856

    申请日:2011-08-24

    Inventor: 송화전

    CPC classification number: G10L17/04

    Abstract: PURPOSE: A speaker adaptation method based on a combination bilinear conversion space and a device thereof are provided to remove heterogeneity between speaker adaptation methods by sharing the same base or a homogeneous advance model when performing speaker adaptation. CONSTITUTION: A speaker model generating unit(110) generates an SI(Speaker Independent) model. The speaker model generating unit generates an MLLR(Maximum Likelihood Linear Regression) conversion matrix by speaker. A measurement matrix generating unit(120) generates a two types of measurement matrixes. A bilinear conversion space model generating unit(132) generates a BITS(Bilinear Transformation Space) base based on SVD(Singular Value Decomposition). A speaker adaptation model generating unit(140) generates a speaker adaptation model according to a form of estimated SF. [Reference numerals] (110) Block 1; (111) Speaker; (112) SI model; (113) Modeling for each speaker; (120) Block 2; (130) Block 3; (131) Generating a bilinear conversion space; (132) Bilinear conversion space model; (140) Block 4; (141) Applying a combined bilinear conversion space based speaker; (142) Speaker adaptation model; (150) Block 5; (AA) Training data; (BB) Speaker 1 MLLR conversion matrix; (CC) Speaker S MLLR conversion matrix; (DD) Generating a measurement matrix; (EE) Voice for speaker adaptation; (FF) Test voice; (GG) Voice recognizer; (HH) Recognition result

    Abstract translation: 目的:提供一种基于组合双线性转换空间及其装置的扬声器适配方法,以便通过在执行说话者适应时共享相同的基础或均匀的超前模型来消除说话者适应方法之间的异质性。 构成:扬声器模型生成单元(110)生成SI(独立于扬声器)模型。 扬声器模型生成单元通过扬声器生成MLLR(最大似然线性回归)转换矩阵。 测量矩阵生成单元(120)生成两种类型的测量矩阵。 双线性转换空间模型生成单元(132)基于SVD(奇异值分解)生成BITS(双线性变换空间)基础。 扬声器适配模型生成单元(140)根据估计的SF的形式生成说话者适应模型。 (附图标记)(110)块1; (111)演讲人; (112)SI模型; (113)每个演讲者的建模; (120)块2; (130)块3; (131)生成双线性转换空间; (132)双线性转换空间模型; (140)块4; (141)应用组合双线性转换空间的演讲者; (142)演讲者适应模式; (150)第5座; (AA)培训资料; (BB)扬声器1 MLLR转换矩阵; (CC)扬声器S MLLR转换矩阵; (DD)生成测量矩阵; (EE)扬声器适配语音; (FF)测试声音; (GG)语音识别器; (HH)识别结果

    음성 인식 방법 및 이를 위한 시스템
    9.
    发明公开
    음성 인식 방법 및 이를 위한 시스템 有权
    识别语音和系统的方法

    公开(公告)号:KR1020120066523A

    公开(公告)日:2012-06-22

    申请号:KR1020100127898

    申请日:2010-12-14

    Abstract: PURPOSE: A voice recognition system for personal customized natural language is provided to create various voice searching services through vocalization of the natural language. CONSTITUTION: A voice recognition system comprises: a control unit(123) which provides a customized model to a voice recognition unit(143) in case that a user is registered and controls provision of the customized model in cast that the user is not registered; and a service processing unit(133) which controls updating locutionary act and voice recognition result in case that the user agrees the result.

    Abstract translation: 目的:提供个人定制自然语言的语音识别系统,通过自然语言的发声来创建各种语音搜索服务。 构成:语音识别系统包括:控制单元,其在用户注册的情况下向语音识别单元(143)提供定制模型,并控制用户未注册的定制模型的提供; 以及在用户同意结果的情况下控制更新定位动作和语音识别结果的服务处理单元(133)。

Patent Agency Ranking