다중 음향공간 GMM을 이용한 음향모델 생성 방법

    公开(公告)号:KR101892095B1

    公开(公告)日:2018-08-28

    申请号:KR1020130119607

    申请日:2013-10-08

    Abstract: 다중음향공간 GMM을이용한음향모델생성방법이개시된다. 본발명에따른다중음향공간 GMM을이용한음향모델생성방법은소량의음성데이터베이스를수집하는단계; 상기음성데이터베이스를이용하여 n개의기존음향모델들에서통계정보를산출하는단계; 상기산출한통계정보및 상기 n개의기존음향모델들의통합규칙(tying rule)을기초로하여최적모델단위를결정하는단계; 상기 n개의기존음향모델들을 1 가우시안혼합모델(1 Gaussian mixture model)과각각혼합하여가우시안혼합수를증가시킨 n개의 n 가우시안혼합모델들을생성하는단계; 상기최적모델단위를상기 n개의 n 가우시안혼합모델들을결합한결과에적용하여최종가우시안혼합모델을생성하는단계; 및상기최종가우시안혼합모델을각 모델단위로구성하는최종음향모델의변별학습결과를기초로하여상기최종가우시안혼합모델간의최적가중치를계산하는단계를포함한다.

    액티브 3D 마이크 그리드 맵을 형성 및 이용하는 서비스 시스템 및 그 동작 방법
    12.
    发明公开
    액티브 3D 마이크 그리드 맵을 형성 및 이용하는 서비스 시스템 및 그 동작 방법 审中-实审
    用于形成和利用有源3D麦克风网格图的服务系统及其操作方法

    公开(公告)号:KR1020170086220A

    公开(公告)日:2017-07-26

    申请号:KR1020160005774

    申请日:2016-01-18

    Abstract: 본발명은액티브 3D 마이크그리드맵을형성및 이용하는서비스시스템및 그동작방법에관한것으로서, 본발명의실시예에따른액티브 3D 마이크그리드맵을형성및 이용하는서비스시스템은다수의스마트기기로부터현재상태정보를수신하는수신부, 수신된상기현재상태정보를기반으로상기다수의스마트기기에대한액티브 3D 마이크그리드맵을형성하는형성부, 및형성된상기액티브 3D 마이크그리드맵을이루는상기다수의스마트기기로부터수신되는소리신호를기반으로기능을동작하는제어부를포함한다.

    Abstract translation: 本发明涉及一种用于形成和使用有源3D麦克风网格地图的服务系统,以及用于形成和使用根据本发明实施例的有源3D麦克风网格地图的服务系统, 接收单元,用于接收当前状态信息;形成单元,用于基于接收到的当前状态信息形成用于多个智能设备的有效3D麦克风网格图;以及声音接收单元 以及用于基于该信号操作功能的控制单元。

    SNS에 기반한 재난 정보 전송 장치 및 방법
    13.
    发明公开
    SNS에 기반한 재난 정보 전송 장치 및 방법 审中-实审
    用于发送与灾难相关的信息的SNS装置和方法

    公开(公告)号:KR1020160123749A

    公开(公告)日:2016-10-26

    申请号:KR1020150054306

    申请日:2015-04-17

    Abstract: SNS에기반한재난정보전송장치및 방법이개시된다. 본발명의일실시예에따른 SNS에기반한재난정보전송장치는사용자주위의소음을인지하고, 상기소음을녹음하는녹음부; 상기소음에기반하여재난이발생하였는지여부를판단하는판단부; 및재난이발생하였다고판단한경우, 상기사용자에상응하는 SNS(Social Network Service)에상기재난과관련된정보를게시하는게시부를포함한다.

    불확실성을 이용한 잡음 환경에서의 음성 인식 방법 및 장치
    15.
    发明公开
    불확실성을 이용한 잡음 환경에서의 음성 인식 방법 및 장치 有权
    语音识别方法与装置在噪声环境中的不确定性

    公开(公告)号:KR1020150049570A

    公开(公告)日:2015-05-08

    申请号:KR1020130130299

    申请日:2013-10-30

    Inventor: 정호영 송화전

    Abstract: 본발명에따른음성인식방법은, 입력된음성신호로부터음성특징을추출하는단계; 상기음성신호의잡음성분을추정하는단계; 상기추정된잡음성분을이용하여상기추출된음성특징을보상하는단계; 상기추출된음성특징, 상기보상된음성특징, 및상기잡음성분을바탕으로, 주어진음향모델을변환하는단계; 및상기보상된음성특징과상기변환된음향모델을이용하여음성인식을수행하는단계를포함하는것을특징으로한다.

    Abstract translation: 根据本发明的用于识别语音的方法包括以下步骤:从输入的语音信号中提取语音特征; 估计噪声信号的噪声分量; 通过使用估计的噪声分量来补偿提取的语音特征; 基于提取的语音特征,补偿的语音特征和噪声分量来转换给定的语音模型; 并通过使用经补偿的语音特征和转换的语音模型来执行语音识别。

    한국어 연속 음성인식을 위한 컨퓨젼 네트워크 리스코어링 장치 및 이를 이용한 컨퓨젼 네트워크 생성 방법 및 리스코어링 방법
    16.
    发明授权
    한국어 연속 음성인식을 위한 컨퓨젼 네트워크 리스코어링 장치 및 이를 이용한 컨퓨젼 네트워크 생성 방법 및 리스코어링 방법 有权
    为了连续地使用韩国语音识别的混合网络的装置,以及使用该方法生成和减少混合网络的方法

    公开(公告)号:KR101444409B1

    公开(公告)日:2014-09-30

    申请号:KR1020110072813

    申请日:2011-07-22

    Abstract: 음성인식으로 생성되는 래티스 구조를 컨퓨젼 네트워크 구조로 변환하는 과정에서 래티스 링크 확률의 한계치를 설정하여 컨퓨젼 네트워크의 생성 속도를 향상시키도록 한 한국어 연속 음성인식을 위한 컨퓨젼 네트워크 리스코어링 장치 및 이를 이용한 컨퓨젼 네트워크 생성 방법 및 리스코어링 방법이 제시된다. 제시된 한국어 연속 음성인식을 위한 컨퓨젼 네트워크 리스코어링 장치를 이용한 컨퓨젼 네트워크 생성 방법은 음성인식을 통해 생성되는 하나 이상의 래티스를 입력받는 단계; 입력받은 하나 이상의 래티스들 각각의 사후 확률을 연산하는 단계; 연산한 사후 확률을 근거로 래티스에 포함된 노드를 복수의 동치류로 할당하는 단계; 복수의 동치류를 이용하여 컨퓨젼 세트를 생성하는 단계; 및 생성된 컨퓨젼 세트를 근거로 컨퓨젼 네트워크를 생성하는 단계를 포함한다.

    쌍일차 모델 기반 화자 적응을 위한 통계적 쌍일차 모델 훈련 방법
    17.
    发明公开
    쌍일차 모델 기반 화자 적응을 위한 통계적 쌍일차 모델 훈련 방법 无效
    基于BILINEAR模型训练用于演讲者适应的统计双线性模型的方法

    公开(公告)号:KR1020130023625A

    公开(公告)日:2013-03-08

    申请号:KR1020110086539

    申请日:2011-08-29

    Inventor: 송화전

    CPC classification number: G10L15/06 G10L15/14

    Abstract: PURPOSE: A statistical bilinear model training method for bilinear model-based speaker adaptation is provided to obtain high performance by adjusting the number of content basis vectors of a bilinear model even though adaptation data is too few. CONSTITUTION: A speaker model composing unit(210) composes an observation matrix a training database to apply a bilinear model. An observation matrix composing unit(220) the observation matrix by using composed SD(Speaker Dependent) models. A bilinear model composing unit(230) composes a statistical bilinear model(232) to obtain a symmetric bilinear model parameter. A speaker adaptation unit(240) estimates only an SF(Style Factor) for a new speaker by using the composed bilinear model even if adaptation data of the new speaker is inputted. [Reference numerals] (211) Training data; (212) Modeling by each speaker; (220) Composing an observation matrix; (231) Composing a statistical bilinear model; (232) Statistical bilinear model; (241) Applying to a speaker based on the Statistical bilinear model; (242) Speaker adaptation model; (AA,EE) Speaker 1; (BB) Speaker 2; (CC) Speaker S-1; (DD,FF) Speaker S; (GG) Statistical estimation algorithm; (HH) Voice for adapting to a speaker; (II) Test voice; (JJ) Voice recognizer; (KK) Recognition result

    Abstract translation: 目的:提出一种基于双线性模型的扬声器适应的统计双线性模型训练方法,以便通过调整双线性模型的内容基向量的数量来获得高性能,即使适应数据太少。 构成:扬声器模型构成单元(210)构成观测矩阵训练数据库以应用双线性模型。 观察矩阵构成单元(220)通过使用组合的SD(Speaker Dependent)模型观察矩阵。 双线性模型组合单元(230)组成统计双线性模型(232)以获得对称双线性模型参数。 即使输入了新的说话者的自适应数据,扬声器适配单元(240)仅通过使用组合的双线性模型来估计新的扬声器的SF(风格因子)。 (附图标记)(211)训练数据; (212)每个演讲者建模; (220)组成观察矩阵; (231)构成统计双线性模型; (232)统计双线性模型; (241)根据统计双线性模型向演讲者申请; (242)演讲者适应模式; (AA,EE)扬声器1; (BB)扬声器2; (CC)演讲者S-1; (DD,FF)演讲者S; (GG)统计估计算法; (HH)适应扬声器的声音; (二)测试声音; (JJ)语音识别器; (KK)识别结果

    발음 공간 생성 장치 및 그 방법
    18.
    发明公开
    발음 공간 생성 장치 및 그 방법 无效
    装置和方法,用于产生授权空间

    公开(公告)号:KR1020120054350A

    公开(公告)日:2012-05-30

    申请号:KR1020100115681

    申请日:2010-11-19

    CPC classification number: G10L15/04 G10L15/18

    Abstract: PURPOSE: A pronunciation space formation apparatus is provided to minutely model pronunciation modification rules within a word or between words by applying a probabilistic pronunciation modification rule and expanding a pronunciation space. CONSTITUTION: A pronunciation space generator(110) creates a pronunciation space based on a recognition target word. A pronunciation space expansion unit(120) expands the created pronunciation space in consideration of pronunciation modification rules within a word or between words. A power supply unit(130) supplies a power source to the pronunciation space generator and the pronunciation space expansion unit. A main control unit(140) controls the whole operation of the pronunciation space generator and the pronunciation space expansion unit.

    Abstract translation: 目的:提供一种发音空间形成装置,通过应用概率发音修改规则和扩展发音空间来精细地模拟单词内或单词之间的发音修改规则。 构成:发音空间发生器(110)基于识别目标词创建发音空间。 发音空间扩展单元(120)考虑到单词内或单词之间的发音修改规则来扩展创建的发音空间。 电源单元(130)向发音空间发生器和发音空间扩展单元提供电源。 主控制单元(140)控制发音空间发生器和发音空间扩展单元的整体操作。

    자연어 음성인식의 성능향상을 위한 데이터 증강방법
    20.
    发明公开
    자연어 음성인식의 성능향상을 위한 데이터 증강방법 审中-实审
    提高自然语音识别性能的数据增强方法

    公开(公告)号:KR1020170107283A

    公开(公告)日:2017-09-25

    申请号:KR1020160031050

    申请日:2016-03-15

    Abstract: 심층신경망기반의음성인식시스템에서자연어음성인식의성능향상을위한데이터증강방법이개시된다. 심층신경망기반의음성인식시스템에서자연어음성인식의성능향상을위한데이터증강방법은, 자연어발화변이특성중 발화속도변이에대한음성데이터를증강시키는단계와, 상기자연어발화변이특성중 부정확한발음에대한음성데이터를증강시키는단계및 상기발화속도변이와부정확한발음에대하여증강된음성데이터를이용하여심층신경망기반의음성인식시스템을학습하는단계를포함한다. 따라서, 음성인식시스템의성능을향상시킬수 있다.

    Abstract translation: 公开了一种用于增强基于深度神经网络的语音识别系统中的自然语言语音识别的性能的数据增强方法。 用于改进的自然语言语音识别性能在深度基于神经网络的语音识别系统,包括加强对所述自然语言话语的变化特性的发声速度变化的声音数据的步骤,对于所述自然语言话语的变化特性的子正确的发音数据增强方法 基于神经网络使用针对语速变化和不正确发音的增强语音数据来增强语音数据并学习语音识别系统。 因此,可以提高语音识别系统的性能。

Patent Agency Ranking