화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 방법 및 시스템
    2.
    发明授权
    화자 상호 정보를 활용한 강인한 I-벡터 추출기 학습 방법 및 시스템 有权
    使用扬声器互信息的鲁棒I矢量提取器学习方法和系统

    公开(公告)号:KR101843079B1

    公开(公告)日:2018-05-14

    申请号:KR1020160123219

    申请日:2016-09-26

    Inventor: 김남수 강우현

    CPC classification number: G10L17/02 G10L15/06 G10L17/04 G10L2015/0635

    Abstract: 본발명은화자상호정보를활용한강인한 I-벡터추출기학습방법에관한것으로서, 보다구체적으로는, (1) 복수개의음성파일들로구성된학습데이터를사용하여서로다른 2 이상의화자각각에대하여종속적인가우시안혼합모델(Gaussian mixture model, GMM)을학습하고, 상기학습데이터를사용하여 I-벡터추출기를학습하는단계; (2) 상기단계 (1)에서학습된화자종속적가우시안혼합모델들을이용하여각 가우시안성분이갖는평균화자상호정보량을계산하는단계; 및 (3) 상기단계 (2)에서계산된각 가우시안성분이갖는평균화자상호정보량을상기단계 (1)에서학습된 I-벡터추출기에가중치로적용하여화자정보가부각된강인한 I-벡터를추출하는단계를포함하는것을그 구성상의특징으로한다. 또한, 본발명은화자상호정보를활용한강인한 I-벡터추출기학습시스템에관한것으로서, 보다구체적으로는, 복수개의음성파일들로구성된학습데이터를사용하여서로다른 2 이상의화자각각에대하여종속적인가우시안혼합모델(Gaussian mixture model, GMM)을학습하고, 상기학습데이터를사용하여 I-벡터추출기를학습하는학습부; 상기학습부에서학습된화자종속적가우시안혼합모델들을이용하여각 가우시안성분이갖는평균화자상호정보량을계산하는계산부; 및상기계산부에서계산된각 가우시안성분이갖는평균화자상호정보량을상기학습부에서학습된 I-벡터추출기에가중치로적용하여화자정보가부각된강인한 I-벡터를추출하는화자정보부각 I-벡터추출부를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는화자상호정보를활용한강인한 I-벡터추출기학습방법및 시스템에따르면, 각가우시안성분에대한화자와학습데이터프레임들의평균화자상호정보량을계산한후 계산된평균화자상호정보량을모든프레임및 전체화자에대하여평균을취하여각 가우시안성분이갖는평균화자상호정보량을계산하고, 이를가중치로서, I-벡터추출기의블락(block) 행렬에곱하는방식으로적용시킴으로써, I-벡터추출기를통해추출되는 I-벡터에화자에대한정보가많은가우시안성분의영향이부각될수 있도록하여, 보다높은성능을갖는특징벡터인강인한 I-벡터를추출할수 있다. 또한, 본발명에따르면, I-벡터추출기에가중치를적용하여 I-벡터의화자관련정보를부각시킴으로써, 화자이외의잡음, 마이크상태등의요소로인한변이성에강인한특징을추출할수 있어, 입력된음성길이가짧거나잡음이많은환경에서도화자의특징을효과적으로추출하여화자인식의성능을높일수 있다.

    파라미터 변경에 의해 음색을 변환하는 사용자 맞춤형 음성 보정 방법 및 이를 구현하는 음성 보정 장치
    3.
    发明授权
    파라미터 변경에 의해 음색을 변환하는 사용자 맞춤형 음성 보정 방법 및 이를 구현하는 음성 보정 장치 有权
    用户可自定义的语音修改方法通过参数修改语音和语音修改设备实现相同

    公开(公告)号:KR101706123B1

    公开(公告)日:2017-02-13

    申请号:KR1020150060946

    申请日:2015-04-29

    Abstract: 본발명은파라미터변경에의해음색을변환하는사용자맞춤형음성보정방법및 이를구현하는음성보정장치에관한것으로서, 보다구체적으로는, 사용자맞춤형음성보정장치가, (1) 원시음성데이터를입력받는단계; (2) 상기입력된원시음성데이터로부터피치, 특성파형(CW), 파워및 선스펙트럼주파수(LSF)를포함한음성파라미터들을추출하는단계; (3) 상기추출된음성파라미터들에대해, 미리설정된복수의특이음성이갖는제1 특징들을미리설정된정상음성이갖는제2 특징들로변경하는단계; 및 (4) 상기변경된제2 특징을갖는음성파라미터들에기초하여, 보정된음성데이터를합성하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는파라미터변경에의해음색을변환하는사용자맞춤형음성보정방법및 이를구현하는음성보정장치에따르면, 사용자맞춤형음성보정장치가, 원시음성데이터를입력받고, 입력된원시음성데이터로부터피치, 특성파형(CW), 파워및 선스펙트럼주파수(LSF)를포함한음성파라미터들을추출하며, 추출된음성파라미터들에대해, 미리설정된복수의특이음성이갖는제1 특징들을미리설정된정상음성이갖는제2 특징들로변경하고, 변경된제2 특징을갖는음성파라미터들에기초하여, 보정된음성데이터를합성함으로써, 쉰(hoarse) 음성, 거친(rough) 음성, 숨찬(breathy) 음성및 비음(nasal) 음성과같은특이목소리를분석및 개선할수 있고, 음색을차가운느낌또는따뜻한느낌으로변경할수 있다. 또한, 음성통화를통해식별되기어려운음성이나화자가갖고있는불만족스러운음성을, 또렷하거나원하는음색의음성으로변경할수 있게하고, 화자가갖는발성기관의신체적문제를보조할수 있으며, 사용자가어필하고싶은음색의음성을생성하게함으로써, 사용자의욕구에맞추어다양하게음성을보정할수 있다.

    파라미터 변경에 의해 음색을 변환하는 사용자 맞춤형 음성 보정 방법 및 이를 구현하는 음성 보정 장치
    4.
    发明公开
    파라미터 변경에 의해 음색을 변환하는 사용자 맞춤형 음성 보정 방법 및 이를 구현하는 음성 보정 장치 有权
    用户可自定义的语音修改方法通过参数修改语音和语音修改设备实现相同

    公开(公告)号:KR1020160128871A

    公开(公告)日:2016-11-08

    申请号:KR1020150060946

    申请日:2015-04-29

    Abstract: 본발명은파라미터변경에의해음색을변환하는사용자맞춤형음성보정방법및 이를구현하는음성보정장치에관한것으로서, 보다구체적으로는, 사용자맞춤형음성보정장치가, (1) 원시음성데이터를입력받는단계; (2) 상기입력된원시음성데이터로부터피치, 특성파형(CW), 파워및 선스펙트럼주파수(LSF)를포함한음성파라미터들을추출하는단계; (3) 상기추출된음성파라미터들에대해, 미리설정된복수의특이음성이갖는제1 특징들을미리설정된정상음성이갖는제2 특징들로변경하는단계; 및 (4) 상기변경된제2 특징을갖는음성파라미터들에기초하여, 보정된음성데이터를합성하는단계를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는파라미터변경에의해음색을변환하는사용자맞춤형음성보정방법및 이를구현하는음성보정장치에따르면, 사용자맞춤형음성보정장치가, 원시음성데이터를입력받고, 입력된원시음성데이터로부터피치, 특성파형(CW), 파워및 선스펙트럼주파수(LSF)를포함한음성파라미터들을추출하며, 추출된음성파라미터들에대해, 미리설정된복수의특이음성이갖는제1 특징들을미리설정된정상음성이갖는제2 특징들로변경하고, 변경된제2 특징을갖는음성파라미터들에기초하여, 보정된음성데이터를합성함으로써, 쉰(hoarse) 음성, 거친(rough) 음성, 숨찬(breathy) 음성및 비음(nasal) 음성과같은특이목소리를분석및 개선할수 있고, 음색을차가운느낌또는따뜻한느낌으로변경할수 있다. 또한, 음성통화를통해식별되기어려운음성이나화자가갖고있는불만족스러운음성을, 또렷하거나원하는음색의음성으로변경할수 있게하고, 화자가갖는발성기관의신체적문제를보조할수 있으며, 사용자가어필하고싶은음색의음성을생성하게함으로써, 사용자의욕구에맞추어다양하게음성을보정할수 있다.

    식물 재배용 조명 방법
    5.
    发明授权
    식물 재배용 조명 방법 有权
    用于植物培养的照明方法

    公开(公告)号:KR101526676B1

    公开(公告)日:2015-06-09

    申请号:KR1020130091123

    申请日:2013-07-31

    Inventor: 손정익 강우현

    Abstract: 식물재배용조명장치및 조명방법이제공된다. 상기식물재배용조명장치는식물에광을제공하는광원부, 상기광원부에연결되어상기광원부에펄스전원을제공하는펄스전원부, 및상기펄스전원부에연결되어상기펄스전원의듀티비를 0.2 이하로제어하는제어부를포함할수 있다. 상기식물재배용조명장치는상기조명장치를이용하여식물에펄스광을제공하는단계를포함할수 있다. 상기식물재배용조명장치및 조명방법에의해소비전력을절감하면서식물의광합성효율을향상시킬수 있다.

    식물 재배용 조명 방법
    8.
    发明公开
    식물 재배용 조명 방법 有权
    照明设备和照明方法用于植物培养

    公开(公告)号:KR1020150015269A

    公开(公告)日:2015-02-10

    申请号:KR1020130091123

    申请日:2013-07-31

    Inventor: 손정익 강우현

    CPC classification number: H05B33/0818 A01G7/00 F21V37/0025

    Abstract: 식물 재배용 조명 장치 및 조명 방법이 제공된다. 상기 식물 재배용 조명 장치는 식물에 광을 제공하는 광원부, 상기 광원부에 연결되어 상기 광원부에 펄스 전원을 제공하는 펄스 전원부, 및 상기 펄스 전원부에 연결되어 상기 펄스 전원의 듀티비를 0.2 이하로 제어하는 제어부를 포함할 수 있다. 상기 식물 재배용 조명 장치는 상기 조명 장치를 이용하여 식물에 펄스 광을 제공하는 단계를 포함할 수 있다. 상기 식물 재배용 조명 장치 및 조명 방법에 의해 소비전력을 절감하면서 식물의 광합성 효율을 향상시킬 수 있다.

    Abstract translation: 本发明涉及一种用于植物栽培的照明装置和照明方法。 用于植物栽培的照明装置包括:向植物提供光的光源单元; 连接到所述光源单元以向所述光源单元提供脉冲功率的脉冲电源; 连接到脉冲电源的控制器将脉冲功率的占空比控制在0.2以下。 用于植物培养的照明装置可以包括通过使用照明装置向植物提供脉冲光的步骤。 根据照明装置和植物栽培的照明方法,可以降低功率消耗,并且可以提高植物的光合作用效率。

    VAE를 이용한 화자 인식 특징 추출 방법 및 시스템
    9.
    发明授权
    VAE를 이용한 화자 인식 특징 추출 방법 및 시스템 有权
    使用VAE的说话人识别特征提取方法和系统

    公开(公告)号:KR101843074B1

    公开(公告)日:2018-03-28

    申请号:KR1020160130100

    申请日:2016-10-07

    Inventor: 김남수 강우현

    CPC classification number: G10L17/02 G10L19/038

    Abstract: 본발명은 VAE를이용한화자인식특징추출방법에관한것으로서, 보다구체적으로는 (1) 복수개의음성파일들로구성된학습데이터를사용하여화자독립적모델인일반배경모델(universal background model, UBM)을학습하는단계; (2) 상기단계 (1)에서학습된일반배경모델을이용하여상기복수개의음성파일들에서의 Baum-Welch statistics를추출하고, 상기추출된 Baum-Welch statistics에기초하여하나의통합벡터를생성하는단계; (3) 상기단계 (2)에서생성된하나의통합벡터를입력벡터로하여 VAE를학습하는단계; 및 (4) 상기단계 (3)에서의학습결과를바탕으로딥 러닝(deep learning) 구조를생성하여상기입력벡터를재구성하는과정에서생성되는랜덤변수(latent variables)를화자인식특징으로추출하는단계를포함하는것을그 구성상의특징으로한다. 또한, 본발명은 VAE를이용한화자인식특징추출시스템에관한것으로서, 보다구체적으로는복수개의음성파일들로구성된학습데이터를사용하여화자독립적모델인일반배경모델(universal background model, UBM)을학습하는 UBM 학습부; 상기 UBM 학습부에서학습된일반배경모델을이용하여상기복수개의음성파일들에서의 Baum-Welch statistics를추출하고, 상기추출된 Baum-Welch statistics에기초하여하나의통합벡터를생성하는 Baum-Welch statistics 추출부; 상기 Baum-Welch statistics 추출부에서생성된하나의통합벡터를입력벡터로하여 VAE를학습하는 VAE 학습부; 및상기 VAE 학습부에서의학습결과를바탕으로딥 러닝(deep learning) 구조를생성하여상기입력벡터를재구성하는과정에서생성되는랜덤변수(latent variables)를화자인식특징으로추출하는화자인식특징추출부를포함하는것을그 구성상의특징으로한다. 본발명에서제안하고있는 VAE를이용한화자인식특징추출방법및 시스템에따르면, 입력된벡터를여러은닉층을통과시켜출력에서재구성하는딥 러닝(deep learning) 구조인오토인코더(autoencoder)의일종으로, 가운데은닉층에랜덤변수들을가지고있는구조를갖는 variational auto encoder(VAE)를이용하되, VAE의구조중 입력층과은닉층으로구성되는인코더네트워크를화자인식특징추출기로활용하고, 입력벡터를재구성하는과정에서얻어지는랜덤변수들을화자인식특징으로사용함으로써, 보다비관측데이터에대해서도강인하고안정적인고정된차원의특징을추출할수 있어, 화자인식의성능이보다높아질수 있다.

    Abstract translation: 本发明涉及一种使用该VAE的扬声器识别的特征提取方法,更具体地,(1)使用由多个声音的学习数据文件说话者无关模型普通的背景模型(通用背景模型,UBM),学习 该方法包括: (2)使用的一般背景模型在上述步骤(1)学习以提取从所述多个音频文件的的Baum-韦尔奇统计,并基于所提取的Baum-韦尔奇统计单个集成矢量 步骤; (3)通过使用步骤(2)中生成的一个积分向量作为输入向量来学习VAE; 并且(4)通过基于步骤(3)中的学习结果生成深度学习结构,利用说话者识别特征来提取在重构输入矢量的过程中生成的潜变量, 并包括其构成特征。 本发明涉及使用VAE的说话人识别特征提取系统,更具体地,涉及使用VAE的说话人识别特征提取系统, 学习部门; 使用一般背景模型在UBM学习单元学习提取从多个音频文件的的Baum-韦尔奇统计,所提取的Baum-韦尔奇统计基于综合向量的Baum-韦尔奇统计生成一个 提取单元; VAE学习单元,其通过使用由Baum-Welch统计提取单元生成的一个集成向量作为输入向量来学习VAE; 以及说话人识别特征提取单元,用于通过基于VAE学习单元中的学习结果生成深度学习结构来提取在通过说话人识别特征重建输入向量的过程中生成的潜在变量 等等。 出根据该说话人识别的特征提取的方法和系统使用VAE本发明中提出,其中的输入矢量是通过一些在输出重构的隐藏层的传递的类型深学习(深学习)与自动编码器(自动编码)结构, 但使用具有结构与随机变量到隐藏层,以及利用该编码器网络包括输入层与VAE的扬声器识别特征提取器的结构的隐藏层的变分自动编码器(VAE),在重建输入向量的过程中获得 通过使用随机变量作为说话人识别特征,即使对于未观察到的数据也可以提取稳健且稳定的固定维度特征,并且可以增强说话人识别性能。

Patent Agency Ranking