음성변조를 위한 음성모델 부호화를 이용한 음성합성 기술 및 장치

    公开(公告)号:KR1020180113325A

    公开(公告)日:2018-10-16

    申请号:KR1020170044719

    申请日:2017-04-06

    Inventor: 김회린 서영주

    CPC classification number: G10L13/08 G10L13/02 G10L21/04

    Abstract: 본발명은자동음성합성에서음성합성장치를구성하는임의의화자의음성모델을음성변조에효과적이면서도효율적인음성모델코드로부호화하고, 상기음성모델코드를변경하거나복수의화자의음성모델코드들을서로조합함으로써변조된목소리의음성정보를담은음성모델코드로변환하고, 변환된음성모델코드로부터해당음성모델을복원하기위하여복호화시키고, 복원된음성모델을활용하여주어진텍스트에해당하는변조된음성파형을합성하는음성합성장치및 방법이개시된다. 일실시예에따른음성합성방법은, 음성모델을음성모델코드로부호화하는단계; 상기음성모델코드를조작함에따라변조된목소리음성정보를포함하는음성모델코드로변환하는단계; 상기부호화된음성모델코드또는상기변조된목소리음성정보를포함하는음성모델코드를복호화하여합성가능한음성모델로복원시키는단계; 및텍스트정보가입력됨에따라상기복원된음성모델에기반하여상기입력된텍스트정보에대해변조된목소리의음성파형을합성하는단계를포함할수 있다.

    음소레벨 로그우도 비율 분포와 음소 지속시간 분포에 의한단어음색 모델 기반 발화검증 시스템 및 방법
    3.
    发明授权
    음소레벨 로그우도 비율 분포와 음소 지속시간 분포에 의한단어음색 모델 기반 발화검증 시스템 및 방법 失效
    基于电话级对数似然比和电话持续时间概率分布的词语声纹模型的话语验证系统和方法

    公开(公告)号:KR100940641B1

    公开(公告)日:2010-02-05

    申请号:KR1020070136643

    申请日:2007-12-24

    Abstract: 본 발명에 의한 발화검증 시스템은, 입력 음성신호로부터 음성의 특징을 표현하는 특징벡터를 추출하는 특징벡터 추출부, 추출된 특징벡터로부터 음성인식을 수행하고, 음색도 추출부로 음소레벨의 인식정보를 전달하는 음성인식부, 음소레벨의 인식정보, 반모델 및 단어음색 모델을 이용하여 음소레벨 로그우도 음색도와 음소레벨 지속시간 음색도를 구하고, 각각으로부터 단어레벨 로그우도 음색도와 단어레벨 지속시간 음색도를 추출하는 음색도 추출부 및, 음색도 추출부에서 출력된 단어레벨 로그우도 음색도와 단어레벨 지속시간 음색도를 이용하여 음성인식된 결과에 대해 수락 또는 거절을 결정하는 발화검증부를 구비한다.

    히스토그램 등화를 이용한 음향모델 파라메터 적응 장치 및그 방법
    5.
    发明公开
    히스토그램 등화를 이용한 음향모델 파라메터 적응 장치 및그 방법 失效
    通过利用组织均匀化来适应语音识别器的模型参数的装置和方法

    公开(公告)号:KR1020100092846A

    公开(公告)日:2010-08-23

    申请号:KR1020090018909

    申请日:2009-03-05

    Inventor: 서영주 김회린

    Abstract: PURPOSE: An acoustic model parameter adaptation device using histogram equalization and a method thereof are provided to remove acoustic mismatch between test environment and drill environment, thereby preventing voice recognition performance which is strong against noise environment. CONSTITUTION: A test accumulative distribution function estimator(11) estimates test accumulative distribution function estimation about test voice feature parameters. A drill accumulative distribution function estimator(12) estimates drill accumulative distribution function estimation about a sound model average parameters. A linear interpolation factor calculator(13) obtains linear interpolation factor. A sound model parameter adapter(14) performs linear interpolation about the test voice feature parameter which the voice model average parameter performs through histogram equalization.

    Abstract translation: 目的:提供使用直方图均衡的声学模型参数自适应装置及其方法,以消除测试环境和钻井环境之间的声学​​失配,从而防止对噪声环境强烈的语音识别性能。 构成:测试累积分布函数估计器(11)估计关于测试语音特征参数的测试累积分布函数估计。 钻孔累积分布函数估计器(12)估计关于声模型平均参数的钻孔累积分布函数估计。 线性内插因子计算器(13)获得线性内插因子。 声音模型参数适配器(14)对语音模型平均参数通过直方图均衡执行的测试语音特征参数进行线性插值。

    윈도우 기반 누적분포함수 추정에 의한 히스토그램 등화기법을 이용한 음성인식 시스템 및 방법
    6.
    发明公开
    윈도우 기반 누적분포함수 추정에 의한 히스토그램 등화기법을 이용한 음성인식 시스템 및 방법 有权
    使用基于窗口均衡的基于窗口的测试累积分布函数估计的噪声鲁棒语音识别的系统和方法

    公开(公告)号:KR1020090072143A

    公开(公告)日:2009-07-02

    申请号:KR1020070140155

    申请日:2007-12-28

    Inventor: 서영주 김회린

    Abstract: A voice recognition system and a method using histogram equalization technique by window base cumulative distribution function estimation are provided to reduce the degradation of voice recognition performance in the environment with noise. A voice input unit converts an analog voice signal into a digital signal(200). A characteristic extraction unit extracts an acoustic feature parameter in the frame unit(202), after dividing the digital voice signal in to a regular time interval(201). A characteristic compensation unit extracts a compensated feature parameter(203). A voice recognition engine performs a voice recognition and outputs the acknowledged result(204).

    Abstract translation: 提供了一种通过窗口累积分布函数估计的语音识别系统和使用直方图均衡技术的方法,以减少噪声环境中语音识别性能的恶化。 语音输入单元将模拟语音信号转换为数字信号(200)。 特征提取单元在将数字语音信号分割成规则时间间隔(201)之后,提取帧单元(202)中的声学特征参数。 特征补偿单元提取补偿特征参数(203)。 语音识别引擎执行语音识别并输出确认结果(204)。

    음성변조를 위한 음성모델 부호화를 이용한 음성합성 기술 및 장치

    公开(公告)号:KR101910273B1

    公开(公告)日:2018-10-19

    申请号:KR1020170044719

    申请日:2017-04-06

    Inventor: 김회린 서영주

    Abstract: 본발명은자동음성합성에서음성합성장치를구성하는임의의화자의음성모델을음성변조에효과적이면서도효율적인음성모델코드로부호화하고, 상기음성모델코드를변경하거나복수의화자의음성모델코드들을서로조합함으로써변조된목소리의음성정보를담은음성모델코드로변환하고, 변환된음성모델코드로부터해당음성모델을복원하기위하여복호화시키고, 복원된음성모델을활용하여주어진텍스트에해당하는변조된음성파형을합성하는음성합성장치및 방법이개시된다. 일실시예에따른음성합성방법은, 음성모델을음성모델코드로부호화하는단계; 상기음성모델코드를조작함에따라변조된목소리음성정보를포함하는음성모델코드로변환하는단계; 상기부호화된음성모델코드또는상기변조된목소리음성정보를포함하는음성모델코드를복호화하여합성가능한음성모델로복원시키는단계; 및텍스트정보가입력됨에따라상기복원된음성모델에기반하여상기입력된텍스트정보에대해변조된목소리의음성파형을합성하는단계를포함할수 있다.

    화자 검증 장치 및 방법
    8.
    发明授权
    화자 검증 장치 및 방법 有权
    用于演讲者验证的方法和装置

    公开(公告)号:KR101564087B1

    公开(公告)日:2015-10-28

    申请号:KR1020140013852

    申请日:2014-02-06

    Abstract: 본발명의실시예에따르면, GMM에기반한통계모델방식을이용하는화자검증장치의화자검증방법이제공된다. 화자검증장치는제1 화자의제1 입력음성으로부터추출된적어도하나의제1 특징파라미터를이용해, 상기제1 화자를위한제1 화자 GMM 모델을생성한다. 그리고화자검증장치는적어도하나의제2 화자의입력음성으로부터추출된적어도하나의제2 특징파라미터를이용해, 상기제1 화자에대응하는제1 UBM 모델을주변음향환경에적응시킨다. 그리고화자검증장치는제2 입력음성으로부터추출된적어도하나의제3 특징파라미터에대한상기제1 UBM 모델의제1 우도와, 상기제3 특징파라미터에대한상기제1 화자 GMM 모델의제2 우도를비교하고, 상기비교결과에기초해상기제2 입력음성이상기제1 화자의음성인지를판단한다.

    화자 검증 장치 및 방법
    9.
    发明公开
    화자 검증 장치 및 방법 有权
    用于演讲者验证的方法和装置

    公开(公告)号:KR1020150093059A

    公开(公告)日:2015-08-17

    申请号:KR1020140013852

    申请日:2014-02-06

    CPC classification number: G10L17/14 G10L17/04

    Abstract: 본 발명의 실시예에 따르면, GMM에 기반한 통계 모델 방식을 이용하는 화자 검증 장치의 화자 검증 방법이 제공된다. 화자 검증 장치는 제1 화자의 제1 입력 음성으로부터 추출된 적어도 하나의 제1 특징 파라미터를 이용해, 상기 제1 화자를 위한 제1 화자 GMM 모델을 생성한다. 그리고 화자 검증 장치는 적어도 하나의 제2 화자의 입력 음성으로부터 추출된 적어도 하나의 제2 특징 파라미터를 이용해, 상기 제1 화자에 대응하는 제1 UBM 모델을 주변 음향 환경에 적응시킨다. 그리고 화자 검증 장치는 제2 입력 음성으로부터 추출된 적어도 하나의 제3 특징 파라미터에 대한 상기 제1 UBM 모델의 제1 우도와, 상기 제3 특징 파라미터에 대한 상기 제1 화자 GMM 모델의 제2 우도를 비교하고, 상기 비교 결과에 기초해 상기 제2 입력 음성이 상기 제1 화자의 음성인지를 판단한다.

    Abstract translation: 根据本发明的实施例,提供了使用基于GMM的统计模型方法的说话人验证装置的说话人验证方法。 扬声器验证装置使用从第一扬声器的第一输入声音提取的至少一个第一特征参数来生成用于第一扬声器的第一扬声器GMM模型。 扬声器验证装置使用从第二扬声器的至少一个输入声音提取的至少一个第二特征参数,使与第一扬声器对应的第一UBM模型适应于外围声音环境。 扬声器验证装置将从第二输入声音提取的至少一个第三特征参数的第一UBM模型的第一似然值与第三特征参数的第一说话者GMM模型的第二似然值进行比较,并且确定第二输入语音是否为 基于比较结果的第一说话者的声音。

    신뢰성이 높은 우도비를 사용한 음성 검출 장치 및 방법
    10.
    发明授权
    신뢰성이 높은 우도비를 사용한 음성 검출 장치 및 방법 失效
    使用可靠似然比进行语音活动检测的装置和方法

    公开(公告)号:KR101088181B1

    公开(公告)日:2011-12-02

    申请号:KR1020090126274

    申请日:2009-12-17

    Abstract: 본 발명은 잡음 환경에서 음성 인식기와 화자 인식기의 인식성능을 보장하기 위해 사용되는 음성 검출 장치 및 방법에 관한 것으로서, 본 발명의 음성 검출 장치는 신호를 입력받기 위한 입력수단 및 상기 입력수단으로부터 입력된 신호의 우도비(likelihood ratio)를 산출하고, 산출된 우도비 중에서 주파수 빈(bin)의 파워에 따라 우도비를 선택하고, 선택된 우도비를 사용하여 음성신호를 검출하기 위한 분석수단을 포함한다. 본 발명에 의하면 음성 검출 장치에서 우도비의 주파수 빈 파워를 기반으로 우도비를 선택적으로 이용함으로써, 음성 검출 성능을 향상시킬 수 있는 효과가 있다.
    음성 인식, 화자 인식, 검출, 우도비, 주파수 빈, 파워, 푸리에 변환.

Patent Agency Ranking