최대 사후 고유공간에 근거한 화자적응 방법
    1.
    发明公开
    최대 사후 고유공간에 근거한 화자적응 방법 无效
    基于最大位置特征的扬声器适配方法

    公开(公告)号:KR1020050063299A

    公开(公告)日:2005-06-28

    申请号:KR1020030094690

    申请日:2003-12-22

    Inventor: 김동국 김승희

    Abstract: 본 발명은 최대 사후 고유공간에 근거한 화자적응 방법에 관한 것으로, 음성인식에서 학습화자와 인식화자의 차이로 인하여 음성인식의 성능 저하를 극복하기 위해 적은 양의 적응 데이터가 주어지는 경우 화자공간에 근거한 적응기법을 향상 시켜 학습화자나 특정화자로부터 얻어진 선 화자공간 정보를 이용하여 새로운 적응데이터와 결합하는 적응기법을 사용함으로써 학습화자와 인식화자 간의 불일치 환경에서 인식 성능을 향상시킬 수 있고 인식 시스템의 특정화자에 대한 적응이 향상되는 이점이 있다.

    고유음성 화자적응을 이용한 재귀적 화자적응 음성인식시스템 및 방법
    2.
    发明公开
    고유음성 화자적응을 이용한 재귀적 화자적응 음성인식시스템 및 방법 失效
    演播员自适应语音识别系统及使用音源扬声器适配的方法

    公开(公告)号:KR1020050043472A

    公开(公告)日:2005-05-11

    申请号:KR1020030078383

    申请日:2003-11-06

    Inventor: 전형배 김동국

    Abstract: 본 발명은 고유음성 화자적응을 이용한 재귀적 화자적응 음성인식 시스템 및 방법에 관한 것으로, 입력된 화자 음성을 1차 인식하고, 상기 1차 인식된 음성결과를 이용하여 비교사(Unsupervised Adaptation)방법으로 고유음성(EigenVoice) 화자적응을 수행한 후, 상기 화자적응 된 음향모델을 이용하여 화자 음성을 2차 적으로 인식함으로써 인식률 보다 더 향상시킬 수 있다.
    본 발명은 입력된 음성신호로부터 음성인식에 사용되는 특징벡터를 추출하는 음성특징 추출부와, 상기 추출된 특징벡터와 이미 훈련되어 있는 화자독립 음향모델을 이용하여 상기 음성신호의 어휘를 인식하는 1차 인식부와, 상기 1차 인식부의 인식결과인 레이블 정보와 상기 음성특징 추출부의 특징벡터인 관측 데이터를 참조하여 화자적응을 수행하는 화자 적응부 및 상기 화자 적응부에서 제공하는 화자종속 음향모델을 이용하여 상기 음성신호의 인식결과를 출력하는 2차 인식부로 구성된다.

    고유음성 화자적응을 이용한 재귀적 화자적응 음성인식시스템 및 방법
    3.
    发明授权
    고유음성 화자적응을 이용한 재귀적 화자적응 음성인식시스템 및 방법 失效
    递归演讲者适应自动化语音识别系统和方法使用EigenVoice Speaker Adaptation

    公开(公告)号:KR100586045B1

    公开(公告)日:2006-06-07

    申请号:KR1020030078383

    申请日:2003-11-06

    Inventor: 전형배 김동국

    Abstract: 본 발명은 고유음성 화자적응을 이용한 재귀적 화자적응 음성인식 시스템 및 방법에 관한 것으로, 입력된 화자 음성을 1차 인식하고, 상기 1차 인식된 음성결과를 이용하여 비교사(Unsupervised Adaptation)방법으로 고유음성(EigenVoice) 화자적응을 수행한 후, 상기 화자적응 된 음향모델을 이용하여 화자 음성을 2차 적으로 인식함으로써 인식률을 더욱 향상시킬 수 있다.
    본 발명은 입력된 음성신호로부터 음성인식에 사용되는 특징벡터를 추출하는 음성특징 추출부와, 상기 추출된 특징벡터와 이미 훈련되어 있는 화자독립 음향모델을 이용하여 상기 음성신호의 어휘를 인식하는 1차 인식부와, 상기 1차 인식부의 인식결과인 레이블 정보와 상기 음성특징 추출부의 특징벡터인 관측 데이터를 참조하여 화자적응을 수행하는 화자 적응부 및 상기 화자 적응부에서 제공하는 화자종속 음향모델을 이용하여 상기 음성신호의 인식결과를 출력하는 2차 인식부로 구성된다.
    음성인식 시스템, 화자적응, 고유음성(EigenVoice), 비교사 방식

    음성인식을 위한 학습과 인식 방법 및 시스템
    4.
    发明公开
    음성인식을 위한 학습과 인식 방법 및 시스템 无效
    训练和识别方法和系统的鲁棒语音识别

    公开(公告)号:KR1020050063995A

    公开(公告)日:2005-06-29

    申请号:KR1020030095256

    申请日:2003-12-23

    Inventor: 김동국 김승희

    Abstract: 본 발명은 음성 학습과 인식과정에서 시간에 따라 변화하는 잡음 또는 채널 보상 알고리즘을 통합하여 음성인식 성능을 향상시키는 방법 및 그 시스템에 관한 것이다.
    본 발명의 학습 시스템은 오염된 학습입력 음성을 입력받아 특징을 추출하는 특징추출부; 잡음/채널 모델 파라메터를 입력받아 깨끗한 음성의 HMM 파라메터를 추정하는 HMM 파라메터 추정부; 상기 추정된 HMM 파라메터를 입력받아 잡음/채널 모델 파라메터를 추정하는 잡음/채널 모델 추정부; 및 상기 추정된 HMM 파라메터를 저장하기 위한 HMM 파라메터 저장부로 구성되고, 인식시스템은 인식할 음성을 입력받아 특징을 추출하는 특징추출부; 미리 추정된 HMM 파라메터를 저장하고 있는 HMM 파라메터 저장부; 상기 HMM 파라메터 저장부로부터 추정된 HMM 파라메터를 입력받아 잡음/채널 모델 파라메터를 추정하는 잡음/채널 모델 추정부; 및 상기 잡음/채널 모델 추정부로부터 추정된 잡음/채널 모델 파라메터를 입력받고 상기 HMM 파라메터 저장부로부터 추정된 HMM 파라메터를 입력받아 입력된 음성을 인식하여 그 결과를 출력하는 디코더를 구비한다.

    잡음 및 채널 공간 모델에 근거한 음성인식 방법
    5.
    发明公开
    잡음 및 채널 공간 모델에 근거한 음성인식 방법 无效
    基于噪声和通道空间模型的鲁棒语音识别

    公开(公告)号:KR1020050063987A

    公开(公告)日:2005-06-29

    申请号:KR1020030095246

    申请日:2003-12-23

    Inventor: 김동국 김승희

    Abstract: 본 발명은 음성인식 분야에서 잡음과 채널에 의해 학습과 인식하는 환경의 차이로 인하여 음성인식 시스템의 성능이 저하되는데 이를 보상하여 성능을 향상 시키는 방법에 관한 것이다.
    본 발명은 잡음 및 채널을 모델링하기 위해 새로운 잡음 및 채널 공간 모델을 제안하고 이를 바탕으로 하여 공간 모델에 대한 파라메터를 추정한다. 추정된 파라메터에 근거하여 잡음이나 채널이 제거된 깨끗한 음성을 추정함으로 인식기 성능을 높일 수 있다.

    고유음성 계수를 이용한 화자종속 음성인식 시스템 및 방법
    6.
    发明公开
    고유음성 계수를 이용한 화자종속 음성인식 시스템 및 방법 无效
    使用EIGENVOICE系数的扬声器语音识别符号及其方法

    公开(公告)号:KR1020050063986A

    公开(公告)日:2005-06-29

    申请号:KR1020030095245

    申请日:2003-12-23

    Abstract: 본 발명은 전화망 음성인식 시스템에 있어서 EigenVoice 계수 값을 미리 등록하고, 인식 단계에서 화자종속 음향모델을 생성하여 화자종속 음성인식을 수행할 수 있도록 하는 것으로, 입력된 화자 ID로부터 해당 화자의 등록된 EigenVoice 계수값을 읽어들여 화자종속 음향모델을 생성하는 제 1단계; 및 상기 생성된 화자종속 음향모델을 이용하여 화자의 음성신호로부터 추출된 음성특징에 대해 인식대상 어휘로 구성된 탐색공간을 탐색하여 등록화자의 최종 음성인식을 수행하는 제 2단계;를 통해 화자의 음성을 인식할 수 있도록 하는 EigenVoice 계수를 이용한 화자종속 음성인식 시스템 및 방법에 관한 것이다.

Patent Agency Ranking