Abstract:
본발명은액티브 3D 마이크그리드맵을형성및 이용하는서비스시스템및 그동작방법에관한것으로서, 본발명의실시예에따른액티브 3D 마이크그리드맵을형성및 이용하는서비스시스템은다수의스마트기기로부터현재상태정보를수신하는수신부, 수신된상기현재상태정보를기반으로상기다수의스마트기기에대한액티브 3D 마이크그리드맵을형성하는형성부, 및형성된상기액티브 3D 마이크그리드맵을이루는상기다수의스마트기기로부터수신되는소리신호를기반으로기능을동작하는제어부를포함한다.
Abstract:
음성인식으로 생성되는 래티스 구조를 컨퓨젼 네트워크 구조로 변환하는 과정에서 래티스 링크 확률의 한계치를 설정하여 컨퓨젼 네트워크의 생성 속도를 향상시키도록 한 한국어 연속 음성인식을 위한 컨퓨젼 네트워크 리스코어링 장치 및 이를 이용한 컨퓨젼 네트워크 생성 방법 및 리스코어링 방법이 제시된다. 제시된 한국어 연속 음성인식을 위한 컨퓨젼 네트워크 리스코어링 장치를 이용한 컨퓨젼 네트워크 생성 방법은 음성인식을 통해 생성되는 하나 이상의 래티스를 입력받는 단계; 입력받은 하나 이상의 래티스들 각각의 사후 확률을 연산하는 단계; 연산한 사후 확률을 근거로 래티스에 포함된 노드를 복수의 동치류로 할당하는 단계; 복수의 동치류를 이용하여 컨퓨젼 세트를 생성하는 단계; 및 생성된 컨퓨젼 세트를 근거로 컨퓨젼 네트워크를 생성하는 단계를 포함한다.
Abstract:
PURPOSE: A statistical bilinear model training method for bilinear model-based speaker adaptation is provided to obtain high performance by adjusting the number of content basis vectors of a bilinear model even though adaptation data is too few. CONSTITUTION: A speaker model composing unit(210) composes an observation matrix a training database to apply a bilinear model. An observation matrix composing unit(220) the observation matrix by using composed SD(Speaker Dependent) models. A bilinear model composing unit(230) composes a statistical bilinear model(232) to obtain a symmetric bilinear model parameter. A speaker adaptation unit(240) estimates only an SF(Style Factor) for a new speaker by using the composed bilinear model even if adaptation data of the new speaker is inputted. [Reference numerals] (211) Training data; (212) Modeling by each speaker; (220) Composing an observation matrix; (231) Composing a statistical bilinear model; (232) Statistical bilinear model; (241) Applying to a speaker based on the Statistical bilinear model; (242) Speaker adaptation model; (AA,EE) Speaker 1; (BB) Speaker 2; (CC) Speaker S-1; (DD,FF) Speaker S; (GG) Statistical estimation algorithm; (HH) Voice for adapting to a speaker; (II) Test voice; (JJ) Voice recognizer; (KK) Recognition result
Abstract:
PURPOSE: A pronunciation space formation apparatus is provided to minutely model pronunciation modification rules within a word or between words by applying a probabilistic pronunciation modification rule and expanding a pronunciation space. CONSTITUTION: A pronunciation space generator(110) creates a pronunciation space based on a recognition target word. A pronunciation space expansion unit(120) expands the created pronunciation space in consideration of pronunciation modification rules within a word or between words. A power supply unit(130) supplies a power source to the pronunciation space generator and the pronunciation space expansion unit. A main control unit(140) controls the whole operation of the pronunciation space generator and the pronunciation space expansion unit.