Abstract:
본 발명은 입력영상에서 적분영상 및 엣지영상을 각각 구하고 그로부터 할-라이크 특징 정보 및 EOH 특징 정보를 추출하고 추출된 정보들을 조합하여 얼굴을 검출하는 얼굴 검출 장치에 관한 것이다. 얼굴 검출 장치는 입력영상으로부터 적분영상 및 엣지영상을 생성하고, 기 저장된 학습 데이터를 이용하여 상기 적분영상으로부터 할-라이크(Haar-like) 특징 정보를 추출하고, 상기 엣지영상으로부터 EOH(Edge of Orientation Histogram) 특징 정보를 추출하는 특징정보 추출수단; 및 상기 조합된 할-라이크 특징 정보 및 EOH 특징 정보에 아다부스트 알고리즘을 적용하여 얼굴을 검출하는 얼굴 검출수단을 포함한다. 할-라이크 특징값 추출, EOH 특징값 추출, 특징값 조합, 아다부스트 알고리즘
Abstract:
A noise-canceling device and a method thereof are disclosed. The disclosed noise-canceling device is a device which removes noises in the signals inputted to multiple voice input devices and comprises a phase difference calculation part calculating a phase difference between a first signal and a second signal inputted to a first voice input device and a second voice input device, respectively; a size difference calculation part extracting noise components from the first signal and the second signal and calculating a size difference between the extracted noise component and the first signal; and a noise-canceling coefficient calculation part calculating a noise-canceling coefficient using the phase difference and the size difference. In accordance with the present invention, an error rate can be reduced by removing the signals having undesired directivity as noise from the signals inputted to the voice input devices, and the divergence or convergence rate of output does not fail due to the convergence of the problems of an adaptive filter by not using the adaptive filter. [Reference numerals] (100) Noise removing device;(AA) Determine voice components;(BB) Apply a fuzzy rule;(CC) Calculate a noise-canceling coefficient;(DD) Reflect a noise-canceling coefficient and perform inverse transformation;(EE) Final output;(FF) Calculate the size difference;(GG) Calculate the phase difference
Abstract:
PURPOSE: An image processing method is provided to obtain a foreground probability value based on a foreground probability histogram about a correlation between a standard image of an input image and the input image, thereby improving the accuracy of separation and being robust in an environment such as the inside of an elevator. CONSTITUTION: Whether each pixel of an input image is a pixel of a foreground image or a pixel of a background image is determined by a Gaussian mixture model (S21). Whether each pixel is included in a motion area is determined (S22). With regard to each pixel, a foreground probability value is obtained based on a foreground probability histogram about a correlation between a standard image of the input image and the input image (S23). If the foreground probability value of a pixel of the examined foreground image or a pixel in the motion area is above a given threshold value, the pixel is determined as a pixel of the foreground image (S24). [Reference numerals] (AA) Start; (BB) No; (CC) Yes; (DD) End; (S21) Whether each pixel of an input image is a pixel of a foreground image or a pixel of a background image is determined by a Gaussian mixture model; (S22) Whether each pixel is included in a motion area is determined; (S23) With regard to each pixel, a foreground probability value is obtained based on a foreground probability histogram about a correlation between a standard image of the input image and the input image; (S24) If the foreground probability value of a pixel of the examined foreground image or a pixel in the motion area is above a given threshold value, the pixel is determined as a pixel of the foreground image; (S25) Standard image is updated; (S26) Is there an ending signal ?
Abstract:
A voice recognition apparatus for recognizing a voice by using a microphone array and a microphone array driving method thereof are provided to mount the microphone array in an endfire type, and protrude the microphone array if a user is recognized, thereby suppressing surrounding noise through the microphone array and receiving a voice signal more accurately. A voice recognition apparatus includes a microphone array(504), a microphone array mounting unit(502), a microphone array driver(506), a beam forming unit(508), a control unit(500), and a memory unit(510). The microphone array is composed of at least one microphone, and is mounted in an endfire type to the voice recognition apparatus to receive a voice in an endfire direction. The microphone array mounting unit mounts the microphone array. The microphone array mounting unit protrudes or mounts the microphone array according to a control signal for driving the microphone array. The control unit outputs the control signal for protruding the microphone array to the microphone array mounting unit if a user is recognized.
Abstract:
멀티음성채널 음성신호의 적응적 잡음제거를 위한 전처리 방법 및 장치가 개시된다. 그 전처리 장치는 멀티음성채널의 각 입력채널별로 매 프레임의 채널신호 평균이득(RMS) 값을 계산하는 평균이득 계산부; 상기 평균이득 계산부에서 계산된 평균이득을 이용하여 상기 입력채널 간의 상대적인 평균이득비를 계산하는 이득비추정부; 및 상기 이득비 추정부에서 계산된 평균이득비의 역을 이용하여 상기 입력채널별로 입력신호를 보정하는 이득비역보상부를 포함함을 특징으로 한다. 본 발명에 의하면, 전체 시스템의 잡음 제거 성능을 향상 할 수 있다. 또한 잡음 제거의 모든 과정이 시간 도메인에서 처리되도록 함으로써 매 샘플마다 잡음 추정 과정을 진행할 수 있으며, 실시간적용에 적합한 작은 계산량을 갖는다. 추가로 잘못된 이득 비 추정에 대한 제한을 둠으로써 기존 GSC의 성능을 저해하는 것을 방지한다.
Abstract:
잡음환경에 강인한 음성인식을 위한 에너지 특징 보상 방법 및 장치가 개시된다. 그 에너지 특징 보상 방법은 (a) 잡음이 없는 깨끗한 환경에서 수집한 음성 훈련데이터의 에너지 특징을 잡음환경의 에너지와 유사한 환경으로 변환시키는 단계; (b) 인식 음성데이터의 에너지 최소값이 소정의 목표 최소값보다 큰지 체크하여, 상기 음성데이터의 에너지 최소값이 상기 목표 최소값보다 작으면, 에너지의 최소값과 최대값의 중간값 이하만 ERN 변환식에 의해 변환시키는 Half-ERN을 수행하는 단계; 및 (c) 인식 음성데이터의 에너지 최소값이 목표 최소값보다 작지 않으면 에너지 특징을 소정의 방법으로 보상하는 단계를 포함함을 특징으로 한다. 본 발명에 의하면, 보다 다양한 환경에 더욱 강인한 에너지 특징 보상이 가능하게 되어 잡음 환경에서의 음성 인식률을 향상시킬 수 있다.