Abstract:
본 발명에 따르는 클러스터 기반 손실 특징 복원 알고리즘을 위한 마스크 추정 방법은, 관찰신호를 입력받아 관심음원을 검출하는 단계; 상기 관찰신호와 상기 관심음원을 제공받아 주파수별 SIR을 산출하는 단계; 상기 주파수별 SIR를 토대로 주파수마다 상이한 문턱값을 가지는 이진 마스크를 추정하는 단계;를 구비함을 특징으로 한다.
Abstract:
The present invention relates to a method and a system for recognizing a voice using three-dimensional geometry information. The voice recognition system comprises a learning module and a recognizing module. The learning module generates a recognition unit using three-dimensional geometry information for study and three-dimensional features for study extracted from the information. The recognizing module applies the three-dimensional geometry information acquired from a physical target related or belonged to a voice or three-dimensional features extracted from the geometry information to the recognition unit, and conducts voice recognition. The method and the system for recognizing a voice according to the present invention, recognizes a voice using three-dimensional geometry information on lips, a part around the lips, or one or more arbitrary regions of a human body in speech. Also, final voice recognition is conducted by combining two-dimensional features and sound features, and three-dimensional features and sound features in speech, and by combining recognition result of the two-dimensional features or sound features, or recognition result of the three-dimensional geometry information or three-dimensional features in speech. Therefore, the accuracy of voice recognition is improved.
Abstract:
본 발명은 외부의 사운드 신호를 기반으로 한 반주 제공 장치에 관한 것이다. 상기 반주 제공 장치는 외부의 입력 장치로부터 사운드 신호가 입력되는 신호 입력부; 다수 개의 음원들에 대한 정보가 저장된 음원 데이터베이스; 상기 신호 입력부로부터 사운드 신호가 제공되면, 사전 설정된 시간 간격의프레임으로 분할하고 각 프레임에 대한 멜로디를 추출하는 멜로디 추출부; 상기 멜로디 추출부에 의해 추출된 각 프레임에 대한 멜로디를 반음계로 변환시키는 반음계 변환부; 상기 신호 입력부로부터 사운드 신호가 제공되면, 각 프레임에 대한 온셋 정보를 검출하여 제공하는 온셋 검출부; 상기 반음계 변환부로부터 각 프레임에 대한 반음 정보를 수신하고, 상기 온셋 검출부로부터 각 프레임에 대한 온셋 정보를 수신하며, 상기 온셋 정보를 이용하여 사운드 신호의 시작 프레임을 검출하고, 상기 사운드 신호의 시작 프레임부터 일정시간동안 기본 주파수에 해당하는 멜로디 시퀀스를 추정하여 제공하는 멜로디 시퀀스 추정부; 상기 멜로디 시퀀스 추정부에 의해 추정된 멜로디 시퀀스와 상기 음원 데이터베이스의 음원들의 멜로디 시퀀스를 비교하여 상기 사운드 신호의 멜로디 시퀀스와 가장 유사한 멜로디 시퀀스를 갖는 유사 음원을 검색하는 음원 선택부; 상기 사운드 신호의 음정과 박자에 따라 유사 음원에 대한 반주를 보정하여 출력하는 반주 보정부와 반주 출력부;를 구비한다.
Abstract:
A reverberated signal removal method according to the present invention is characterized by estimating a reverberation filter from a reverberated voice signal in a single channel inputted through a single microphone and then estimating a clean voice signal in which the reverberated signal is removed. To do so, considering a case where the reverberated voice signal has an excellent sparseness characteristic, a magnitude spectrum is used to expand the sparseness difference between the clean voice signal and the reverberated voice signal. Also, a cost function is determined considering general characteristics that the spectral components of a voice signal have frequency dependency on each other. Moreover, the method according to the present invention is characterized by estimating the original voice signal and a reverberation filter considering that the power spectrum of a reverberation filter has an envelope in which the amplitude of a signal exponentially declines against a time variable. [Reference numerals] (AA) Start;(BB) End;(S100) Input a voice signal in which the original voice signal and a reverberation filter are synthesized;(S110) Transform the voice signal into short-time fourier;(S120) Determine a cost function considering the voice signal, the original voice signal, and the reverberation filter;(S130) Estimate the original voice signal and the reverberation filter by repeating the cost function;(S140) Correct the cost function;(S150) Re-estimate the original signal again by repeatedly applying the estimated reverberation filter to the corrected cost function
Abstract:
The present invention relates to a noise removing device and a method thereof, more specifically, to a noise removing device and a method thereof for speech recognition. The present invention is a device for removing input signal noise and comprises a target signal extraction part extracting a first target signal from the input signals; a target signal removing part extracting a first noise signal from the input signals by using a second separation vector; a detection part extracting speech section information of the first target signal; and a first noise removing part calculating a weighted value from the first noise signal by using the speech section information and removing the noise from the first target signal by using the weighted value. [Reference numerals] (101) Target signal extraction part;(103) Target signal removing part;(105) Detection unit;(107) First noise removing part;(109) Second noise removing part;(111) Sound recognition unit
Abstract:
PURPOSE: An accompaniment providing method and an accompaniment providing system using the same are provided to provide an accompaniment which fits for the intonation and rhythm of a user by extracting a melody from a sound and searching the most similar sound source. CONSTITUTION: A sound signal is inputted from an external input unit to a signal input unit (105). Information about multiple sound sources is stored in a sound source database. A melody extracting unit (110) divides a melody into preset time interval frames. The melody extracting unit extracts a melody about each frame. A chromatic scale converting unit (120) converts the melody about each frame which is extracted by the melody extracting unit into a chromatic scale. An onset detecting unit detects and provides onset information about each frame. [Reference numerals] (100) Sound source database; (105) Signal input unit; (110) Melody extracting unit; (120) Chromatic scale converting unit; (130) Onset extracting unit; (140) Melody sequence estimating unit; (150) Similar sound source selecting unit; (160) Accompaniment correction unit; (170) Accompaniment output unit
Abstract:
본 발명에 따르는 관심음원 제거방법은, 두 개의 마이크 각각으로부터의 입력 혼합신호를 제공받아 단구간 푸리에 변환하여 시간-주파수 영역으로 변환하는 단계; 상기 시간-주파수 영역의 입력 혼합신호들로부터 관심음원을 제거하기 위한 관심음원제거 벡터를 설정하는 단계; 상기 관심음원제거 벡터를 이용하여 입력 혼합신호에서 관심음원을 제거하여 혼합된 잡음신호를 생성하는 단계;를 구비함을 특징으로 한다.
Abstract:
본 발명에 따르는 신호의 시간 지연 및 감쇄 추정에 기반한 반향 환경에서의 암묵 음원 분리 방법은, 본 발명의 암묵 음원 분리 방법은, 둘 이상의 마이크로부터의 혼합신호들을 입력받는 단계; 상기 혼합신호들을 STFT(Short Time Fourier Transform)하여 시간-주파수 영역의 혼합신호들로 변환하는 단계; STFT된 혼합신호들에 대해, 주파수별 감쇄 및 시간 지연 값에 대한 초기화를 수행하고, 초기화된 주파수별 감쇄 및 시간 지연 값이 수렴되도록 학습시키고, 학습된 주파수별 감쇄 및 시간 지연 값을 토대로 주파수별 이진 마스크를 생성하고, 상기 주파수별 이진 마스크를 이용하여 주파수별로 신호를 분리하고, 상기 주파수별로 분리된 신호들에 대해 상관 계수를 구하여 주파수별로 분리된 신호들에 대한 순서를 맞추는 단계; 상기 순서가 맞춰진 신호들을 ISTFT(Inverse Short Time Fourier Transform)하여 시간 영역의 음원 신호들로 복원하는 단계;를 구비한다.