Abstract:
A processing method of a noisy speech signal and a computer readable recording medium therefor are provided to efficiently improve sound quality even under various types of noise conditions. An input noisy speech signal of the current frame is converted into a frequency domain to generate a conversion signal consisting of conversion coefficients. Noise is estimated by using the conversion signal(S35). A spectrum subtraction is carried out by using the estimated noise to obtain an improved speech signal. The noise estimation process is performed as follows. If a scale factor is smaller than a predetermined threshold value, the first noise is estimated by using the input noisy speech signal only.
Abstract:
웨이블릿 패킷 변환 도메인 또는 퓨리에 변환 도메인 등과 같은 주파수 도메인에서의 새로운 순환 평균 기반 노이즈 추정을 포함하는 노이지 음성 신호의 처리 절차에 관하여 개시한다. 본 발명의 일 실시예에 의하면, 노이지 음성 신호의 웨이블릿 패킷 변환 계수(WPTC)의 크기에 대한 추정된 노이즈의 WPTC의 크기의 비로써, 노이즈 추정을 위한 스케일링 인자를 정의한다. 그리고 종래의 순환 평균 기반 노이즈 추정에서 사용하는 것과는 달리, 본 발명의 실시예에 의하면, 과거의 추정된 노이즈 신호보다는 현재의 입력 노이지 음성 신호에 더 높은 가중치를 부여하여 노이즈 추정을 수행한다. 따라서 본 발명의 실시예에 의하면, 비정적인 노이즈의 변동을 신속하고 또한 정확하게 추적할 수가 있다. 그리고 본 발명의 실시예에 의하면, 노드 레벨에서 인접한 노드 사이의 WPTC의 크기비를 이용하여 묵음 프레임인지를 판정하고 또한 그 결과를 스케일링 인자를 추정하는데 곧바로 반영함으로써, 스케일링 인자를 정확하게 추정할 수가 있다. 이러한 본 발명의 실시예에 의하면, 노이즈 도미넌트 프레임에서 시간 지연이 생기는 것을 방지할 수 있을 뿐만 아니라 뮤지컬 노이즈가 잔류하는 현상이나 음성의 왜곡을 방지할 수가 있다. 노이즈 추정, 순환 평균, 균일 웨이블릿 패킷 변환, 퓨리에 변환, 묵음 프레 임
Abstract:
웨이블릿 패킷 변환 도메인 또는 퓨리에 변환 도메인 등과 같은 주파수 도메인에서의 새로운 순환 평균 기반 노이즈 추정을 포함하는 노이지 음성 신호의 처리 장치와 그 장치를 포함하는 음성 기반 어플리케이션 장치에 관하여 개시한다. 본 발명의 일 실시예에 따른 노이지 음성 신호의 처리 장치는 균일 웨이블릿 패킷 변환 유닛, 스무딩 유닛, 노이즈 추정 유닛, 및 스펙트럼 차감 유닛을 포함한다. 노이즈 추정 유닛은 스무딩 유닛으로부터 생성된 스무드된 변환 신호의 인접한 노드 사이의 웨이블릿 패킷 변환 계수의 크기비를 이용하여 현재 프레임이 묵음 프레임인지를 판정하고, 만일 현재 프레임이 묵음 프레임인 경우에는 스케일링 인자를 업데이트한 후에 스무드된 변환 신호를 이용하여 노이즈를 추정하고, 만일 현재 프레임이 묵음 프레임이 아닌 경우에는 곧바로 스무드된 변환 신호를 이용하여 노이즈를 추정한다. 따라서 본 발명의 실시예에 의하면, 비정적인 노이즈의 변동을 신속하고 또한 정확하게 추적할 수가 있으며, 노이즈 도미넌트 프레임에서 시간 지연이 생기는 것을 방지할 수 있을 뿐만 아니라 뮤지컬 노이즈가 잔류하는 현상이나 음성의 왜곡을 방지할 수가 있다. 노이즈 추정, 순환 평균, 균일 웨이블릿 패킷 변환, 퓨리에 변환, 묵음 프레 임
Abstract:
An apparatus for processing noisy speech signals and a speech-based application system including the same are provided to prevent a time delay by tracking rapidly and correctly a change of noise in case of a noisy dominant signal. An apparatus for processing noisy speech signals includes a conversion unit(110), a noise estimation unit(130), a spectrum subtraction unit(140), and a reverse conversion unit(150). The conversion unit generates a conversion signal including conversion coefficients by converting an input noisy speech signal of a present frame to a frequency domain. The noise estimation unit estimates the noise by using the conversion signal. The noise estimation unit estimates the first noise and the second noise by using the input noisy speech signal and a noise-estimated value of a previous frame. The spectrum subtraction unit obtains an improved speech signal. The reverse conversion unit converts reversely the improved speech signal to a time domain.