Abstract:
개선된 감쇠 특성을 가지는 디지털 필터가 개시된다. 개시된 필터는 모델 필터 응답에 대해 샘플링 상수에 의해 스케일링되는 샘플링 커널을 적용하여 업샘플링을 수행한다. 개시된 필터는 적은 탭 수로 양호한 감쇠 특성을 가지며, 필터의 통과 대역을 단순한 파라미터 변경으로 변화시킬 수 있는 장점이 있다.
Abstract:
A processing method of a noisy speech signal and a computer readable recording medium therefor are provided to efficiently improve sound quality even under various types of noise conditions. An input noisy speech signal of the current frame is converted into a frequency domain to generate a conversion signal consisting of conversion coefficients. Noise is estimated by using the conversion signal(S35). A spectrum subtraction is carried out by using the estimated noise to obtain an improved speech signal. The noise estimation process is performed as follows. If a scale factor is smaller than a predetermined threshold value, the first noise is estimated by using the input noisy speech signal only.
Abstract:
An apparatus for processing noisy speech signals and a speech-based application system including the same are provided to prevent a time delay by tracking rapidly and correctly a change of noise in case of a noisy dominant signal. An apparatus for processing noisy speech signals includes a conversion unit(110), a noise estimation unit(130), a spectrum subtraction unit(140), and a reverse conversion unit(150). The conversion unit generates a conversion signal including conversion coefficients by converting an input noisy speech signal of a present frame to a frequency domain. The noise estimation unit estimates the noise by using the conversion signal. The noise estimation unit estimates the first noise and the second noise by using the input noisy speech signal and a noise-estimated value of a previous frame. The spectrum subtraction unit obtains an improved speech signal. The reverse conversion unit converts reversely the improved speech signal to a time domain.
Abstract:
통과 대역의 재구성이 가능한 디지털 필터 장치가 개시된다. 개시된 필터 장치는 소정의 샘플링 상수에 기초한 보간을 통해 다수의 멀티 이미지에 상응하는통과 대역을 형성하는 제1 출력 및 상기 멀티 이미지가 형성되지 않는 주파수 영역에 다수의 컴플리멘터리 이미지에 상응하는 통과 대역을 형성하는 제2 출력을 생성하는 업샘플링부; 상기 업샘플링부의 제1 출력에 포함된 멀티 이미지 및 제2 출력에 포함된 컴플리멘터리 이미지의 개수를 조절하여 출력하는 이미지 개수 조절 출력부; L번째 이미지까지 개수가 조절된 상기 이미지 개수 조절 출력부의 출력과 (L-1)번째 이미지까지 개수가 조절된 상기 이미지 개수 조절부의 출력을 차감함으로써 각 멀티 이미지 및 멀티 컴플리멘터리 이미지에 상응하는 대역 통과 신호를 출력하는 제2 차감부; 상기 제2 차감부에서 출력하는 각 멀티 이미지 및 각 멀티 컴플리멘터리 이미지의 대역 통과 신호를 저장하는 레지스터; 사용자가 지정한 통과 대역에 상응하는 멀티 이미지 또는 멀티 컴플리멘터리 이미지의 대역 통과 신호를 상기 레지스터로부터 추출하여 합산하는 합산부를 포함한다. 개시된 필터 장치에 의하면, 단순한 파라미터의 변경을 통해 간단히 통과 대역을 변경시킬 수 있는 장점이 있다.
Abstract:
A voice processing method for improving sound quality in a highly non-stationary noise environment is provided to adaptively estimate noise by using a size SNR(Signal-to-Noise Ratio) and a determining rule for discriminating whether a current sub-band is close to a voice or noise. A uniform wavelet packet-converted signal is generated with respect to a single interval of a voice signal with noise. An upper relative ratio, a lower relative ratio and a distribution ratio are obtained from a frame of the converted signal. An identifier of a determining rule is calculated by using the three types of ratios. It is successively discriminated whether a sub-band of a frame includes only noise or both noise and a voice by comparing the calculated identifier of the determining rule and a threshold value, a size SNR indicating an amount of noise existing in the sub-band, and noise is estimated by using the size of coefficient of the uniform wavelet packet existing in the sub-band and the size SNR. The estimated noise is subtracted from the voice with a noise to obtain an improved voice signal.
Abstract:
개선된 감쇠 특성을 가지는 디지털 필터가 개시된다. 개시된 필터는 모델 필터 응답에 대해 샘플링 상수에 의해 스케일링되는 샘플링 커널을 적용하여 업샘플링을 수행한다. 개시된 필터는 적은 탭 수로 양호한 감쇠 특성을 가지며, 필터의 통과 대역을 단순한 파라미터 변경으로 변화시킬 수 있는 장점이 있다.
Abstract:
주파수 재구성이 가능한 디지털 필터 및 필터 설계 방법이 개시된다. 개시된 필터 설계 방법은 기저 대역의 필터 응답에 대해 일정 주기를 가지고 반복되는 다수의 멀티 이미지를 생성하는 단계(a); 상기 멀티 이미지가 생성되지 않은 주파수 영역에 상기 일정 주기를 가지고 반복되는 다수의 멀티 컴플리멘터리 이미지를 생성하는 단계(b); 상기 멀티 컴플리멘터리 이미지 및 상기 멀티 이미지 중 선택된 대역에 상응하는 이미지를 적어도 하나 선택하는 단계(c); 상기 선택된 이미지에 상응하는 필터 응답을 생성하는 단계(d)를 포함한다. 본 발명에 의하면, 하드웨어를 변경하지 않으면서 다양한 대역 통과 특성을 가지도록 주파수 재구성이 가능하고, 매우 적은 수의 파라미터 변경만으로 다양한 대역 통과 특성을 가지도록 주파수 재구성이 가능하며 사용자가 용이하게 필터의 대역을 변경할 수 있도록 다수의 이미지 조합을 통해 주파수 재구성이 가능한 장점이 있다.
Abstract:
웨이블릿 패킷 변환 도메인 또는 퓨리에 변환 도메인 등과 같은 주파수 도메인에서의 새로운 순환 평균 기반 노이즈 추정을 포함하는 노이지 음성 신호의 처리 장치와 그 장치를 포함하는 음성 기반 어플리케이션 장치에 관하여 개시한다. 본 발명의 일 실시예에 따른 노이지 음성 신호의 처리 장치는 균일 웨이블릿 패킷 변환 유닛, 스무딩 유닛, 노이즈 추정 유닛, 및 스펙트럼 차감 유닛을 포함한다. 노이즈 추정 유닛은 스무딩 유닛으로부터 생성된 스무드된 변환 신호의 인접한 노드 사이의 웨이블릿 패킷 변환 계수의 크기비를 이용하여 현재 프레임이 묵음 프레임인지를 판정하고, 만일 현재 프레임이 묵음 프레임인 경우에는 스케일링 인자를 업데이트한 후에 스무드된 변환 신호를 이용하여 노이즈를 추정하고, 만일 현재 프레임이 묵음 프레임이 아닌 경우에는 곧바로 스무드된 변환 신호를 이용하여 노이즈를 추정한다. 따라서 본 발명의 실시예에 의하면, 비정적인 노이즈의 변동을 신속하고 또한 정확하게 추적할 수가 있으며, 노이즈 도미넌트 프레임에서 시간 지연이 생기는 것을 방지할 수 있을 뿐만 아니라 뮤지컬 노이즈가 잔류하는 현상이나 음성의 왜곡을 방지할 수가 있다. 노이즈 추정, 순환 평균, 균일 웨이블릿 패킷 변환, 퓨리에 변환, 묵음 프레 임
Abstract:
A sound quality enhancement method by overweighting gain of a nonlinear structure in a wavelet packet area is provided to restrain the generation of musical noise efficiently and ensure reliable intelligibility in an enhanced voice. A sound quality enhancement method by overweighting gain of a nonlinear structure in a wavelet packet area comprises the following steps of: generating a converting signal that a voice signal polluted by noise is converted by UWPT(Uniform Wavelet Packet Transform); calculating a relative size difference, which is an identifier for calculating a relative difference between the amount of noise existing in a sub band and the amount of a voice polluted by noise; calculating the overweighting gain of the nonlinear structure from the relative size difference; calculating a transformed time-varying gain function based on an LSL(Least-Squares Line) algorithm; and performing spectral subtraction using the transformed time-varying gain function.