Abstract:
PURPOSE: An audio signal processing method and an apparatus thereof are provided to apply a coding method about one frame and to prevent mismatch of an audio signal due to asymmetry of a window type. CONSTITUTION: A de-multiplexing unit(210) receives an audio signal. The audio signal includes first data of a first block and second data of a second block. The de-multiplexer receives a correcting signal corresponding to the second block. A rectangular decoding unit(220R) estimates the prediction of an aliasing part by using the first data.
Abstract:
PURPOSE: An apparatus for detecting audio target signal and a method for the same are provided to apply weighted value to a reference model by measuring normal distribution matching degree. CONSTITUTION: A specific parameter extracting unit(10) extracts feature parameters from an audio stream. A regularity measuring unit(20) measures a normal distribution matching degree which is extracted from the feature parameter extracting unit. A target signal detection unit(30) detects the target signal by applying the specific feature parameters and the measured result of regularity measuring unit to a predetermined reference model. The target signal detection unit applies the measured result to the reference model as a weighted value.
Abstract:
PURPOSE: An audio signal process method and a device are provided to classify various audio signals and provide an appropriate audio coding method according to the property of each audio signal thereby more efficiently compressing the audio signals. CONSTITUTION: A demultiplexer(210) extracts the first type information and the second type information from a bit stream. A decoder determiner(220) distinguishes whether the code type of the audio signal is a music signal code type using the first type information. If the code type of the audio signal is not the music signal code type, the decoder determiner distinguishes whether the code type of the audio signal is voice signal code type or complex signal code type using the second type information. The decoder determiner decides the decoding method through the identification result.
Abstract:
PURPOSE: A method and an apparatus for processing a signal are provided to optimally process signals, which have different characteristics, according to the characteristics. CONSTITUTION: A harmonic signal is separated form an input signal(S110), and the power ratio of the harmonic signal for the input signal is calculated(S120). Based on the power ratio, the mode information which is the information on the coding method is determined(S130). The harmonic signal is encoded in a first coding mode(S140), and a residual signal is created(S150). The residual signal is encoded in a second coding method(S160).
Abstract:
본 발명은 TTS(Text-To-Speech) 시스템에서 음성 합성에 사용되는 대용량 데이터베이스를 압축 및 합성하기 위한 것이다. 보다 상세히는 TTS 시스템의 음성압축 및 합성 방법에 있어, 화자 종속적 코드북을 이용하는 것인데, 상기 화자 종속적 코드북은 시간 축에서 잔차 신호 파형의 유사도를 비교함으로써 다양한 형태의 신호로 코드북을 훈련시켜 코드북을 생성하는 것을 특징으로 한다. 또한 본 발명의 TTS 시스템을 지원하기 위해 코덱은 과거 정보가 없는 음소의 시작 부분에서는 화자 종속적 잔차신호 코드북을 사용하고, 그 이후의 음성 신호에 대해선 예측 방식을 사용함으로써 상용 코덱 수준의 압축률을 가지면서도 음소 단위의 가변적이고 부분적인 음성 합성에 있어 우수한 음질을 제공하는 효과가 있다. TTS, 음성합성, 화자종속, 코드북, 예측방식
Abstract:
PURPOSE: An audio signal processing method and an apparatus thereof are provided to minimize distortion of sound and to generate an accurate signal to an original copy. CONSTITUTION: It is determined whether a spectral hole exists in a band of a frame(S210). Substitution type information is extracted from a bit stream(S220). A lag extracting unit extracts lag information, prediction mode information, and perceptual gain from the bit stream(S240). A spectral coefficient of a current band is obtained(S245).
Abstract:
오디오 타겟 신호의 검출장치 및 방법이 개시된다. 보다 상세하게는 본 발명은, 오디오 스트림을 미리 결정된 시간 단위의 적어도 하나 이상의 세그먼트들로 분할하는 세그먼트 분할부와, 분할된 세그먼트별로 특성 파라미터들을 추출하는 특성 파라미터 추출부와, 특성 파라미터 추출부에서 추출된 세그먼트별 특성 파라미터들의 정규분포 매칭도를 측정하는 정규성 측정부 및 정규성 측정부에서 측정된 결과값과 특성 파라미터들을 미리 결정된 기준 모델에 적용하여 타겟 신호를 검출하는 타겟 신호 검출부를 포함하는 타겟 신호의 검출장치 및 이를 이용한 타겟 신호의 검출방법에 관한 것이다.
Abstract:
본 발명은 입력 음성 신호의 길이에 대하여 현재 기준 분석 구간과 M개의 후보 분석 구간들을 설정하여 각 구간의 특징벡터를 추출하고, 현재 기준 분석 구간의 특징벡터와 각각의 후보 분석 구간의 특징벡터 간의 스펙트럼 차이가 최소인 후보 분석 구간을 선택한 후, 선택된 후보 분석 구간의 특징벡터를 추출함과 동시에 선택된 후보 분석 구간과 현재 기준 분석 구간 사이의 길이를 중첩길이로 설정하여 새로운 기준 분석 구간과 새로운 M개의 후보 분석 구간을 재설정하는 과정을 반복하면서 음성 분석 구간의 중첩길이를 가변적으로 선택하여 입력 음성 신호에 대한 특징벡터를 추출하는 음성 분석구간 중첩길이의 가변적 선택을 이용한 특징 벡터 추출 방법 및 이를 이용한 화자 인식 시스템에 관한 것이다. 본 발명에 따라 음성 분석 구간의 중첩길이를 가변적으로 선택하면 입력 음성 신호에 대한 화자의 다양한 특성을 충분히 뽑아내기 용이하고, 입력 음성에 들어있는 화자의 특성을 모두 모델링하는 것이 용이하므로, 기존의 음성 분석 구간의 중첩길이를 특정한 값으로 고정하는 특징벡터 추출 방법을 이용하는 화자 인식 시스템에 비해 상대적으로 더 월등하게 화자 인식의 성능을 향상시킬 수 있다. 화자 인식, 음성 분석, 중첩, 특징벡터, 화자 모델
Abstract:
PURPOSE: An audio signal processing method and an apparatus thereof are provided to minimize cognitive distortion under the low bit rate environment by adjusting masking threshold level based on relation between the sensitivity of the extent of the energy and the quantization noise. CONSTITUTION: The frequency spectrum is generated by frequency-modulating the audio signal(S110). Each bandwidth weighted value for each bandwidth energy is determined by using the frequency spectrum(S120). The masking threshold level according to the psycho acoustic model is received(S140). The transformed masking threshold level is generated by applying the weighted value to the masking threshold level(S160). The signal is quantized by using the transformed masking threshold level.