Abstract:
감정 간의 강도 조절이 가능한 감정 음성 생성 방법 및 장치이 개시된다. 감정 음성 생성 방법은 동일한 감정을 표현하는 가중치 벡터들을 그룹화하여 감정 군집들을 생성하는 단계; 동일한 감정 군집에 포함된 가중치 벡터들 간의 거리인 내부 거리를 결정하는 단계; 서로 다른 감정 군집에 포함된 가중치 벡터들 간의 거리인 외부 거리를 결정하는 단계; 상기 내부 거리 및 상기 외부 거리에 기초하여 상기 감정 군집들 각각의 대표 가중치 벡터를 결정하는 단계; 감정을 표현하기 위한 운율의 정보가 포함된 스타일 토큰에 상기 감정 군집의 대표 가중치 벡터를 적용하여 스타일 임베딩을 생성하는 단계; 및 상기 스타일 임베딩을 이용하여 감정을 나타내는 감정 음성을 생성하는 단계를 포함할 수 있다.
Abstract:
본 발명은 가상 음원 위치 정보(Virtual Sound Location Information: VSLI)를 이용하여 멀티채널 오디오 신호를 효율적으로 부호화/복호화하는 방법 및 장치에 관한 것이다. 본 발명에 따른 멀티채널 오디오 신호 부호화 장치는, 멀티채널 오디오 신호를 프레임화된 오디오 신호로 변환하기 위한 프레임 변환 수단과, 상기 프레임화된 오디오 신호를 다운믹싱하기 위한 수단과, 상기 다운믹스된 오디오 신호를 부호화하기 위한 수단과, 상기 프레임화된 오디오 신호로부터 음원위치정보를 추정하기 위한 음원위치정보 추정 수단과, 상기 추정된 음원위치정보를 양자화하기 위한 수단과, 상기 부호화된 다운믹스 오디오 신호와 상기 양자화된 음원위치정보를 합산하여 최종적으로 부호화된 멀티채널 오디오 신호를 생성하기 위한 수단을 포함한다. 멀티채널 오디오 신호 부호화, 복호화, 가상음원위치정보(virtual source location information: VSLI)
Abstract:
An apparatus for evaluating the sound quality of a multi-channel audio compression codec and a method therefor are provided to measure the audible sound quality degradation degree of an audio signal encoded and decoded by the multi-channel audio compression codec in comparison with an original signal before compression. A preprocessing unit(11) generates a binaural input signal on the basis of a multi-channel audio signal inputted from respective channels of a multi-channel audio play system. An output variable calculating unit(12) produces an IACC(Interaural Cross Correlation) distortion and an output variable of the generated binaural input signal. An artificial neural network circuit unit(13) outputs a grade of sound quality on the basis of the IACC distortion and the output variable.
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은 멀티채널 오디오 압축 코덱의 음질 평가 장치 및 그 방법에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은 멀티채널 압축 코덱의 음질을 평가함에 있어서, 멀티채널 오디오 압축 코덱의 음질에 대한 청취자의 청취 평가 및 통계 처리 과정을 생략하고, 음질에 대한 객관성 및 일관성있는 측정을 통해 멀티채널 오디오 재생 환경에서 선별된 청취자가 느끼는 청각적인 평가를 적절한 방법으로 통계 처리한 것과 유사한 평가 결과를 얻도록 하기 위한, 멀티채널 오디오 압축 코덱의 음질 평가 장치 및 그 방법을 제공하는데 그 목적이 있음. 3. 발명의 해결방법의 요지 본 발명은, 음질 평가 장치에 있어서, 멀티채널 오디오 재생 시스템의 각 채널(L, R, C, LS, RS)로부터 입력된 멀티채널 오디오 신호를 바탕으로 양이 입력 신호를 생성하기 위한 전처리수단; 상기 생성된 양이 입력 신호의 양이 상관 정도 왜곡(IACCDist) 및 출력변수를 산출하기 위한 출력변수 계산수단; 및 상기 산출된 양이 상관 정도 왜곡(IACCDist)과 상기 출력변수를 바탕으로 음질의 등급을 출력하기 위한 인공신경망회로수단을 포함함 . 4. 발명의 중요한 용도 본 발명은 멀티채널 오디오 재생 시스템 등에 이용됨. 객관적 음질 평가, 멀티채널 오디오 압축 코덱, 오디오, 압축, 코덱, 음질 평가, 양이 입력 신호, 양이 상관 정도, 양이 레벨 차이, 양이 상관 정도 왜곡, 양이 레벨 차이 왜곡, 출력 변수, 음질 등급
Abstract:
본 발명은 가상 음원 위치 정보(Virtual Sound Location Information: VSLI)를 이용하여 멀티채널 오디오 신호를 효율적으로 부호화/복호화하는 방법 및 장치에 관한 것이다. 본 발명에 따른 멀티채널 오디오 신호 부호화 장치는, 멀티채널 오디오 신호를 프레임화된 오디오 신호로 변환하기 위한 프레임 변환 수단과, 상기 프레임화된 오디오 신호를 다운믹싱하기 위한 수단과, 상기 다운믹스된 오디오 신호를 부호화하기 위한 수단과, 상기 프레임화된 오디오 신호로부터 음원위치정보를 추정하기 위한 음원위치정보 추정 수단과, 상기 추정된 음원위치정보를 양자화하기 위한 수단과, 상기 부호화된 다운믹스 오디오 신호와 상기 양자화된 음원위치정보를 합산하여 최종적으로 부호화된 멀티채널 오디오 신호를 생성하기 위한 수단을 포함한다. 멀티채널 오디오 신호 부호화, 복호화, 가상음원위치정보(virtual source location information: VSLI)
Abstract:
천이구간 부호화 왜곡에 강인한 오디오 부호화/복호화 장치 및 방법이 개시된다. 오디오 부호화 방법은 입력 신호를 T/F(time-to-frequency) 변환하여 주파수 영역 신호를 출력하는 단계; 상기 주파수 영역 신호에 FDNS(frequency domain noise shaping) 부호화를 적용하여 상기 주파수 영역 신호에서 주파수축 포락선이 제거된 주파수 영역 잔차 신호를 출력하는 단계; 상기 주파수 영역 잔차 신호를 기초로 LPC(linear prediction coefficient) 분석을 수행하여 시간축 포락선이 제거된 시간 영역 잔차 신호를 출력하는 단계; 및 상기 시간 영역 잔차 신호를 양자화하여 전송하는 단계를 포함할 수 있다.
Abstract:
프리셋을 이용한 객체기반 오디오 시스템, 객체기반 오디오 제공 방법 및 객체기반 오디오 재생 방법이 개시된다. 객체기반 오디오 시스템은 객체기반 오디오 파일의 저장 위치를 참조하는 참조 정보를 제공하는 참조 정보 제공부 및 객체기반 오디오 파일을 구성하는 적어도 하나의 오디오 객체를 제어하기 위한 프리셋 정보를 제공하는 프리셋 정보 제공부를 포함한다.