-
公开(公告)号:KR1020100007741A
公开(公告)日:2010-01-22
申请号:KR1020090061645
申请日:2009-07-07
Applicant: 한국전자통신연구원 , 광운대학교 산학협력단
CPC classification number: G10L19/22 , G10L19/0212 , G10L19/04 , G10L19/20
Abstract: PURPOSE: An apparatus for determining a signal state of an audio signal is provided to suitably select a voice encoder based on LPC(Linear Predictive Coding) and an audio encoder based on conversion according to a characteristic of an input signal. CONSTITUTION: A signal state observer(101) classifies characteristics of an input signal to output each state observation probability. A state chain unit(102) outputs a state identifier of a frame of the input signal based on the state observation probability. An encoder encoding a frame of the input signal is determined according to the state identifier. The signal state observer comprises a characteristic extracting unit, an entropy base determining tree and a silence state determining unit.
Abstract translation: 目的:提供一种用于确定音频信号的信号状态的装置,以根据输入信号的特性,基于LPC(线性预测编码)和基于转换的音频编码器适当地选择语音编码器。 构成:信号状态观察器(101)对输入信号的特性进行分类以输出每个状态观测概率。 状态链单元(102)基于状态观察概率输出输入信号的帧的状态标识符。 根据状态标识符确定编码输入信号的帧的编码器。 信号状态观察器包括特征提取单元,熵基准确定树和静默状态确定单元。
-
公开(公告)号:KR100902332B1
公开(公告)日:2009-06-12
申请号:KR1020070026820
申请日:2007-03-19
Applicant: 한국전자통신연구원 , 한양대학교 산학협력단 , 연세대학교 산학협력단 , 광운대학교 산학협력단
Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 장치 및 그 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 입력된 오디오 신호를 선형예측 부호화해서 구한 오차 신호를 그 오차 신호의 마스킹 임계치(이하, 오차 마스킹 임계치)를 이용하여 부호화하고, 부호화된 비트열을 복호화해서 구한 오차 신호를 선형예측 부호화정보(선형 예측 분석 계수)를 이용하여 선형예측 복호화함으로써, 오디오 부호화의 압축 효율을 향상시킬 수 있게 하는, 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 장치 및 그 방법을 제공하는데 그 목적이 있음.
3. 발명의 해결방법의 요지
본 발명은, 변형 선형예측 부호화를 이용한 오디오 부호화 장치에 있어서, 외부로부터 입력된 오디오 신호(원신호)를 시간 영역에서 선형예측 부호화하여 오차 신호를 구하기 위한 오차 신호 계산 수단; 상기 오차 신호 계산 수단에서 구한 오차 신호를 주파수 영역 신호로 변환하기 위한 주파수 영역 변환 수단; 상기 원신호와 상기 원신호의 선형예측 부호화에 사용된 부호화 정보를 이용해서, 상기 오차 신호의 부호화에 사용되는 마스킹 임계치를 구하기 위한 마스킹 임계치 계산 수단; 및 상기 주파수 영역 변환 수단에서 변환된 오차 신호를 상기 구한 마스킹 임계치 를 이용하여 지각적 부호화하기 위한 지각적 부호화 수단을 포함함.
4. 발명의 중요한 용도
본 발명은 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 등에 이용됨.
변형 선형예측 부호화(WLPC), 고급 오디오 부호화(AAC), 심리음향 모델(PAM), 오디오 압축, 지각적 부호화, 마스킹 임계치-
公开(公告)号:KR100889750B1
公开(公告)日:2009-03-24
申请号:KR1020070048302
申请日:2007-05-17
Applicant: 한국전자통신연구원 , 한양대학교 산학협력단 , 광운대학교 산학협력단 , 연세대학교 산학협력단
CPC classification number: H03M7/40 , G10L19/0017
Abstract: 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법이 개시된다. 오디오 신호의 무손실 부호화 장치는 제1 심볼을 직접 부호화하는 제1 부호화기, 제1 심볼을 제2 심볼로 변환하고, 제2 심볼을 부호화하는 복수의 제2 부호화기를 포함하는 제2 부호화기 모듈, 제1 부호화기와 복수의 제2 부호화기의 성능을 비교하고, 비교 결과에 따라서 부호화 모드를 출력하는 제1 선택기, 및 부호화 모드에 대응하여 제1 심볼을 부호화하여 출력하는 제2 선택기로 이루어진다. 이에 따르면, 오디오 신호의 부호화 성능을 향상시킬 수 있다.
-
公开(公告)号:KR1020080005043A
公开(公告)日:2008-01-10
申请号:KR1020060095786
申请日:2006-09-29
Applicant: 한국전자통신연구원 , 광운대학교 산학협력단 , 세종대학교산학협력단
Inventor: 정세윤 , 최해철 , 서정일 , 백승권 , 장인선 , 김재곤 , 문경애 , 장대영 , 홍진우 , 김진웅 , 안창범 , 오승준 , 심동규 , 박호종 , 이영렬 , 전수열
IPC: H04N19/60
Abstract: An apparatus and a method for multi-stage conversion are provided to use multi-dimension conversion or multi-stage conversion to raise the compression efficiency of energy and improve the coding performance. Input image data are DCT(Discrete Cosine Transform)-converted, and R blocks are selected from the DCT-converted image data. In selected R blocks, transform coefficients of the same frequency are one-dimensionally arranged. The one-dimensionally arranged transform coefficients are one-dimensionally converted. The R blocks are selected from the DCT-converted image data in a horizontal direction, a vertical direction, or a diagonal direction.
Abstract translation: 提供了一种用于多级转换的装置和方法,以使用多维转换或多级转换来提高能量的压缩效率并提高编码性能。 输入图像数据是DCT(离散余弦变换)转换的,并且从DCT转换的图像数据中选择R个块。 在所选择的R块中,相同频率的变换系数被一维排列。 一维排列的变换系数被一维转换。 从水平方向,垂直方向或对角方向的DCT转换图像数据中选择R块。
-
公开(公告)号:KR1020070079943A
公开(公告)日:2007-08-08
申请号:KR1020070011539
申请日:2007-02-05
Applicant: 한국전자통신연구원
IPC: G10L19/008 , H03M7/30 , G11B20/10
Abstract: An apparatus and a method for visualizing a multi-channel audio signal are provided to offer a more realistic multi-channel audio service to a user by visually expressing a dynamic volume sense and a dynamic sound field sense of the multi-channel audio signal. A spatial audio decoding unit(110) receives a down-mix signal of a time domain, converts the received down-mix signal into a signal of a frequency domain, and outputs the frequency domain down-mix signal. The spatial audio decoding unit(110) synthesizes a multi-channel audio signal by using the spatial parameter and the down-mix signal. A multi-channel visualizing unit(130) generates visualization information of the multi-channel audio signal by using the frequency domain down-mix signal and the spatial parameter.
Abstract translation: 提供用于可视化多声道音频信号的装置和方法,以通过视觉地表达多声道音频信号的动态音量感测和动态声场感觉来向用户提供更真实的多声道音频服务。 空间音频解码单元(110)接收时域的下混合信号,将接收的缩混信号转换为频域的信号,并输出频域缩减混音信号。 空间音频解码单元(110)通过使用空间参数和缩减混音信号来合成多声道音频信号。 多通道可视化单元(130)通过使用频域降混信号和空间参数来生成多声道音频信号的可视化信息。
-
公开(公告)号:KR100714980B1
公开(公告)日:2007-05-04
申请号:KR1020060023545
申请日:2006-03-14
Applicant: 한국전자통신연구원
IPC: G10L19/008 , G10L19/02
CPC classification number: H04S3/008 , H04S2400/11 , H04S2420/03 , H04S2420/07
Abstract: 본 발명은 반원 평면상의 가상음원정보(VSLI:Virtual Source Location Information)를 이용한 멀티채널 신호의 압축 및 복원 방법에 관한 것으로, 공간 큐(spatial cue) 정보로서 채널간 에너지 비(Inter Channel Level Difference: ICLD) 대신 VSLI를 이용함으로써 공간 큐 정보의 양자화에 의한 손실을 최소화하여 복원된 오디오 신호의 음질을 향상시킬 수 있으며, 복호기에서 원 신호 복원 시 스펙트럼 왜곡을 감쇄시켜 보다 양질의 오디오 신호를 재생할 수 있는 효과가 있다.
바이노럴 큐 코딩(BCC: Binaural Cue Coding), 가상음원위치정보(VSLI: Virtual Source Location Information), 멀티채널 오디오-
公开(公告)号:KR100662247B1
公开(公告)日:2007-01-02
申请号:KR1020040065686
申请日:2004-08-20
Applicant: 한국전자통신연구원
Abstract: 1. 청구범위에 기재된 발명이 속하는 기술 분야
본 발명은 잔향 처리를 위한 음향 장면 생성 및 소비 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 "AcousticScene" 노드의 구조를 확장함으로써 잔향 파라미터를 이용하여 잔향음을 생성하는 방법, 디지털 인공잔향 필터(digital artificial reverberation filter)를 이용하는 방법 및 실내응답신호(room impulse response signal)를 직접 참조하는 방법 중 단말에 가장 적절한 방법을 선택하여 잔향음을 생성하도록 하는 잔향 처리를 위한 음향 장면 생성 및 소비 방법을 제공하고자 함.
3. 발명의 해결 방법의 요지
본 발명은, 잔향 처리를 위한 음향 장면 생성 방법에 있어서, 음향 객체를 생성하는 단계; 및 실내응답신호를 이용하여 상기 음향 객체에 잔향 처리를 하기 위한 잔향 특성 정보를 포함한 음향 장면 기술 정보를 생성하는 단계를 포함하되, 상기 잔향 특성 정보는, 잔향 파라미터, 잔향 필터 및 실내응답신호 중 어느 것을 이용하여 잔향음을 생성하는지에 대한 정보를 기술하는 구성 정보를 포함함.
4. 발명의 중요한 용도
본 발명은 MPEG-4 단말 등에 이용됨.
잔향음, MPEG-4, 초기반사, 후기잔향, 디지털 인공 잔향 필터, 실내 응답 신호(room impulse response)-
公开(公告)号:KR100658222B1
公开(公告)日:2006-12-15
申请号:KR1020040062418
申请日:2004-08-09
Applicant: 한국전자통신연구원
IPC: H04N21/2368 , H04N13/00
CPC classification number: H04N21/8451 , H04H20/28 , H04H20/46 , H04H20/72 , H04H20/89 , H04H40/36 , H04N13/161 , H04N13/167 , H04N13/194 , H04N19/25 , H04N19/597 , H04N21/23412 , H04N21/234318 , H04N21/235 , H04N21/236 , H04N21/435 , H04N21/44012
Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 3차원 디지털 멀티미디어 방송 시스템(3D DMB)에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 양안식 3차원 영상 및 3차원 음향을 종래의 DMB 시스템 구조를 이용하여 처리함으로써, 종래의 DMB 시스템과 호환성을 유지하며 사용자에게 보다 현실감 있는 3차원 AV 서비스를 제공하기 위한 3차원 디지털 멀티미디어 방송 시스템을 제공하는데 그 목적이 있음.
3. 발명의 해결방법의 요지
본 발명은, 3차원 디지털 멀티미디어 방송 송신 시스템으로서, 양안식 3차원 영상의 비디오 신호를 입력받아 부호화하기 위한 비디오 부호화 수단; 3차원 음향의 오디오 신호를 입력받아 부호화하기 위한 오디오 부호화 수단; 상기 부호화된 비디오 신호 및 오디오 신호를 SL(Sync Layer) 패킷으로 패킷화하기 위한 패킷화 수단; 및 상기 패킷화 수단에 의해 패킷화된 SL 패킷을 변환 및 다중화하여 출력하기 위한 다중화 수단을 포함함.
4. 발명의 중요한 용도
본 발명은 디지털 멀티미디어 방송 기반으로 3차원 AV를 서비스하기 위한 시스템 등에 이용됨.
DMB, 디지털 방송, MPEG-2, MPEG-4, 3D AV-
公开(公告)号:KR1020060078107A
公开(公告)日:2006-07-05
申请号:KR1020040116795
申请日:2004-12-30
Applicant: 한국전자통신연구원
Abstract: 본 발명은 멀티채널 오디오 신호를 다운믹스하기 위해 필요한 파워 동일화(power equalization)를 제공하는 방법 및 장치에 관한 것이다.
본 발명의 제1 실시예에서는 주파수 영역을 균등한 대역폭을 갖는 서브밴드로 세분한 후에 서브밴드별로 파워 동일화를 실시한다. 본 발명의 제2 실시예에서는 주파수 영역을 ERB에 따라 서브밴드로 세분하되, 선정된 주파수 미만의 서브밴드는 하나의 서브밴드로 합친 후에 서브밴드별로 파워 동일화를 실시한다.
다운믹스, 파워 동일화(Power Equalization)-
公开(公告)号:KR1020060050009A
公开(公告)日:2006-05-19
申请号:KR1020050061861
申请日:2005-07-08
Applicant: 한국전자통신연구원
IPC: H03M7/30
CPC classification number: H04N19/20 , H04N19/25 , H04N19/44 , H04N21/23412 , H04N21/44012 , H04N21/8106
Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 혼합된 오디오 스트림으로부터 오디오 객체를 분리하기 위한 단말 장치 및 그 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 하나의 기본 스트림으로 압축된 다수의 오디오 객체들을 BIFS를 이용하여 분리 처리할 수 있는 노드 구조를 제안하고, 그 제안한 노드를 이용하여 혼합된 오디오 스트림으로부터 오디오 객체를 분리하기 위한 단말 장치 및 그 방법을 제공하는데 목적이 있음.
3. 발명의 해결방법의 요지
본 발명은, 다수의 오디오 객체가 압축된 기본 스트림(ES)을 디코딩하기 위한 디코딩부; 및 오디오 객체 분리 노드를 이용하여 상기 디코딩된 오디오 스트림에서 오디오 객체들을 분리하고, 분리된 오디오 객체들을 이용하여 오디오 장면을 구성하기 위한 컴포지터를 포함하는 단말 장치로서, 상기 오디오 객체 분리 노드는, 분리하고자 하는 오디오 객체의 수를 기술하는 필드; 및 객체 분리를 수행할지 여부를 기술하는 필드를 포함함.
4. 발명의 중요한 용도
본 발명은 MPEG-4 시스템 등에 이용됨.
MPEG-4, BIFS, 객체, 기본 스트림(ES), 오디오 장면, 분리
-
-
-
-
-
-
-
-
-