-
公开(公告)号:KR101976757B1
公开(公告)日:2019-05-09
申请号:KR1020180029432
申请日:2018-03-13
Applicant: 한국전자통신연구원
IPC: G10L19/008 , G10L19/018 , G10L19/035
-
62.
公开(公告)号:KR1020100114450A
公开(公告)日:2010-10-25
申请号:KR1020090116017
申请日:2009-11-27
Applicant: 한국전자통신연구원
Abstract: PURPOSE: A high quality multiple audio coder and decoder is provided to control a target audio object signal by using a residual signal. CONSTITUTION: A first multiple object encoder(310) generates a first down-mix signal by mixing down a plurality of audio object signals. The first multiple object encoder extracts a first spatial parameter showing the object information of the audio object signal. A second multiple object encoder(330) generates a second down-mix signal by mixing down at least one target audio object signal with the first down-mix signal. The second multiple object encoder extracts a second spatial parameter showing the object information of at least one target audio object signal with the first down-mix signal.
Abstract translation: 目的:提供高质量的多音频编码器和解码器,通过使用残差信号来控制目标音频对象信号。 构成:第一多目标编码器(310)通过混合多个音频对象信号来产生第一缩减混音信号。 第一多对象编码器提取表示音频对象信号的对象信息的第一空间参数。 第二多目标编码器(330)通过将至少一个目标音频对象信号与第一缩减混音信号进行混合来产生第二缩减混音信号。 第二多对象编码器提取表示具有第一缩减混音信号的至少一个目标音频对象信号的对象信息的第二空间参数。
-
公开(公告)号:KR100776797B1
公开(公告)日:2007-11-19
申请号:KR1020060041696
申请日:2006-05-09
Applicant: 한국전자통신연구원 , 한국정보통신대학교 산학협력단 , 주식회사 케이티
Abstract: 본 발명은 네트워크 기반의 패킷 손실 은닉 방법 및 이를 위한 장치에 관한 것으로서, 기존의 수신단에서만 패킷 손실 은닉 방법에 의하여 손실된 음성 패킷을 은닉하는 경우에 비해, 네트워크상에서 손실된 패킷과 상관도가 높은 음성 패킷을 가지고 수신단에서 패킷 손실 은닉을 미리 수행함으로써, 손실된 음성 패킷 구간에 대하여 패킷 손실 은닉 효과를 더욱 향상시킬 수 있어 VoIP 서비스의 품질을 일정하게 유지할 수 있도록 한 것이다.
패킷 손실 은닉, VoIP, 히스토리 버퍼, PLC-
公开(公告)号:KR100745688B1
公开(公告)日:2007-08-03
申请号:KR1020050061655
申请日:2005-07-08
Applicant: 한국전자통신연구원
IPC: H03M7/30
Abstract: 본 발명은 다채널 오디오 신호를 부호화/복호화 하는 방법 및 장치에 관한 것으로, 보다 상세하게는, 채널 상관성에 기반하여 다채널 오디오 신호를 부호화 및 복호화하는 다채널 파라메트릭 부호화/복호화 방법 및 장치에 관한 것이다.
본 발명에 따른 다채널 오디오 신호 부호화 장치는 다채널 오디오 신호를 주파수 영역에서 분할하는 신호 분할 수단; 상기 분할된 신호를 단일채널로 다운믹스(dowm-mix)하여 부호화하는 다운믹스 수단; 및 상기 분할된 신호에 대해 프레임 단위의 채널 상관도를 측정하고, 상기 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할하는 파라메터 분석 수단을 포함하며, 상기 파라메터 분석 수단은, 상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우 복호화를 위한 큐 파라메터로서, 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 추출하여 부호화하는 것을 특징으로 한다.
본 발명은 다채널 오디오 신호의 복호화에 필요한 큐 파라메터를 최적화함으로써 적은 대역폭이 할당되는 환경에서도 단일채널 오디오 신호로부터 다채널 오디오 신호를 복원하여 재생할 수 있는 효과를 제공한다.
오디오 코딩, 큐 파라메터, 다채널, 채널 상관성-
公开(公告)号:KR100745683B1
公开(公告)日:2007-08-02
申请号:KR1020060051171
申请日:2006-06-07
Applicant: 한국전자통신연구원 , 주식회사 케이티 , 한국정보통신대학교 산학협력단
Abstract: 본 발명은, VoIP를 통하여 전송되는 패킷의 음성의 특징을 이용하여 전송 도중에 발생되는 패킷 손실을 보상하는 패킷 손실 은닉 방법에 관한 발명으로서, VoIP에서 패킷 손실이 발생했을 때, 패킷 내의 손실된 프레임에 대한 이전 프레임들의 에너지 변화 특징에 따라 적응적으로 감쇠인자를 결정하고, 또한 손실 이후 음성 정보가 유효할 때 손실 환경을 고려하여 적응적으로 앞, 뒤 또는 앞 및 뒤의 정보를 선택적으로 사용하여 패킷 손실 보상을 수행함으로써 수신된 패킷의 음질을 향상시킬 수 있는 패킷 손실 은닉 알고리즘 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
패킷 손실 은닉(PLC), 에너지 변화 특징, 감쇠인자, 손실 음운 환경-
公开(公告)号:KR100737386B1
公开(公告)日:2007-07-09
申请号:KR1020050134637
申请日:2005-12-30
Applicant: 한국전자통신연구원
IPC: G10L19/008 , G10L19/02
Abstract: 본 발명은 멀티채널 오디오 신호 또는 복수개의 독립된 오디오 신호를 모노 또는 스테레오로 다운믹스된 신호와 공간 정보(spatial cues)로 표현 및 전송시에 공간정보의 추정 및 양자화를 수행하는 방법에 관한 것이다. ICLD를 추정하는데 있어서 각 서브밴드에 대하여 최대 평균에너지를 갖는 채널을 기준채널로 이용하여 ICLD를 추정하는 방법과, 각 부가정보를 전송하기 이전에 양자화를 수행하는 방법에 있어서 비대칭 비선형 양자화(asymmetric nonuniform quantization)를 수행하는 방법을 제안한다.
공간정보기반 오디오 코딩(Spatial Audio Coding:SAC), 바이노럴 큐 코딩(Binaural Cue Coding: BCC), 채널간 에너지 비(Inter Channel Level Difference:ICLD), 채널간 시간 지연 비(Inter Channel Time Difference:ICTD), 양자화(quantization)-
公开(公告)号:KR1020070011136A
公开(公告)日:2007-01-24
申请号:KR1020060066822
申请日:2006-07-18
Applicant: 한국전자통신연구원
IPC: G10L19/008 , H04S3/00 , H03M7/30
Abstract: A method for quantizing and inverse-quantizing a channel level difference based on virtual source location information is provided to minimize aural deterioration in SAC(Spatial Audio Coding) and improve sound quality without increasing complexity. A channel level difference parameter used as a spatial parameter is quantized when a multi-channel audio signal is spatial-audio-coded. Sub-band channel level differences are extracted from the multi-channel audio signal. The channel level difference is quantized with reference to channel level difference quantization table designed by using a channel level difference quantization value derived from a virtual source location information quantization value of the multi-channel audio signal.
Abstract translation: 提供了一种用于基于虚拟源位置信息对信道电平差进行量化和逆量化的方法,以最小化SAC(空间音频编码)中的听觉恶化并且在不增加复杂度的情况下改善声音质量。 当多声道音频信号是空间音频编码时,用作空间参数的通道电平差参数被量化。 从多声道音频信号提取子带信道电平差。 参考通过使用从多声道音频信号的虚拟源位置信息量化值导出的信道电平差量化值设计的信道电平差量化表来量化信道电平差。
-
公开(公告)号:KR1020060100221A
公开(公告)日:2006-09-20
申请号:KR1020060023545
申请日:2006-03-14
Applicant: 한국전자통신연구원
IPC: G10L19/008 , G10L19/02
CPC classification number: H04S3/008 , H04S2400/11 , H04S2420/03 , H04S2420/07
Abstract: 본 발명은 반원 평면상의 가상음원정보(VSLI:Virtual Source Location Information)를 이용한 멀티채널 신호의 압축 및 복원 방법에 관한 것으로, 공간 큐(spatial cue) 정보로서 채널간 에너지 비(Inter Channel Level Difference: ICLD) 대신 VSLI를 이용함으로써 공간 큐 정보의 양자화에 의한 손실을 최소화하여 복원된 오디오 신호의 음질을 향상시킬 수 있으며, 복호기에서 원 신호 복원 시 스펙트럼 왜곡을 감쇄시켜 보다 양질의 오디오 신호를 재생할 수 있는 효과가 있다.
바이노럴 큐 코딩(BCC: Binaural Cue Coding), 가상음원위치정보(VSLI: Virtual Source Location Information), 멀티채널 오디오-
69.
公开(公告)号:KR1020060078103A
公开(公告)日:2006-07-05
申请号:KR1020040116789
申请日:2004-12-30
Applicant: 한국전자통신연구원
IPC: G10L19/028 , G10L19/008
Abstract: 본 발명은 적어도 2개 이상의 신호가 다운믹스된 모노 신호로부터 분리되는 각각의 출력 채널의 빈 스펙트럼 밴드를 보상하기 위한 방법을 제공한다. 상기 방법은, 상기 각각의 출력 채널에 대하여, 이전 시간 영역에서의 상기 빈 스펙트럼 밴드의 상기 모노 신호에 대한 상기 출력 채널의 에너지비를 이용하여 상기 빈 스펙트럼 밴드의 현재 시간 영역에서의 에너지비를 추정하는 단계와, 상기 빈 스펙트럼 밴드의 앞 밴드의 상기 모노 신호에 대한 상기 출력 채널의 에너지비와 뒤 밴드의 상기 모노 신호에 대한 상기 출력 채널의 에너지비의 평균값을 이용하여 상기 빈 스펙트럼 밴드의 주파수 영역에서의 에너지비를 추정하는 단계와, 상기 추정된 현재 시간영역에서의 에너지비와 상기 주파수 영역에서의 에너지비를 이용하여 상기 빈 스펙트럼의 복원비를 결정하는 단계와, 상기 복원비를 상기 모노 신호값에 곱함으로써 상기 출력 채널의 빈 스펙트럼을 복원하는 단계를 포함한다.
바이노럴 큐 코딩(Binaural Cue Coding), 스펙트럼 복원-
70.
公开(公告)号:KR1020060049941A
公开(公告)日:2006-05-19
申请号:KR1020050061425
申请日:2005-07-07
Applicant: 한국전자통신연구원 , 재단법인서울대학교산학협력재단
IPC: G10L19/008
CPC classification number: G10L19/008 , H04S3/002 , H04S2420/03
Abstract: 본 발명은 가상 음원 위치 정보(Virtual Sound Location Information: VSLI)를 이용하여 멀티채널 오디오 신호를 효율적으로 부호화/복호화하는 방법 및 장치에 관한 것이다. 본 발명에 따른 멀티채널 오디오 신호 부호화 장치는, 멀티채널 오디오 신호를 프레임화된 오디오 신호로 변환하기 위한 프레임 변환 수단과, 상기 프레임화된 오디오 신호를 다운믹싱하기 위한 수단과, 상기 다운믹스된 오디오 신호를 부호화하기 위한 수단과, 상기 프레임화된 오디오 신호로부터 음원위치정보를 추정하기 위한 음원위치정보 추정 수단과, 상기 추정된 음원위치정보를 양자화하기 위한 수단과, 상기 부호화된 다운믹스 오디오 신호와 상기 양자화된 음원위치정보를 합산하여 최종적으로 부호화된 멀티채널 오디오 신호를 생성하기 위한 수단을 포함한다.
멀티채널 오디오 신호 부호화, 복호화, 가상음원위치정보(virtual source location information: VSLI)
-
-
-
-
-
-
-
-
-