-
公开(公告)号:KR1020130047630A
公开(公告)日:2013-05-08
申请号:KR1020120119933
申请日:2012-10-26
Applicant: 한국전자통신연구원
Inventor: 김현우
IPC: G10L19/12
Abstract: PURPOSE: A signal encoding device in a communication system and a method thereof are provided to improve the encoding performance of audio and voice signals by using a CELP(Code Excited Linear Prediction) encoding method by normally processing residual signals by determining a quantization vector degree according to the distribution of frequency coefficients. CONSTITUTION: An encoding unit(102) encodes voice and audio signals in a CELP encoding mode. A residual signal calculating unit(104) calculates a residual signal for the voice and audio signals. An energy calculating unit(110) calculates frequency energy of the residual signal. An energy concentration rate calculating unit(120) calculates an energy concentration rate about each vector degree from the frequency energy. A vector degree determining unit(122) determines a purpose vector degree of the residual signal by comparing energy concentration rates. [Reference numerals] (102) CELP encoding unit; (104) Residual signal calculating unit; (106) Frequency converting unit; (108) Residual signal weighting unit; (110) Frequency energy calculating unit; (120) Energy concentration rate calculating unit; (122) Vector degree determining unit; (124) Vector position determining unit; (126) Vector position quantizing unit; (128) Gain quantizing unit; (130) Vector normalizing unit; (132) Shape quantizing unit; (134) Code quantizing unit; (136) Multiplexing unit
Abstract translation: 目的:提供通信系统中的信号编码装置及其方法,以通过使用CELP(码激励线性预测)编码方法来提高音频和语音信号的编码性能,通过通过对 到频率系数的分布。 构成:编码单元(102)以CELP编码模式对语音和音频信号进行编码。 残差信号计算单元(104)计算语音和音频信号的残差信号。 能量计算单元(110)计算残余信号的频率能量。 能量浓度率计算单元(120)根据频率能量计算关于每个向量度的能量集中率。 矢量度确定单元(122)通过比较能量集中率来确定残余信号的目标矢量度。 (102)CELP编码单元; (104)剩余信号计算单元; (106)变频单元; (108)残余信号加权单元; (110)频率能量计算单元; (120)能量集中率计算单位; (122)矢量度确定单元; (124)矢量位置确定单元; (126)矢量位置量化单元; (128)增益量化单元; (130)矢量归一化单元; (132)形状量化单元; (134)代码量化单元; (136)复用单元
-
公开(公告)号:KR1020130032980A
公开(公告)日:2013-04-03
申请号:KR1020110096750
申请日:2011-09-26
Applicant: 한국전자통신연구원
IPC: G10L19/00
CPC classification number: G10L19/0208 , G10L19/0017 , G10L19/002 , G10L19/038 , H03M7/3082 , H04N19/94
Abstract: PURPOSE: A coding device using residual bits and a method thereof are provided to remove noise caused by excessively estimated gain by quantizing all gains of sub bands to bits which are not allocated in an AVQ(Algebraic Vector Quantization) process. CONSTITUTION: An AVQ performing unit(101) receives frequency coefficients converted from a voice/audio signal to perform an AVQ process. First performance improving units(102-106) quantize all gains of sub bands to bits which are not allocated in the AVQ process according to residual bits in order to improve performance. [Reference numerals] (101) AVQ performing unit; (102) Gain parameter calculating unit; (103) Residual bit(n_bits) calculating unit; (104) Whole band gain calculating unit; (105) Whole band gain code book selecting unit; (106) Whole band gain quantizing unit; (107) Sub band gain code book selecting unit; (108) Sub band gain calculating unit; (109) Sub band gain quantizing unit; (110) Shape parameter calculating unit; (111) Residual frequency coefficient calculating unit; (112) Residual frequency coefficient quantizing unit; (113) Multiplexing unit; (AA) Frequency coefficients; (BB) Bit stream;
Abstract translation: 目的:提供使用残余比特的编码装置及其方法,以通过将子带的所有增益量化为在AVQ(代数向量量化)处理中未分配的比特来消除由过度估计的增益引起的噪声。 构成:AVQ执行单元(101)接收从语音/音频信号转换的频率系数,以执行AVQ处理。 第一性能改进单元(102-106)将子频带的所有增益量化到根据残余比特未被分配在AVQ进程中的比特,以便提高性能。 (101)AVQ执行单元; (102)增益参数计算单元; (103)剩余位(n_bits)计算单元; (104)全带增益计算单位; (105)全带增益码本选择单元; (106)全带增益量化单位; (107)子带增益码本选择单元; (108)子带增益计算单元; (109)子带增益量化单元; (110)形状参数计算单位; (111)残余频率系数计算单位; (112)残余频率系数量化单位; (113)复用单元; (AA)频率系数; (BB)比特流;
-
公开(公告)号:KR101170466B1
公开(公告)日:2012-08-03
申请号:KR1020080131712
申请日:2008-12-22
Applicant: 한국전자통신연구원
Abstract: 본 발명은 MDCT 계수의 크기에 따라 그 크기를 조절하여 음질을 향상시키는 MDCT 영역에 대한 후처리 방법에 대한 것이다. 본 발명에 따른 MDCT 영역에 대한 후처리 방법은, 입력 프레임의 MDCT 계수에 대한 미분값의 증감을 토대로 MDCT 계수에 의한 피크(peak)와 밸리(valley)를 구하고, 피크와 밸리를 단위로 하는 복수의 서브 대역을 형성하는 단계, 복수의 피크에 대한 미분값의 증감을 토대로 복수의 피크에 대한 글로벌 포먼트와 밸리를 판단하고, 글로벌 포먼트와 밸리에 대한 서브 대역을 통합하여 복수의 대역을 형성하는 단계, 입력신호에 대한 shaping 비율을 대역에 적용하여 각 대역에 대한 필터 계수를 구하는 단계, 및 MDCT 계수에 필터 계수를 승산하여 각 대역의 입출력 MDCT 계수의 이득을 일치시키는 단계를 구비한다.
MDCT, 코덱, 글로벌 포먼트, 밸리, shaping 비율-
公开(公告)号:KR1020100073139A
公开(公告)日:2010-07-01
申请号:KR1020080131730
申请日:2008-12-22
Applicant: 한국전자통신연구원
IPC: G10L19/06 , G10L19/032 , G10L19/00
CPC classification number: G10L19/0208 , G10L19/032
Abstract: PURPOSE: A method and an apparatus for adaptive sub-band allocation of spectral coefficients are provided to implement accurate quantization which uses a short sub-band by performing the quantization of a sub-band unit. CONSTITUTION: A short sub bandwidth permission decider(131) determines the usage of a short sub band from an audio signal, and a bandwidth allocation unit(132) allocate a converted spectrum coefficient. A sub bandwidth type decider(133) sets up the usage of a long or short sub bandwidth in each band according to the distribution of spectrum coefficients. When the size of the sub band is determined, a sub bandwidth allocation unit(134) allocates the spectrum coefficient of each band is allocated to each sub band.
Abstract translation: 目的:提供一种用于频谱系数的自适应子带分配的方法和装置,以通过执行子带单元的量化来实现使用短子带的精确量化。 构成:短子带宽许可决定器(131)从音频信号确定短子带的使用,带宽分配单元(132)分配转换的频谱系数。 子带宽类型判定器(133)根据频谱系数的分布设置每个频带中的长或短子带宽的使用。 当子带的大小被确定时,子带宽分配单元(134)将每个频带的频谱系数分配给每个子频带。
-
公开(公告)号:KR100922897B1
公开(公告)日:2009-10-20
申请号:KR1020070128525
申请日:2007-12-11
Applicant: 한국전자통신연구원
CPC classification number: G10L19/26 , G10L19/0212
Abstract: 본 발명은 MDCT 영역에서 동작하는 후처리 필터장치 및 필터방법에 관한 것으로, 더욱 상세하게는 과거와 현재의 MDCT 계수를 이용하여 실제 음성 스펙트럼과 유사한 스펙트럼 계수를 얻고 그 계수 크기가 작은 곳에서는 미분값이 크도록, 계수 크기가 큰 곳에서는 미분값이 작도록 볼록 함수로 변환하여 후처리 필터 계수를 구하고 이를 MDCT 계수에 적용하여 음성 신호 왜곡 없이 코딩 잡음을 줄이는 후처리 필터장치 및 필터방법에 관한 것이다. 이에 의하면, 현재와 과거의 MDCT 값을 모두 사용하기 때문에 실제 음성 스펙트럼과 유사한 계수를 획득하는 것이 가능하고 더 정확한 필터 계수를 얻을 수 있다. 또한, 볼록 함수에 의해 계수를 적절히 변환하였기 때문에 음질을 향상시킬 수 있다.
후처리 필터(post-filter), 코덱(codec), MDCT(modified discrete cosine transform), 볼록 함수, 음성 스펙트럼-
公开(公告)号:KR1020090061499A
公开(公告)日:2009-06-16
申请号:KR1020070128525
申请日:2007-12-11
Applicant: 한국전자통신연구원
CPC classification number: G10L19/26 , G10L19/0212
Abstract: A post-processing filter apparatus for improving sound quality in an MDCT(Modified Discrete Cosine Transform) area and a filter method are provided to use MDCT functions of both previous frame and current frame, thereby obtaining more similar coefficients to substantial voice spectrum. A spectrum coefficient generator(101) generates spectrum coefficients by using MDCT coefficients of the current voice frame and a previous voice frame. A normalizing unit(102) normalizes the generated spectrum coefficients. A transforming unit(103) maps the normalized spectrum coefficients with convex functions to generate converted spectrum coefficients. A filter coefficient generator(104) generates filter coefficients by controlling reflecting degrees of the converted spectrum coefficients. An MDCT coefficient generator(105) generates new MDCT coefficients by multiplying the filter coefficients by the MDCT coefficients of the current voice frame.
Abstract translation: 提供了一种用于改善MDCT(改进离散余弦变换)区域中的声音质量的后处理滤波器装置和滤波器方法,以使用先前帧和当前帧的MDCT功能,从而获得与实质语音频谱更相似的系数。 频谱系数生成器(101)通过使用当前语音帧和先前语音帧的MDCT系数来生成频谱系数。 归一化单元(102)对所生成的频谱系数进行归一化。 变换单元(103)将具有凸函数的归一化频谱系数映射以产生转换的频谱系数。 滤波器系数发生器(104)通过控制转换的频谱系数的反射程度来产生滤波器系数。 MDCT系数生成器(105)通过将滤波器系数乘以当前语音帧的MDCT系数来生成新的MDCT系数。
-
公开(公告)号:KR100848324B1
公开(公告)日:2008-07-24
申请号:KR1020060125139
申请日:2006-12-08
Applicant: 한국전자통신연구원
CPC classification number: G10L19/0204 , G10L19/12 , G10L21/038 , G10L25/18
Abstract: 음성 부호화 장치 및 그 방법이 개시된다. 대역분할부는 입력 신호를 고대역 신호 및 저대역 신호로 분리하고, 협대역 부호화부는, 저대역 신호를 CELP 기반의 협대역 음성 코덱을 이용하여 부호화하고, 주파수 특성 수집부는 고대역 신호를 주파수 영역으로 변환하고 MDCT 계수를 구하고, 서브밴드 결정부는 MDCT 계수를 기초로 형상 양자화를 위한 서브밴드를 결정하고, 형상 양자화를 위한 서브밴드를 기초로 이득 양자화를 위한 서브밴드를 결정하고, 이득 양자화부는 이득 양자화를 위한 서브밴드에 대하여 이득 양자화를 수행하고, 비트 할당부는 이득 양자화의 크기에 따라 이득 양자화를 위한 서브밴드에 비트를 할당하고, 형상 양자화부는 대수적 방법으로 형상 양자화를 위한 서브밴드에 대하여 형상 양자화를 수행한다. 이로써, 음성 코덱에서 적은 비트로 대역폭을 확장하여 알고리즘의 일관성과 계산량을 감소할 수 있다.
-
公开(公告)号:KR100795727B1
公开(公告)日:2008-01-21
申请号:KR1020060061746
申请日:2006-07-03
Applicant: 한국전자통신연구원
IPC: G10L19/12
CPC classification number: G10L19/12 , G10L2019/0013
Abstract: 본 발명은 펄스 대체 방법을 사용하면서 음성의 특성에 맞게 적절한 초기 고정 코드북를 선택하고, 펄스 대체 회수, 한계값 등을 정함으로써, 음질 향상과 불필요한 계산량을 감소시키는 고정 코드북 검색하는 장치 및 방법을 제공하기 위한 것으로, CELP 음성 코더를 사용하여 사용자 음성으로부터 음성 정보를 수집하는 음성 특성 정보 수집부와, 상기 수집한 음성 정보를 바탕으로 음성 특성을 결정하는 음성 특성 결정부와, 상기 결정된 음성 특성을 바탕으로 초기 고정 코드북을 선택하는 초기 고정 코드북 결정부와, 상기 결정된 음성 특성을 바탕으로 펄스 대체 방법에서 필요한 여러 상수를 결정하는 고정 코드북 검색 파라미터 결정부와, 상기 선택된 고정 코드북 검색 파라미터와, 초기 고정 코드북을 초기값으로 사용하여 펄스 대체 방법으로 고정 코드북을 결정하는 고정 코드북 결정부를 포함하는데 있다.
음성 코더, CELP, 고정 코드북-
公开(公告)号:KR100590769B1
公开(公告)日:2006-06-15
申请号:KR1020030094422
申请日:2003-12-22
Applicant: 한국전자통신연구원
IPC: G10L19/00
CPC classification number: H04W88/181
Abstract: 상호 부호화 장치 및 그 방법이 개시된다. 프레임 비교부는 송신측에서 사용하는 입력 프레임과 수신측에서 사용하는 출력 프레임의 길이를 비교한다. 프레임 결정부는 프레임의 길이를 기초로 출력 프레임에 대응되는 적어도 하나 이상의 입력 프레임을 결정하고 입력 프레임의 유형을 기초로 출력 프레임의 유형을 결정한다. 그리고, 프레임 변환부는 결정된 유형을 기초로 입력 프레임의 포맷을 출력 프레임의 포맷으로 변환한다. 이로써, VAD를 이용하여 부호화된 프레임을 다른 음성 코더의 포맷에 적합하도록 용이하게 변환할 수 있다.
프레임의 길이, 프레임의 유형, 프레임의 포맷, 변환-
公开(公告)号:KR1020050062749A
公开(公告)日:2005-06-27
申请号:KR1020030094422
申请日:2003-12-22
Applicant: 한국전자통신연구원
IPC: G10L19/00
CPC classification number: H04W88/181
Abstract: 상호 부호화 장치 및 그 방법이 개시된다. 프레임 비교부는 송신측에서 사용하는 입력 프레임과 수신측에서 사용하는 출력 프레임의 길이를 비교한다. 프레임 결정부는 프레임의 길이를 기초로 출력 프레임에 대응되는 적어도 하나 이상의 입력 프레임을 결정하고 입력 프레임의 유형을 기초로 출력 프레임의 유형을 결정한다. 그리고, 프레임 변환부는 결정된 유형을 기초로 입력 프레임의 포맷을 출력 프레임의 포맷으로 변환한다. 이로써, VAD를 이용하여 부호화된 프레임을 다른 음성 코더의 포맷에 적합하도록 용이하게 변환할 수 있다.
-
-
-
-
-
-
-
-
-