-
公开(公告)号:KR100721537B1
公开(公告)日:2007-05-23
申请号:KR1020050087041
申请日:2005-09-16
Applicant: 한국전자통신연구원
CPC classification number: G10L19/04 , G10L19/0204 , G10L19/07 , G10L19/12
Abstract: 1. 청구범위에 기재된 발명이 속하는 기술분야
본 발명은 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 저대역 음성 부호화 정보와 TNS(Temporal Noise Shaping) 기법을 이용하여 고대역 음성을 부호화함으로써, 고대역 음성 부호화 과정에서 발생하는 프리-에코 현성을 줄일 수 있는, 광대역 음성 부호화기에서의 고대역 음성 부호화 장치 및 그 방법을 제공하는데 그 목적이 있음.
3. 발명의 해결방법의 요지
본 발명은, 광대역 음성 부호화기에서 저대역 부호화 정보를 이용하여 고대역 음성 신호를 부호화하는 고대역 음성 부호화 장치로서, 입력된 고대역 음성 신호를 주파수 영역으로 변환하기 위한 영역변환수단; 상기 저대역 부호화 정보로서 저대역 음성 신호의 피치 정보를 이용하여 선형예측차수를 결정하기 위한 선형예측차수 결정수단; 결정된 선형예측차수에 따라 상기 주파수 영역으로 변환된 고대역 음성 신호를 분석하여 선형예측계수를 생성하기 위한 선형예측 분석수단; 상기 저대역 부호화 정보로서 저대역 합성 신호를 이용하여 상기 선형예측계수를 양자화하기 위한 선형예측계수 양자화수단; 및 양자화된 선형예측계수를 역양자화하여 잔차신호를 구하고, 그 잔차신호를 양자화하기 위한 잔차신호 양자화수단을 포함함.
4. 발명의 중요한 용도
본 발명은 음성 부호화 등에 이용됨.
분할대역, 광대역, 고대역 음성, 부호화, 복호화, 저대역 음성-
公开(公告)号:KR1020050007853A
公开(公告)日:2005-01-21
申请号:KR1020030047454
申请日:2003-07-11
Abstract: PURPOSE: An apparatus and a method for estimating an open-loop pitch are provided to reduce quantity of calculation and improve quality of sound in a transcoder between speech codecs of different CELP(Code Excited Linear Prediction) types. CONSTITUTION: A decoding process part(401) decodes a coded bitstream having an input CELP codec format and extracts a closed-loop pitch for each sub-frame of a decoded speech signal from the bitstream. A perception weighting filter(402) performs filtering by perception weighting in view of the decoded speech signal. An open-loop pitch search part(407) searches an open-loop pitch within a search range of the open-loop pitch. The search range is determined by using a decoded closed-loop pitch and a previous open-loop pitch of the same frame. A closed-loop pitch search part(408) searches the closed-loop pitch of a speech signal filtered by perception weighting, by utilizing the searched open-loop pitch, and outputs the searched result as a pitch delay value of an output CELP codec format.
Abstract translation: 目的:提供一种用于估计开环音调的装置和方法,以减少不同CELP(代码激励线性预测)类型的语音编解码器之间的代码转换器中的计算量并提高声音质量。 构成:解码处理部分(401)解码具有输入CELP编解码器格式的编码比特流,并从比特流提取解码语音信号的每个子帧的闭环音调。 感知加权滤波器(402)鉴于解码的语音信号,通过感知加权来执行滤波。 开环音调搜索部分(407)搜索开环音调的搜索范围内的开环音调。 通过使用解码的闭环间距和相同帧的先前开环间距来确定搜索范围。 闭环音调搜索部分(408)通过利用搜索到的开环音调搜索通过感知加权滤波的语音信号的闭环音调,并将搜索结果输出为输出CELP编解码器格式的音调延迟值 。
-
-
公开(公告)号:KR1020160115041A
公开(公告)日:2016-10-06
申请号:KR1020150041698
申请日:2015-03-25
Applicant: 한국전자통신연구원
Abstract: 본발명에따른음성인식기반의발음학습장치는비원어민학습자의발음오류를반영한멀티미디어강의콘텐츠를제공하고, 말하기연습을위한발성스크립트를제공하는강의콘텐츠제공부, 발성스크립트를제공받은비원어민학습자의학습자음성신호를수신하고, 수신된학습자음성신호인식을통해인식된음성정보를생성하는음성인식부및 발성스크립트및 인식된음성정보에기초하여발음평가피드백정보를생성하는발음평가부를포함한다.
-
公开(公告)号:KR1020150042628A
公开(公告)日:2015-04-21
申请号:KR1020130121514
申请日:2013-10-11
Applicant: 한국전자통신연구원
Inventor: 김현우
IPC: H04N7/15
Abstract: 분산텔레프레즌스서비스에참여하는제1 단말에의해수행되는주화자결정방법이제공된다. 본발명의일 실시례에따른주화자결정방법은음성입력신호로부터제1 주화자결정특징정보를획득하는단계, 상기분산텔레프레즌스서비스에참여하는제2 단말로부터상기제2 단말의제2 주화자결정특징정보를획득하는단계및 상기제1 주화자결정특징정보및 상기제2 주화자결정특징정보를기반으로텔레프레즌스에참여하여발언하고있는주화자의영상및 음성을제공하는주화자단말을결정하는단계를포함한다.
Abstract translation: 提供了一种用于确定主要扬声器的方法,该方法由参与分布式远程呈现服务的第一终端执行。 根据本发明的实施例的方法包括以下步骤:从音频输入信号获得第一主扬声器确定特性信息; 从参与分布式远程呈现服务的第二终端获得第二终端的第二主讲者确定特征信息; 以及基于所述第一主扬声器确定特性信息和所述第二主扬声器确定特性信息,确定提供在所述远程呈现服务中参与和说话的主扬声器的图像和声音的主扬声器终端。
-
公开(公告)号:KR101423737B1
公开(公告)日:2014-07-24
申请号:KR1020110005956
申请日:2011-01-20
Applicant: 한국전자통신연구원
CPC classification number: G10L19/093 , G10L19/24
Abstract: 본 발명은 오디오 신호의 디코딩 방법 및 장치에 관한 것이다. 본 발명의 일 실시예에 따르면, 하나 이상의 정현 펄스를 이용하는 계층형 정현 펄스 코딩을 통해 인코딩된 오디오 신호를 디코딩하는 방법은, 상기 인코딩된 오디오 신호를 디코딩하는 단계, 상기 계층형 정현 펄스 코딩의 계층 구조에 따라, 상기 디코딩된 오디오 신호의 평활화 주파수 대역을 설정하는 단계, 상기 평활화 주파수 대역을 하나 이상의 서브 대역으로 나누는 단계, 및 상기 서브 대역별로 상기 디코딩된 오디오 신호를 평활화하는 단계를 포함한다. 본 발명에 의하면, 하나 이상의 정현 펄스를 이용하는 계층형 정현 펄스 코딩을 통해 인코딩된 오디오 신호를 디코딩함에 있어서, 평활화를 수행할 주파수 대역을 가변적으로 설정함으로써 디코딩에 소요되는 연산량을 줄이고, 합성된 신호의 품질을 높일 수 있는 효과가 있다.
-
公开(公告)号:KR1020100022422A
公开(公告)日:2010-03-02
申请号:KR1020080122123
申请日:2008-12-03
IPC: G10L19/008 , G10L19/02 , H04S3/00
Abstract: PURPOSE: An apparatus of layered parametric stereo encoding and decoding for audio signals are provided to analyze low band and high band by 64 band with a low algorithm delay in order to exactly stereo parameters, to reduce calculating amount, and to implement wideband stereo output and ultra-wideband stereo output without additional down sampling. CONSTITUTION: An apparatus of layered parametric stereo encoding and decoding for audio signals includes a first 2QMF analysis unit(110a), a second 2QMF analysis unit(110b), a low band parametric stereo encoder(120), a high band parametric stereo encoder(125), a kernel encoder(130), a band expansion encoder(135), a packetizing unit(140). The first 2QMF analysis unit and the second 2QMF analysis unit divide left channel signals and right channel signals into low band left channel signals and high band right channel signals. The low band parametric stereo encoder extracts and encodes low bad stereo parameters and generates low band mono signals. The high band parametric stereo encoder extracts and encodes high bad stereo parameters and generates high band mono signals. The kernel encoder encodes low band mono signals. The band expansion encoder encodes high band mono signals. The packetizing unit generates a bit stream from encoded low band mono signals and high band mono signals with low band stereo parameters and high band stereo parameters.
Abstract translation: 目的:提供用于音频信号的分层参数立体声编码和解码装置,以低算法延迟分析低频带和高频带64频带,以精确地立体声参数,减少计算量,实现宽带立体声输出和 超宽带立体声输出,无需额外的下采样。 构成:用于音频信号的分层参数立体声编码和解码装置包括第一2QMF分析单元(110a),第二2QMF分析单元(110b),低频带参数立体声编码器(120),高频带参数立体声编码器 125),内核编码器(130),频带扩展编码器(135),分组化单元(140)。 第一个2QMF分析单元和第二个2QMF分析单元将左声道信号和右声道信号分成低频左声道信号和高频带右声道信号。 低频段参数立体声编码器提取和编码低劣的立体声参数,并产生低频单声道信号。 高频段参数立体声编码器提取和编码高不良立体声参数并产生高频单声道信号。 内核编码器编码低频单声道信号。 频带扩展编码器编码高频单声道信号。 分组单元从编码的低频单声道信号和具有低频带立体声参数和高频带立体声参数的高频单声道信号产生比特流。
-
公开(公告)号:KR100789368B1
公开(公告)日:2007-12-28
申请号:KR1020060042645
申请日:2006-05-11
Applicant: 한국전자통신연구원
Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 잔차 신호 부호화 및 복호화 장치와 그 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 종래의 변환 부호화를 이용한 잔차 신호 부호화 방법을 개선하여, 변환 부호화 방법에서 선형 예측 부호화(linear predictive coding) 모델 및 트랙 구조를 채용함으로써 음질을 개선하고 메모리 및 계산량을 줄이기 위한 잔차 신호 부호화 및 복호화 장치와 그 방법을 제공하는데 목적이 있음.
3. 발명의 해결방법의 요지
본 발명은, 잔차 신호 부호화 장치에 있어서, 시간 영역의 잔차 신호를 주파수 영역으로 변환하여 변환 계수를 출력하는 변환부; 상기 변환계수로부터 선형예측계수를 추출하는 선형예측계수 추출부; 상기 선형예측계수를 양자화하여 양자화된 선형예측계수 및 인덱스를 출력하는 선형예측계수 양자화부; 상기 양자화된 선형예측계수에 기초하여 구현된 필터를 구비하며 상기 변환계수에 대하여 선형예측 분석을 수행하여 선형예측 잔차 변환계수를 출력하는 선형예측 분석 필터부; 상기 선형예측 잔차 변환계수를 소정 개수의 대역으로 구분하여 대역별로 선형예측 잔차 변환계수를 출력하는 대역 분할부; 상기 대역별 선형예측 잔차 변환계수를 검색하여 최적의 펄스를 선택하고, 상기 최적의 펄스에 대한 펄스 파라미터를 출력하는 펄스 검색부; 및 상기 최적 펄스의 펄스 파라미터를 양자화하는 펄스 양자화부를 포함함.
4. 발명의 중요한 용도
본 발명은 광대역 통합망에서 음성 부호화 등에 이용됨.
잔차 신호, 잔차 파라미터, 선형예측, 변환 부호화-
公开(公告)号:KR1020070061193A
公开(公告)日:2007-06-13
申请号:KR1020060061746
申请日:2006-07-03
Applicant: 한국전자통신연구원
IPC: G10L19/12
CPC classification number: G10L19/12 , G10L2019/0013
Abstract: A fixed codebook searching apparatus and method in a CELP(Code Excited Linear Prediction)-based speech coder are provided to select an initial fixed codebook suitable for a speech characteristic and decide the number of pulse replacements and a limit in order to improve sound quality and reduce the quantity of unnecessary calculations. A fixed codebook searching apparatus in a CELP-based speech coder includes a speech characteristic information collection unit(310), a speech characteristic determination unit(320), an initial fixed codebook determination unit(330), a fixed codebook search parameter determination unit(340), and a fixed codebook determination unit(350). The speech characteristic information collection unit collects speech information from user's speech by using a CELP speech coder. The speech characteristic determination unit determines a speech characteristic based on the collected speech information. The initial fixed codebook determination unit selects an initial fixed codebook based on the determined speech characteristic. The fixed codebook search parameter determination unit determines various constants required for pulse replacement based on the determined speech characteristic. The fixed codebook determination unit determines a fixed codebook through the pulse replacement by using the selected fixed codebook search parameter and the initial fixed codebook as initial values.
Abstract translation: 提供了一种基于CELP(代码激励线性预测)的语音编码器中的固定码本搜索装置和方法,用于选择适合于语音特征的初始固定码本,并且决定脉冲替换次数和极限,以改善声音质量, 减少不必要的计算量。 基于CELP的语音编码器中的固定码本搜索装置包括语音特征信息收集单元(310),语音特征确定单元(320),初始固定码本确定单元(330),固定码本搜索参数确定单元 340)和固定码本确定单元(350)。 语音特征信息收集单元通过使用CELP语音编码器从用户的语音收集语音信息。 语音特征确定单元基于所收集的语音信息来确定语音特征。 初始固定码本确定单元基于所确定的语音特征来选择初始固定码本。 固定码本搜索参数确定单元基于所确定的语音特征来确定脉冲替换所需的各种常数。 固定码本确定单元通过使用所选择的固定码本搜索参数和初始固定码本作为初始值,通过脉冲替换来确定固定码本。
-
公开(公告)号:KR1020060124568A
公开(公告)日:2006-12-05
申请号:KR1020060042645
申请日:2006-05-11
Applicant: 한국전자통신연구원
CPC classification number: G10L19/087
Abstract: An apparatus and a method for coding and decoding a residual signal are provided to enhance sound quality and reduce the amount of memories and calculation by using a linear predictive model and track structure. A converter(301) converts a residual signal of a time region to a frequency region and outputs a conversion coefficient. A linear predictive coefficient extractor(303) extracts a linear predictive coefficient from the conversion coefficient. A linear predictive coefficient quantization unit(305) quantizes the linear predictive coefficient and outputs the quantized linear predictive coefficient and a corresponding index. A linear predictive analysis filter(307) outputs a linear predictive residual conversion coefficient by performing a linear predictive analysis process. A band divider(309) outputs the linear predictive residual conversion coefficient of each band. A pulse detector(311) selects an optimum pulse by searching the linear predictive residual conversion coefficient of each band. A pulse quantizer(313) quantizes a pulse parameter of the optimum pulse.
Abstract translation: 提供一种用于编码和解码残余信号的装置和方法,以通过使用线性预测模型和轨道结构来增强声音质量并减少存储量和计算。 A转换器(301)将时域的残差信号转换为频率区域,并输出转换系数。 线性预测系数提取器(303)从转换系数提取线性预测系数。 线性预测系数量化单元(305)对线性预测系数进行量化,并输出量化的线性预测系数和相应的指标。 线性预测分析滤波器(307)通过进行线性预测分析处理来输出线性预测残差转换系数。 带分割器(309)输出每个频带的线性预测残差转换系数。 脉冲检测器(311)通过搜索每个频带的线性预测残差转换系数来选择最佳脉冲。 脉冲量化器(313)对最佳脉冲的脉冲参数进行量化。
-
-
-
-
-
-
-
-
-