통계적 모델에 기초한 유성음/무성음 판별 장치 및 그 방법
    61.
    发明公开
    통계적 모델에 기초한 유성음/무성음 판별 장치 및 그 방법 失效
    基于统计模型的无声声音识别声音的方法

    公开(公告)号:KR1020040079773A

    公开(公告)日:2004-09-16

    申请号:KR1020030014814

    申请日:2003-03-10

    Abstract: PURPOSE: An apparatus and a method for discriminating a voiced sound from an unvoiced sound based on a statistical model are provided to improve the performance of discriminating the voice and unvoiced sounds from each other through a simple calculation even in a noisy environment. CONSTITUTION: An apparatus for discriminating a voiced sound from an unvoiced sound includes a signal converter(100) for converting a speech signal including noise into a frequency signal, a noise power estimator(200) for estimating a noise power from the frequency signal, and the first likelihood ratio calculator(310) for calculating a decision rule of voice activity detection of the frequency signal in a low frequency band with reference to the estimated noise power. The apparatus further includes the second likelihood ratio calculator(320) for calculating a decision rule of voice activity detection of the frequency signal in a high frequency band with reference to the estimated noise power, and a final likelihood ratio tester(400) for calculating a likelihood ratio of the voice/unvoiced sounds on the basis of the likelihood ratios calculated by the first and second likelihood ratio calculators and compares the likelihood ratio to a predetermined threshold to determine voice/unvoiced sounds.

    Abstract translation: 目的:提供一种用于基于统计模型识别浊音与声音的装置和方法,以便即使在嘈杂的环境中也能通过简单的计算来提高辨别声音和清音的声音。 一种用于从浊音识别浊音的装置包括用于将包括噪声的语音信号转换为频率信号的信号转换器(100),用于从频率信号估计噪声功率的噪声功率估计器(200),以及 第一似然比计算器(310),用于参考估计的噪声功率计算低频带中的频率信号的语音活动检测的判定规则。 该装置还包括第二似然比计算器(320),用于根据所估计的噪声功率计算高频段中的频率信号的语音活动检测的判定规则;以及最终似然比测试器(400),用于计算 基于由第一和第二似然比计算器计算的似然比,语音/清音的似然比,并将似然比与预定阈值进行比较,以确定语音/清音。

    MDCT 영역에서의 후처리 방법, 및 장치
    62.
    发明授权
    MDCT 영역에서의 후처리 방법, 및 장치 失效
    一种用于语音增强的MDCT域中自适应后处理的方法和装置

    公开(公告)号:KR101170466B1

    公开(公告)日:2012-08-03

    申请号:KR1020080131712

    申请日:2008-12-22

    Abstract: 본 발명은 MDCT 계수의 크기에 따라 그 크기를 조절하여 음질을 향상시키는 MDCT 영역에 대한 후처리 방법에 대한 것이다. 본 발명에 따른 MDCT 영역에 대한 후처리 방법은, 입력 프레임의 MDCT 계수에 대한 미분값의 증감을 토대로 MDCT 계수에 의한 피크(peak)와 밸리(valley)를 구하고, 피크와 밸리를 단위로 하는 복수의 서브 대역을 형성하는 단계, 복수의 피크에 대한 미분값의 증감을 토대로 복수의 피크에 대한 글로벌 포먼트와 밸리를 판단하고, 글로벌 포먼트와 밸리에 대한 서브 대역을 통합하여 복수의 대역을 형성하는 단계, 입력신호에 대한 shaping 비율을 대역에 적용하여 각 대역에 대한 필터 계수를 구하는 단계, 및 MDCT 계수에 필터 계수를 승산하여 각 대역의 입출력 MDCT 계수의 이득을 일치시키는 단계를 구비한다.
    MDCT, 코덱, 글로벌 포먼트, 밸리, shaping 비율

    통신 시스템에서 신호 부호화 장치 및 방법
    63.
    发明公开
    통신 시스템에서 신호 부호화 장치 및 방법 失效
    在通信系统中编码信号的装置和方法

    公开(公告)号:KR1020110125157A

    公开(公告)日:2011-11-18

    申请号:KR1020100091025

    申请日:2010-09-16

    Abstract: PURPOSE: A device and method for a coding signal in a communication system are provided to supply a voice and an audio service of high quality through gain compensation which minimized the error as a low bit rate in a communication environment. CONSTITUTION: A transformation unit(205,210) converts the signal of a temporal domain corresponding to the service into the signal of a frequency domain. A sampling unit(215) calculates the gain of each sub band in the signal of the converted frequency domain. The sampling unit samples the frequency coefficient of each sub band. A search unit(220) searches the patch information of each sub band in the signal of the converted frequency domain. A packetizing unit(225) encodes the gain information of the sub band in the signal of frequency domain.

    Abstract translation: 目的:提供通信系统中用于编码信号的装置和方法,以通过增益补偿来提供高质量的语音和音频服务,该增益补偿在通信环境中将误差最小化为低比特率。 构成:变换单元(205,210)将与服务对应的时域的信号转换为频域的信号。 采样单元(215)计算转换频域的信号中每个子带的增益。 采样单元对每个子带的频率系数进行采样。 搜索单元(220)在转换的频域的信号中搜索每个子带的补丁信息。 分组单元(225)对频域信号中的子带的增益信息进行编码。

    음성코덱의 품질향상장치 및 그 방법
    64.
    发明公开
    음성코덱의 품질향상장치 및 그 방법 有权
    提高语音编解码质量的方法及其方法

    公开(公告)号:KR1020110068961A

    公开(公告)日:2011-06-22

    申请号:KR1020110045248

    申请日:2011-05-13

    Abstract: PURPOSE: A quality improving apparatus of audio codec and method thereof are provided to reduce noises due to the quantization error of mute section and to increase the quality of audio codec. CONSTITUTION: A first energy calculating unit(300) adds up energy about each sample. The first energy calculator obtains the energy of one frame. In case a low band improvement mode operates, a second energy calculating unit(310) obtains the energy of a signal that is decoded through the low band improvement mode. A scaling unit(320) scales the size of the signal that is decoded through a kernel codec.

    Abstract translation: 目的:提供音频编解码器的质量改进装置及其方法,以减少由于静音部分的量化误差引起的噪声并提高音频编解码器的质量。 构成:第一能量计算单元(300)将关于每个样品的能量相加。 第一个能量计算器获得一帧的能量。 在低频带改善模式工作的情况下,第二能量计算单元(310)获得通过低频带改善模式解码的信号的能量。 缩放单元(320)缩放通过内核编解码器解码的信号的大小。

    MDCT 영역에서 음질 향상을 위한 후처리 필터장치 및필터방법
    65.
    发明授权
    MDCT 영역에서 음질 향상을 위한 후처리 필터장치 및필터방법 失效
    一种用于MDCT域中语音增强的后置滤波器的装置及其方法

    公开(公告)号:KR100922897B1

    公开(公告)日:2009-10-20

    申请号:KR1020070128525

    申请日:2007-12-11

    CPC classification number: G10L19/26 G10L19/0212

    Abstract: 본 발명은 MDCT 영역에서 동작하는 후처리 필터장치 및 필터방법에 관한 것으로, 더욱 상세하게는 과거와 현재의 MDCT 계수를 이용하여 실제 음성 스펙트럼과 유사한 스펙트럼 계수를 얻고 그 계수 크기가 작은 곳에서는 미분값이 크도록, 계수 크기가 큰 곳에서는 미분값이 작도록 볼록 함수로 변환하여 후처리 필터 계수를 구하고 이를 MDCT 계수에 적용하여 음성 신호 왜곡 없이 코딩 잡음을 줄이는 후처리 필터장치 및 필터방법에 관한 것이다. 이에 의하면, 현재와 과거의 MDCT 값을 모두 사용하기 때문에 실제 음성 스펙트럼과 유사한 계수를 획득하는 것이 가능하고 더 정확한 필터 계수를 얻을 수 있다. 또한, 볼록 함수에 의해 계수를 적절히 변환하였기 때문에 음질을 향상시킬 수 있다.
    후처리 필터(post-filter), 코덱(codec), MDCT(modified discrete cosine transform), 볼록 함수, 음성 스펙트럼

    MDCT 영역에서 음질 향상을 위한 후처리 필터장치 및필터방법
    66.
    发明公开
    MDCT 영역에서 음질 향상을 위한 후처리 필터장치 및필터방법 失效
    MDCT领域语音增强后置滤波器的设备及其方法

    公开(公告)号:KR1020090061499A

    公开(公告)日:2009-06-16

    申请号:KR1020070128525

    申请日:2007-12-11

    CPC classification number: G10L19/26 G10L19/0212

    Abstract: A post-processing filter apparatus for improving sound quality in an MDCT(Modified Discrete Cosine Transform) area and a filter method are provided to use MDCT functions of both previous frame and current frame, thereby obtaining more similar coefficients to substantial voice spectrum. A spectrum coefficient generator(101) generates spectrum coefficients by using MDCT coefficients of the current voice frame and a previous voice frame. A normalizing unit(102) normalizes the generated spectrum coefficients. A transforming unit(103) maps the normalized spectrum coefficients with convex functions to generate converted spectrum coefficients. A filter coefficient generator(104) generates filter coefficients by controlling reflecting degrees of the converted spectrum coefficients. An MDCT coefficient generator(105) generates new MDCT coefficients by multiplying the filter coefficients by the MDCT coefficients of the current voice frame.

    Abstract translation: 提供了一种用于改善MDCT(改进离散余弦变换)区域中的声音质量的后处理滤波器装置和滤波器方法,以使用先前帧和当前帧的MDCT功能,从而获得与实质语音频谱更相似的系数。 频谱系数生成器(101)通过使用当前语音帧和先前语音帧的MDCT系数来生成频谱系数。 归一化单元(102)对所生成的频谱系数进行归一化。 变换单元(103)将具有凸函数的归一化频谱系数映射以产生转换的频谱系数。 滤波器系数发生器(104)通过控制转换的频谱系数的反射程度来产生滤波器系数。 MDCT系数生成器(105)通过将滤波器系数乘以当前语音帧的MDCT系数来生成新的MDCT系数。

    음성코덱의 품질향상장치 및 그 방법
    67.
    发明公开
    음성코덱의 품질향상장치 및 그 방법 有权
    提高语音编解码质量的方法及其方法

    公开(公告)号:KR1020090060100A

    公开(公告)日:2009-06-11

    申请号:KR1020080008590

    申请日:2008-01-28

    Abstract: An apparatus for enhancing quality of a voice codec and a method therefor are provided to reduce noise due to quantization error of a combination interval when coding voice, thereby entirely increasing hearing quality. An apparatus for enhancing quality of a voice codec comprises the first energy calculator(300) and a scaling unit(320). The first energy calculator obtains the first energy of a signal decoded through a core codec. The scaling unit scales a size of the decoded signal when the first energy is smaller than the first threshold value.

    Abstract translation: 提供一种用于提高语音编解码器的质量的装置及其方法,用于在语音编码时减少由于组合间隔的量化误差引起的噪声,由此完全提高了听觉质量。 一种用于提高语音编解码器质量的装置包括第一能量计算器(300)和缩放单元(320)。 第一能量计算器获得通过核心编解码器解码的信号的第一能量。 当第一能量小于第一阈值时,缩放单元缩放解码信号的大小。

    복소수 라플라시안 통계모델을 이용한 음성 검출기 및 음성 검출 방법
    68.
    发明授权
    복소수 라플라시안 통계모델을 이용한 음성 검출기 및 음성 검출 방법 失效
    使用复杂拉普拉斯模型的语音活动检测器

    公开(公告)号:KR100513175B1

    公开(公告)日:2005-09-07

    申请号:KR1020020083728

    申请日:2002-12-24

    CPC classification number: G10L25/78

    Abstract: 본 발명은 복소수 라플라시안 통계 모델을 이용한 음성 검출기에 관한 것이다. 본 발명의 음성검출기는 입력된 음성에 대하여 고속 푸리에 변환을 수행하여 시간 영역의 음성신호를 주파수 영역에서 분석할 수 있도록 하는 고속 주파수 푸리에 변환기, 상기 고속 주파수 푸리에 변환기로부터 출력되는 주파수 영역 상의 잡음에 오염된 음성으로부터 잡음 신호의 파워를 추정하는 잡음 파워 추정부, 상기 추정된 잡음 신호의 파워에 기초하여 음성의 존재와 비존재에 대한 복소 라플라시안 확률 통계 모델로부터 주파수 영역에 대해 가능성 비율을 결정하고, 상기 결정된 가능성 비율로부터 VAD(Voice activity detection)의 결정 규칙을 계산하는 가능성 비율 테스트(LRT) 계산부를 포함한다.

    가변 프레임 음성 부호화/복호화 장치 및 그 방법
    69.
    发明公开
    가변 프레임 음성 부호화/복호화 장치 및 그 방법 失效
    用于可变帧语音编码/解码的装置和方法

    公开(公告)号:KR1020050066996A

    公开(公告)日:2005-06-30

    申请号:KR1020040097916

    申请日:2004-11-26

    Abstract: 본 발명은 입력 음성 신호의 특성에 따라 입력 음성 신호의 등급을 분류하고 분류한 등급에 대응하는 프레임 크기, 양자화기 구조 및 비트 할당 구조를 사용하여 부호화를 수행하거나, 네트워크의 상태 또는 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임 크기를 조정할 수 있는 음성 부호화/복호화 장치 및 그 방법에 관한 것이다. 본 발명은 입력 음성의 특성에 따라 프레임의 크기와 양자화기 구조 및 비트 할당을 최적으로 조정하여 음성 부호화 장치의 성능을 향상 시킬 수 있으며, 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임의 크기를 조정함으로써 전체 통화 지연을 줄일 수 있다.

    가변 비트율의 광대역 음성 및 오디오 부호화 장치 및방법
    70.
    发明公开
    가변 비트율의 광대역 음성 및 오디오 부호화 장치 및방법 失效
    用于编码可变比特率宽带语音和音频信号的装置及其方法

    公开(公告)号:KR1020050046204A

    公开(公告)日:2005-05-18

    申请号:KR1020030080225

    申请日:2003-11-13

    CPC classification number: G10L19/24

    Abstract: 본 발명은 가변 비트율(variable bit rate)의 광대역 음성 및 오디오의 부호화에 있어서, 음성과 오디오를 판별하여 효율적인 비트율로 전송하기 위한 광대역 음성 및 오디오 부호화 장치 및 그 방법에 관한 것이다.
    본 발명에 따른 가변 비트율의 광대역 음성 및 오디오 부호화(wideband speech and audio coding) 장치는, a) 코덱으로 입력되는 신호를 음성이나 오디오 신호로 각각 분류하는 음성 및 오디오 분류 수단; b) 분류된 입력 신호가 음성 신호인 경우, 협대역 부호화를 수행하는 협대역 부호화 수단; c) 분류된 입력 신호가 오디오 신호인 경우, 저대역과 고대역의 부호화 비트율을 각각 조정하는 비트율 조정 수단; 및 d) 비트율 조정 수단에서 조정된 비트율로 부호화를 수행하는 광대역 부호화 수단을 포함한다.
    본 발명에 따른 가변 비트율의 광대역 음성 부호화기는 낮은 비트율에서도 고대역에 부호화 비트를 할당함으로써, 입력 신호에 오디오 신호가 포함된 경우에도 음질의 열화를 방지할 수 있고, 효율적으로 비트율을 변경함으로써 가변 비트율의 광대역 음성 부호화기의 성능을 향상시킬 수 있다.

Patent Agency Ranking