분산 텔레프레즌스 서비스 제공 방법 및 장치
    31.
    发明公开
    분산 텔레프레즌스 서비스 제공 방법 및 장치 审中-实审
    提供分布式电话传真服务的方法和设备

    公开(公告)号:KR1020150042628A

    公开(公告)日:2015-04-21

    申请号:KR1020130121514

    申请日:2013-10-11

    Inventor: 김현우

    CPC classification number: G10L25/57 G10L25/78 H04N7/152

    Abstract: 분산텔레프레즌스서비스에참여하는제1 단말에의해수행되는주화자결정방법이제공된다. 본발명의일 실시례에따른주화자결정방법은음성입력신호로부터제1 주화자결정특징정보를획득하는단계, 상기분산텔레프레즌스서비스에참여하는제2 단말로부터상기제2 단말의제2 주화자결정특징정보를획득하는단계및 상기제1 주화자결정특징정보및 상기제2 주화자결정특징정보를기반으로텔레프레즌스에참여하여발언하고있는주화자의영상및 음성을제공하는주화자단말을결정하는단계를포함한다.

    Abstract translation: 提供了一种用于确定主要扬声器的方法,该方法由参与分布式远程呈现服务的第一终端执行。 根据本发明的实施例的方法包括以下步骤:从音频输入信号获得第一主扬声器确定特性信息; 从参与分布式远程呈现服务的第二终端获得第二终端的第二主讲者确定特征信息; 以及基于所述第一主扬声器确定特性信息和所述第二主扬声器确定特性信息,确定提供在所述远程呈现服务中参与和说话的主扬声器的图像和声音的主扬声器终端。

    오디오 신호의 디코딩 방법 및 장치
    32.
    发明授权
    오디오 신호의 디코딩 방법 및 장치 有权
    解码音频信号的方法和装置

    公开(公告)号:KR101423737B1

    公开(公告)日:2014-07-24

    申请号:KR1020110005956

    申请日:2011-01-20

    CPC classification number: G10L19/093 G10L19/24

    Abstract: 본 발명은 오디오 신호의 디코딩 방법 및 장치에 관한 것이다. 본 발명의 일 실시예에 따르면, 하나 이상의 정현 펄스를 이용하는 계층형 정현 펄스 코딩을 통해 인코딩된 오디오 신호를 디코딩하는 방법은, 상기 인코딩된 오디오 신호를 디코딩하는 단계, 상기 계층형 정현 펄스 코딩의 계층 구조에 따라, 상기 디코딩된 오디오 신호의 평활화 주파수 대역을 설정하는 단계, 상기 평활화 주파수 대역을 하나 이상의 서브 대역으로 나누는 단계, 및 상기 서브 대역별로 상기 디코딩된 오디오 신호를 평활화하는 단계를 포함한다. 본 발명에 의하면, 하나 이상의 정현 펄스를 이용하는 계층형 정현 펄스 코딩을 통해 인코딩된 오디오 신호를 디코딩함에 있어서, 평활화를 수행할 주파수 대역을 가변적으로 설정함으로써 디코딩에 소요되는 연산량을 줄이고, 합성된 신호의 품질을 높일 수 있는 효과가 있다.

    오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치 및복호화 장치
    33.
    发明公开
    오디오 신호의 계층적 파라메트릭 스테레오 부호화 장치 및복호화 장치 有权
    用于层级参数立体声编码和解码音频信号的装置

    公开(公告)号:KR1020100022422A

    公开(公告)日:2010-03-02

    申请号:KR1020080122123

    申请日:2008-12-03

    Abstract: PURPOSE: An apparatus of layered parametric stereo encoding and decoding for audio signals are provided to analyze low band and high band by 64 band with a low algorithm delay in order to exactly stereo parameters, to reduce calculating amount, and to implement wideband stereo output and ultra-wideband stereo output without additional down sampling. CONSTITUTION: An apparatus of layered parametric stereo encoding and decoding for audio signals includes a first 2QMF analysis unit(110a), a second 2QMF analysis unit(110b), a low band parametric stereo encoder(120), a high band parametric stereo encoder(125), a kernel encoder(130), a band expansion encoder(135), a packetizing unit(140). The first 2QMF analysis unit and the second 2QMF analysis unit divide left channel signals and right channel signals into low band left channel signals and high band right channel signals. The low band parametric stereo encoder extracts and encodes low bad stereo parameters and generates low band mono signals. The high band parametric stereo encoder extracts and encodes high bad stereo parameters and generates high band mono signals. The kernel encoder encodes low band mono signals. The band expansion encoder encodes high band mono signals. The packetizing unit generates a bit stream from encoded low band mono signals and high band mono signals with low band stereo parameters and high band stereo parameters.

    Abstract translation: 目的:提供用于音频信号的分层参数立体声编码和解码装置,以低算法延迟分析低频带和高频带64频带,以精确地立体声参数,减少计算量,实现宽带立体声输出和 超宽带立体声输出,无需额外的下采样。 构成:用于音频信号的分层参数立体声编码和解码装置包括第一2QMF分析单元(110a),第二2QMF分析单元(110b),低频带参数立体声编码器(120),高频带参数立体声编码器 125),内核编码器(130),频带扩展编码器(135),分组化单元(140)。 第一个2QMF分析单元和第二个2QMF分析单元将左声道信号和右声道信号分成低频左声道信号和高频带右声道信号。 低频段参数立体声编码器提取和编码低劣的立体声参数,并产生低频单声道信号。 高频段参数立体声编码器提取和编码高不良立体声参数并产生高频单声道信号。 内核编码器编码低频单声道信号。 频带扩展编码器编码高频单声道信号。 分组单元从编码的低频单声道信号和具有低频带立体声参数和高频带立体声参数的高频单声道信号产生比特流。

    잔차 신호 부호화 및 복호화 장치와 그 방법
    34.
    发明授权
    잔차 신호 부호화 및 복호화 장치와 그 방법 有权
    残留信号的编码和解码装置和方法

    公开(公告)号:KR100789368B1

    公开(公告)日:2007-12-28

    申请号:KR1020060042645

    申请日:2006-05-11

    Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
    본 발명은 잔차 신호 부호화 및 복호화 장치와 그 방법에 관한 것임.
    2. 발명이 해결하려고 하는 기술적 과제
    본 발명은, 종래의 변환 부호화를 이용한 잔차 신호 부호화 방법을 개선하여, 변환 부호화 방법에서 선형 예측 부호화(linear predictive coding) 모델 및 트랙 구조를 채용함으로써 음질을 개선하고 메모리 및 계산량을 줄이기 위한 잔차 신호 부호화 및 복호화 장치와 그 방법을 제공하는데 목적이 있음.
    3. 발명의 해결방법의 요지
    본 발명은, 잔차 신호 부호화 장치에 있어서, 시간 영역의 잔차 신호를 주파수 영역으로 변환하여 변환 계수를 출력하는 변환부; 상기 변환계수로부터 선형예측계수를 추출하는 선형예측계수 추출부; 상기 선형예측계수를 양자화하여 양자화된 선형예측계수 및 인덱스를 출력하는 선형예측계수 양자화부; 상기 양자화된 선형예측계수에 기초하여 구현된 필터를 구비하며 상기 변환계수에 대하여 선형예측 분석을 수행하여 선형예측 잔차 변환계수를 출력하는 선형예측 분석 필터부; 상기 선형예측 잔차 변환계수를 소정 개수의 대역으로 구분하여 대역별로 선형예측 잔차 변환계수를 출력하는 대역 분할부; 상기 대역별 선형예측 잔차 변환계수를 검색하여 최적의 펄스를 선택하고, 상기 최적의 펄스에 대한 펄스 파라미터를 출력하는 펄스 검색부; 및 상기 최적 펄스의 펄스 파라미터를 양자화하는 펄스 양자화부를 포함함.
    4. 발명의 중요한 용도
    본 발명은 광대역 통합망에서 음성 부호화 등에 이용됨.
    잔차 신호, 잔차 파라미터, 선형예측, 변환 부호화

    CELP기반의 음성 코더에서 고정 코드북 검색 장치 및방법
    35.
    发明公开
    CELP기반의 음성 코더에서 고정 코드북 검색 장치 및방법 失效
    基于CELP搜索语音编码器中的固定代码的方法和设备

    公开(公告)号:KR1020070061193A

    公开(公告)日:2007-06-13

    申请号:KR1020060061746

    申请日:2006-07-03

    CPC classification number: G10L19/12 G10L2019/0013

    Abstract: A fixed codebook searching apparatus and method in a CELP(Code Excited Linear Prediction)-based speech coder are provided to select an initial fixed codebook suitable for a speech characteristic and decide the number of pulse replacements and a limit in order to improve sound quality and reduce the quantity of unnecessary calculations. A fixed codebook searching apparatus in a CELP-based speech coder includes a speech characteristic information collection unit(310), a speech characteristic determination unit(320), an initial fixed codebook determination unit(330), a fixed codebook search parameter determination unit(340), and a fixed codebook determination unit(350). The speech characteristic information collection unit collects speech information from user's speech by using a CELP speech coder. The speech characteristic determination unit determines a speech characteristic based on the collected speech information. The initial fixed codebook determination unit selects an initial fixed codebook based on the determined speech characteristic. The fixed codebook search parameter determination unit determines various constants required for pulse replacement based on the determined speech characteristic. The fixed codebook determination unit determines a fixed codebook through the pulse replacement by using the selected fixed codebook search parameter and the initial fixed codebook as initial values.

    Abstract translation: 提供了一种基于CELP(代码激励线性预测)的语音编码器中的固定码本搜索装置和方法,用于选择适合于语音特征的初始固定码本,并且决定脉冲替换次数和极限,以改善声音质量, 减少不必要的计算量。 基于CELP的语音编码器中的固定码本搜索装置包括语音特征信息收集单元(310),语音特征确定单元(320),初始固定码本确定单元(330),固定码本搜索参数确定单元 340)和固定码本确定单元(350)。 语音特征信息收集单元通过使用CELP语音编码器从用户的语音收集语音信息。 语音特征确定单元基于所收集的语音信息来确定语音特征。 初始固定码本确定单元基于所确定的语音特征来选择初始固定码本。 固定码本搜索参数确定单元基于所确定的语音特征来确定脉冲替换所需的各种常数。 固定码本确定单元通过使用所选择的固定码本搜索参数和初始固定码本作为初始值,通过脉冲替换来确定固定码本。

    잔차 신호 부호화 및 복호화 장치와 그 방법
    36.
    发明公开
    잔차 신호 부호화 및 복호화 장치와 그 방법 有权
    用于编码和解码残留信号的装置和方法

    公开(公告)号:KR1020060124568A

    公开(公告)日:2006-12-05

    申请号:KR1020060042645

    申请日:2006-05-11

    CPC classification number: G10L19/087

    Abstract: An apparatus and a method for coding and decoding a residual signal are provided to enhance sound quality and reduce the amount of memories and calculation by using a linear predictive model and track structure. A converter(301) converts a residual signal of a time region to a frequency region and outputs a conversion coefficient. A linear predictive coefficient extractor(303) extracts a linear predictive coefficient from the conversion coefficient. A linear predictive coefficient quantization unit(305) quantizes the linear predictive coefficient and outputs the quantized linear predictive coefficient and a corresponding index. A linear predictive analysis filter(307) outputs a linear predictive residual conversion coefficient by performing a linear predictive analysis process. A band divider(309) outputs the linear predictive residual conversion coefficient of each band. A pulse detector(311) selects an optimum pulse by searching the linear predictive residual conversion coefficient of each band. A pulse quantizer(313) quantizes a pulse parameter of the optimum pulse.

    Abstract translation: 提供一种用于编码和解码残余信号的装置和方法,以通过使用线性预测模型和轨道结构来增强声音质量并减少存储量和计算。 A转换器(301)将时域的残差信号转换为频率区域,并输出转换系数。 线性预测系数提取器(303)从转换系数提取线性预测系数。 线性预测系数量化单元(305)对线性预测系数进行量化,并输出量化的线性预测系数和相应的指标。 线性预测分析滤波器(307)通过进行线性预测分析处理来输出线性预测残差转换系数。 带分割器(309)输出每个频带的线性预测残差转换系数。 脉冲检测器(311)通过搜索每个频带的线性预测残差转换系数来选择最佳脉冲。 脉冲量化器(313)对最佳脉冲的脉冲参数进行量化。

    음성 코덱을 이용한 후두 원격 진단 서비스 장치 및 그 방법
    37.
    发明公开
    음성 코덱을 이용한 후두 원격 진단 서비스 장치 및 그 방법 无效
    远程服务设备和使用语音编解码器诊断语言障碍或/或状态的方法

    公开(公告)号:KR1020060066416A

    公开(公告)日:2006-06-16

    申请号:KR1020040105008

    申请日:2004-12-13

    Inventor: 김현우 김도영

    CPC classification number: G10L17/26 G10L25/90 G10L2025/903

    Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
    본 발명은 음성 코덱을 이용한 후두 원격 진단 서비스 장치 및 그 방법에 관한 것임.
    2. 발명이 해결하려고 하는 기술적 과제
    본 발명은 음성 코덱을 사용하는 시스템 측으로부터 전송받은 파라미터(선형 예측 계수, 피치 등)를 이용하여 후두 질환 또는/및 후두 상태를 결정하기 위한 후두 원격 진단 서비스 장치 및 그 방법을 제공하는데 그 목적이 있음.
    3. 발명의 해결방법의 요지
    본 발명은, 음성 코덱을 이용한 후두 원격 진단 서비스 장치에 있어서, 외부의 네트워크를 통하여 사용자 정보와 외부 기기에 사용되는 음성 코덱 정보를 수집하기 위한 사용자 정보/음성 코덱 정보 수집 수단; 상기 사용자 정보/음성 코덱 정보 수집 수단에서 수집한 음성 코덱 정보를 바탕으로 상기 네트워크 측으로부터 전달받은 비트열에서 진단 파라미터를 추출하기 위한 파라미터 추출 수단; 음성 코덱의 종류와 비트율을 고려하여 진단 파라미터를 미리 저장하고 있는 저장 수단; 상기 파라미터 추출 수단에서 추출한 진단 파라미터를 상기 음성 코덱 정보를 바탕으로 상기 저장 수단의 정보와 비교하기 위한 파라미터 비교 수단; 및 상기 파라미터 비교 수단에서의 비교 결과를 바탕으로 후두 질환 또는/및 후두 상태를 결정(진단)하기 위한 후두 질환 또는/및 후두 상태 결정 수단을 포함함.
    4. 발명의 중요한 용도
    본 발명은 후두 원격 진단 서비스 등에 이용됨.
    음성 코덱 정보, 사용자 정보, 음성 비트열, 후두 질환 원격 진단 서비스, 진단 파라미터 추출/비교

    광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
    38.
    发明公开
    광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법 失效
    分离宽带语音编码器高分辨编码的装置和方法

    公开(公告)号:KR1020060064510A

    公开(公告)日:2006-06-13

    申请号:KR1020050087041

    申请日:2005-09-16

    CPC classification number: G10L19/04 G10L19/0204 G10L19/07 G10L19/12

    Abstract: 1. 청구범위에 기재된 발명이 속하는 기술분야
    본 발명은 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그 방법에 관한 것임.
    2. 발명이 해결하려고 하는 기술적 과제
    본 발명은 저대역 음성 부호화 정보와 TNS(Temporal Noise Shaping) 기법을 이용하여 고대역 음성을 부호화함으로써, 고대역 음성 부호화 과정에서 발생하는 프리-에코 현성을 줄일 수 있는, 광대역 음성 부호화기에서의 고대역 음성 부호화 장치 및 그 방법을 제공하는데 그 목적이 있음.
    3. 발명의 해결방법의 요지
    본 발명은, 광대역 음성 부호화기에서 저대역 부호화 정보를 이용하여 고대역 음성 신호를 부호화하는 고대역 음성 부호화 장치로서, 입력된 고대역 음성 신호를 주파수 영역으로 변환하기 위한 영역변환수단; 상기 저대역 부호화 정보를 이용하여 선형예측차수를 결정하기 위한 선형예측차수 결정수단; 결정된 선형예측차수에 따라 상기 주파수 영역으로 변환된 고대역 음성 신호를 분석하여 선형예측계수를 생성하기 위한 선형예측 분석수단; 상기 저대역 부호화 정보를 이용하여 상기 선형예측계수를 양자화하기 위한 선형예측계수 양자화수단; 및 양자화된 선형예측계수를 역양자화하여 잔차신호를 구하고, 그 잔차신호를 양자화하기 위한 잔차신호 양자화수단을 포함함.
    4. 발명의 중요한 용도
    본 발명은 음성 부호화 등에 이용됨.
    분할대역, 광대역, 고대역 음성, 부호화, 복호화, 저대역 음성

    언어모델 군집화 기반 음성인식 장치 및 방법
    39.
    发明公开
    언어모델 군집화 기반 음성인식 장치 및 방법 有权
    基于语音聚类的语音识别装置及方法

    公开(公告)号:KR1020160000218A

    公开(公告)日:2016-01-04

    申请号:KR1020140077326

    申请日:2014-06-24

    CPC classification number: G10L15/183 G10L15/14

    Abstract: 언어모델군집화기반음성인식장치및 그방법이개시된다. 본발명의일 면에따른언어모델군집화기반음성인식방법은입력되는음성데이터에대하여제1 언어모델을이용하여음성인식을수행함으로써, 제1 엔베스트후보리스트를출력하는단계; 상기제1 엔베스트후보리스트중 어느하나의인식후보를이용하여각각의언어모델군집에대한믹스쳐웨이트값을결정하는단계; 상기믹스쳐웨이트값에기반하여각각의언어모델군집을인터폴레이션하는단계; 및각각의언어모델군집이인터폴레이션된결과를이용하여상기제1 엔베스트후보리스트를리스코어링하는단계를포함한다.

    Abstract translation: 公开了一种基于语言模型聚类识别声音的装置和方法。 根据本发明的一个方面的用于识别基于语言模型聚类的声音的方法包括以下步骤:通过使用用于输入声音数据的第一语言模型执行声音识别来输出第一N最佳候选列表; 通过使用来自所述第一N最佳候选列表的任何一个识别候选来确定每个语言模型簇的混合权重值; 基于混合权重值内插每个语言模型集群; 并且通过使用其中插入每个语言模型簇的结果来重新获取第一N个最佳候选列表。

    음향 반향 제거 방법 및 장치, 그리고 음향 반향 제거 장치의 적응 필터 계수 업데이트 방법
    40.
    发明公开
    음향 반향 제거 방법 및 장치, 그리고 음향 반향 제거 장치의 적응 필터 계수 업데이트 방법 审中-实审
    取消声学ECHO的方法和装置,以及由APPRATUS更新自适应滤波器系统的方法

    公开(公告)号:KR1020140051777A

    公开(公告)日:2014-05-02

    申请号:KR1020130118051

    申请日:2013-10-02

    CPC classification number: H04M9/082

    Abstract: According to an embodiment of the present invention, a device which removes an acoustic echo signal caused by a long distance speaker signal is provided. An acoustic echo removing device comprises; a dispersion estimating unit which estimates the dispersion of a first voice signal of a short distance signal and the dispersion of a first noise signal of the short distance signal; a step size determining unit which determines the step size using the dispersion of the first voice signal and the dispersion of the first noise signal; an adaptive filter coefficient updating unit which updates an adaptive filter coefficient of an adaptive filter using the step size; and an acoustic echo removing unit which estimates an acoustic echo signal using the adaptive filter coefficient and removes the acoustic echo signal in a microphone input signal using the estimated acoustic echo signal which is produced through the estimation of the acoustic echo signal. The step size determining unit determines the step size so that a first residual signal becomes equal with the short distance speaker signal. The first residual signal is a signal which subtracts a first estimation acoustic echo signal which is the estimated acoustic echo signal from the microphone input signal.

    Abstract translation: 根据本发明的实施例,提供一种去除由长距离扬声器信号引起的声学回波信号的装置。 声回波去除装置包括: 分散估计单元,其估计短距离信号的第一语音信号的分散和所述短距离信号的第一噪声信号的色散; 步长确定单元,其使用第一语音信号的色散和第一噪声信号的色散来确定步长; 自适应滤波器系数更新单元,其使用所述步长更新自适应滤波器的自适应滤波器系数; 声学回波消除单元,其使用自适应滤波器系数估计声学回波信号,并使用通过估计声学回波信号产生的估计的声学回波信号去除麦克风输入信号中的声学回波信号。 步长确定单元确定步长,使得第一残差信号与短距离扬声器信号相等。 第一残差信号是从麦克风输入信号中减去作为估计声回波信号的第一估计声回波信号的信号。

Patent Agency Ranking