-
公开(公告)号:KR1020080097178A
公开(公告)日:2008-11-04
申请号:KR1020087016358
申请日:2007-01-18
Applicant: 엘지전자 주식회사 , 연세대학교 산학협력단
IPC: H04N21/233
Abstract: An encoding/decoding apparatus and a method thereof are provided to encode signals having different characteristics at an optimum bit rate, thereby efficiently coding various signals such as an audio signal and a voice signal. Encoded signals from input bit streams are extracted. A decoding method is determined with regard to each encoded signal. The signals are decoded according to the determined decoding method. The decoded signals are synthesized.
Abstract translation: 提供了一种编码/解码装置及其方法,用于以最佳比特率对具有不同特性的信号进行编码,从而有效地对诸如音频信号和语音信号的各种信号进行编码。 提取来自输入比特流的编码信号。 关于每个编码信号确定解码方法。 根据确定的解码方法对信号进行解码。 解码信号被合成。
-
公开(公告)号:KR102251478B1
公开(公告)日:2021-05-12
申请号:KR1020190035618
申请日:2019-03-28
Applicant: 가톨릭대학교 산학협력단 , 연세대학교 산학협력단
Abstract: 본발명은인공지능기반천명판정방법및 시스템에관한것으로서, 그인공지능기반천명판정방법은디지털청진기를이용하여다수의사람으로부터호흡음을수집하는단계; 푸리에변환을통해상기수집된호흡음들의특징을추출하여프레임으로생성하여전처리하는단계; 및상기전처리된호흡음을입력으로하여심층신경망(DNN)을통해호흡음이정상호흡음인지천명이있는호흡음인지분류하는단계를포함한다. 그전처리는비정상호흡음신호에대해서는천명이있는구간들을추출하는단계; 그추출된구간들의시간영역의파형을샘플링하여윈도윙(windowing)를취해서 FFT(Fast Fourier Transform)를통해복수의샘플로이루어지는프레임을형성하는단계; 및학습시정상적인호흡음으로이루어진프레임과천명이있는호흡음으로이루어진프레임을라벨링을통해식별되게하는단계를포함한다. 본발명에의하면, 사람의호흡음을전처리한후 DNN에입력함으로써정확하고일관성있는천명의존재여부를판단할수 있고, 지속적인치료와돌봄이필요한환자에게유용하다.
-
公开(公告)号:KR102036442B1
公开(公告)日:2019-10-24
申请号:KR1020180033932
申请日:2018-03-23
Applicant: 연세대학교 산학협력단
IPC: H04W64/00 , H04B17/318 , G06N3/08
-
-
公开(公告)号:KR101789632B1
公开(公告)日:2017-10-25
申请号:KR1020127017163
申请日:2010-12-10
Applicant: 엘지전자 주식회사 , 연세대학교 산학협력단
IPC: G10L19/04
CPC classification number: G10L19/07 , G10L2019/0007 , G10L2019/001 , G10L2019/0013 , G10L2019/0016
Abstract: 본발명에따르면, 선형예측을이용하여입력신호으로부터현재프레임의선형예측필터계수를획득하고, 제 1 베스트정보에기초하여상기현재프레임의선형예측필터계수에대응하는현재프레임의양자화된스펙트럼후보벡터를획득하며, 상기현재프레임의양자화된스펙트럼후보벡터와이전프레임의양자화된스펙트럼벡터를보간하는것을특징으로한다. 이처럼기존의단계별최적화기법에비해양자화오차를최소화하는최적의파라미터를찾을수 있다.
Abstract translation: 根据本发明,使用线性预测从输入信号中获得当前帧的线性预测滤波器系数,以及与当前帧的线性预测滤波器系数相对应的当前帧的量化后的谱候选矢量, 并内插当前帧的量化频谱候选矢量和前一帧的量化频谱矢量。 通过这种方式,与现有的逐步优化技术相比,可以找到最小化量化误差的最佳参数。
-
公开(公告)号:KR101662946B1
公开(公告)日:2016-10-06
申请号:KR1020150041451
申请日:2015-03-25
Applicant: 연세대학교 산학협력단
IPC: H04M1/60 , G10L21/0208 , H04R3/00
Abstract: 본발명은신호대 잡음비가낮거나배경잡음의특성이변화되는상황에서의통화품질향상을위한음질개선장치및 그제어방법에관한것이다. 본발명의실시예에따르면, AC 마이크로폰및 BC 마이크로폰을이용하여음성신호를취득하는신호수집부, 배경잡음정보를계산하는잡음추정부, AC 마이크로폰에서취득된음성신호및 계산된배경잡음정보에기초하여제 1 SNR을추정하고, 추정된목적음성신호및 계산된배경잡음정보에기초하여제 2 SNR을추정하고, 계산된배경잡음정보및 BC 마이크로폰이취득한음성신호에기초하여주변환경 SNR을계산하되, 주변환경 SNR의변화에대응하여제 1 SNR 및제 2 SNR에개별적으로가해지는가중치를추정하는가중치추정부및 제 1 SNR, 제 2 SNR 및추정된가중치의조합으로부터음성신호의프레임및 주파수빈에따른이득을계산하고, 이득을음성신호에적용하여향상된음성신호를생성하는음질개선부를포함하는것을특징으로하는음질개선장치가제공될수 있다.
-
公开(公告)号:KR101410312B1
公开(公告)日:2014-06-27
申请号:KR1020127004761
申请日:2010-07-27
Applicant: 연세대학교 산학협력단
CPC classification number: G10L19/04 , G10L19/005 , G10L19/022 , G10L19/18 , G10L25/45
Abstract: 오디오 처리 장치에 의해, 직각 코딩 방식으로 인코딩된 제1 블록의 제1 데이터, 및 비-직각 코딩 방식으로 인코딩된 제2 블록의 제2 데이터를 포함하는 오디오 신호를 수신하는 단계; 상기 제2 블록에 해당하는 보상 신호를 수신하는 단계; 상기 제1 데이터를 이용하여 앨리어징 파트의 프리딕션을 추정하는 단계; 및, 상기 제2 데이터, 상기 보상 신호, 및 상기 앨리어징 파트의 프리딕션을 근거로 하여, 상기 제2 블록의 복원된 신호를 획득하는 단계를 포함하는 오디오 신호 처리 방법이 제공된다.
Abstract translation: 音频处理装置接收包括以直角编码方式编码的第一块的第一数据和以非直角编码方式编码的第二块的第二数据的音频信号; 接收对应于第二块的补偿信号; 使用第一数据估计混叠部分的预测; 并且基于第二数据,补偿信号和混叠部分的预测获得第二块的重构信号。
-
公开(公告)号:KR1020140074718A
公开(公告)日:2014-06-18
申请号:KR1020120142986
申请日:2012-12-10
Applicant: 연세대학교 산학협력단
CPC classification number: G10L17/14 , G06T7/00 , G10L2021/02166
Abstract: The present invention relates to a method and a device for processing an audio signal using speaker detection. More specifically, the method and the device are capable of: detecting location information of one or more speakers by using a depth camera; and extracting a sound source corresponding to each of the speakers based thereon. The method for processing an audio signal includes the steps of: receiving an audio signal; acquiring depth picture data photographed by a depth camera; extracting at least one user head location information from the depth picture data; converting the extracted user head location information to three-dimensional coordinate information; identifying location information of a speaker in at least user head location information by using the converted coordinate information and the received audio signal; acquiring a weighting corresponding to the identified location information of the speaker; and performing a beamforming in the received audio signal to separate the sound source of the speaker by using the weighting.
Abstract translation: 本发明涉及使用扬声器检测处理音频信号的方法和装置。 更具体地,该方法和装置能够:通过使用深度相机来检测一个或多个扬声器的位置信息; 并且基于此提取与每个扬声器对应的声源。 用于处理音频信号的方法包括以下步骤:接收音频信号; 获取由深度摄像机拍摄的深度图像数据; 从深度图像数据中提取至少一个用户头位置信息; 将所提取的用户头位置信息转换为三维坐标信息; 通过使用所转换的坐标信息和接收到的音频信号,在至少用户头位置信息中识别扬声器的位置信息; 获取对应于所述识别的所述扬声器的位置信息的加权; 并且在所接收的音频信号中执行波束形成,以通过使用加权来分离扬声器的声源。
-
公开(公告)号:KR101221919B1
公开(公告)日:2013-01-15
申请号:KR1020107019538
申请日:2009-03-03
Applicant: 엘지전자 주식회사 , 연세대학교 산학협력단
CPC classification number: G10L19/22 , G11B2020/00014
Abstract: 본 발명은 오디오 신호를 보다 높은 효율로 압축 및 복원할 수 있는 인코딩 신호 처리 방법 및 장치를 제공하는 것을 목적으로 한다.
이를 위한 본 발명의 오디오 신호 처리 방법은, 제1 타입정보를 이용하여 오디오 신호의 타입이 음악신호 인지 여부를 식별하는 단계; 상기 오디오 신호의 타입이 음악신호가 아닌 경우, 제 2 타입정보를 이용하여 상기 오디오 신호의 타입이 음성신호 인지, 혼합신호 인지 여부를 식별하는 단계; 및 상기 오디오 신호의 타입이 음악신호, 음성신호 및 혼합신호 중 어느 하나로 판별되면, 코딩 식별정보를 이용하여 프레임별 적용되는 코딩방식에 따라 오디오 신호를 복원하는 단계를 포함하되, 상기 오디오 신호의 타입이 음악신호인 경우 상기 제1 타입정보만이 수신되고, 상기 오디오 신호의 타입이 음성신호 또는 혼합신호인 경우 상기 제1 타입정보 및 제2 타입정보 모두가 수신되는 것을 특징으로 한다.
이를 통하여, 보다 높은 효율로 다양한 종류의 오디오 신호를 부호 및 복호할 수 있게 된다.-
公开(公告)号:KR1020120109539A
公开(公告)日:2012-10-08
申请号:KR1020127017163
申请日:2010-12-10
Applicant: 엘지전자 주식회사 , 연세대학교 산학협력단
IPC: G10L19/04
CPC classification number: G10L19/07 , G10L2019/0007 , G10L2019/001 , G10L2019/0013 , G10L2019/0016 , G10L19/06 , G10L19/032 , G10L19/04 , G10L19/08 , G10L19/09 , G10L19/107
Abstract: PURPOSE: A voice signal encoding method and an apparatus thereof are provided to increase voice quality of a synthesized voice signal and to seek an optimal parameter which minimizes quantization error. CONSTITUTION: A voice signal encoding apparatus obtains a linear prediction filter coefficient of a current frame from an input signal by using linear prediction(S400). The apparatus obtains a quantized spectrum candidate vector of the current frame corresponding to the linear prediction filter coefficient based on first best information(S410). The apparatus interpolates the quantized spectrum candidate vector of the current frame and the quantized spectrum candidate vector of the previous frame(S420). [Reference numerals] (AA) Start; (BB) End; (S400) Obtaining linear prediction filter coefficient through linear prediction about an input signal; (S410) Obtaining a quantized spectrum candidate vector corresponding to the linear prediction filter coefficient by using first best information; (S420) Interpolating the quantized spectrum candidate vector; (S430) Generating a weighted value input signal by using a weighted filter for which the quantized spectrum candidate vector is used; (S440) Obtaining an adaptive code book of the weighted filter input signal; (S450) Searching for a fixed code book of a target signal of the fixed code book; (S460) Generating the signal by using the adaptive code book and the fixed code book; (S470) Generating a synthesis signal by using the signal and the synthesis filter; (S480) Obtaining a coding parameter which minimizes an error between an input signal and the synthesis
Abstract translation: 目的:提供一种语音信号编码方法及其装置,以增加合成语音信号的语音质量,并寻找最小化量化误差的最优参数。 构成:语音信号编码装置通过使用线性预测从输入信号获得当前帧的线性预测滤波器系数(S400)。 该装置基于第一最佳信息获得对应于线性预测滤波器系数的当前帧的量化频谱候选向量(S410)。 该装置内插当前帧的量化频谱候选矢量和前一帧的量化频谱候选矢量(S420)。 (附图标记)(AA)开始; (BB)结束; (S400)通过关于输入信号的线性预测获得线性预测滤波器系数; (S410)通过使用第一最佳信息获得与线性预测滤波器系数对应的量化频谱候选矢量; (S420)插值量化频谱候选矢量; (S430)使用使用了量化频谱候补矢量的加权滤波器来生成加权值输入信号; (S440)获取加权滤波器输入信号的自适应码本; (S450)搜索固定码本的目标信号的固定码本; (S460)使用自适应码本和固定码本生成信号; (S470)使用信号和合成滤波器生成合成信号; (S480)获得最小化输入信号与合成之间的误差的编码参数
-
-
-
-
-
-
-
-
-