오디오 신호 처리 방법 및 장치
    31.
    发明公开
    오디오 신호 처리 방법 및 장치 有权
    一种处理音频信号的方法和装置

    公开(公告)号:KR1020120061844A

    公开(公告)日:2012-06-13

    申请号:KR1020127004761

    申请日:2010-07-27

    CPC classification number: G10L19/04 G10L19/005 G10L19/022 G10L19/18 G10L25/45

    Abstract: PURPOSE: An audio signal processing method and an apparatus thereof are provided to apply a coding method about one frame and to prevent mismatch of an audio signal due to asymmetry of a window type. CONSTITUTION: A de-multiplexing unit(210) receives an audio signal. The audio signal includes first data of a first block and second data of a second block. The de-multiplexer receives a correcting signal corresponding to the second block. A rectangular decoding unit(220R) estimates the prediction of an aliasing part by using the first data.

    Abstract translation: 目的:提供一种音频信号处理方法及其装置,以应用关于一帧的编码方法,并且防止由于窗口类型的不对称引起的音频信号的失配。 构成:解复用单元(210)接收音频信号。 音频信号包括第一块的第一数据和第二块的第二数据。 解复用器接收对应于第二块的校正信号。 矩形解码单元(220R)通过使用第一数据来估计混叠部分的预测。

    오디오 타겟 신호의 검출장치 및 그 방법
    32.
    发明公开
    오디오 타겟 신호의 검출장치 및 그 방법 有权
    用于检测音频目标信号的装置及其方法

    公开(公告)号:KR1020120014755A

    公开(公告)日:2012-02-20

    申请号:KR1020100076920

    申请日:2010-08-10

    Inventor: 강홍구 이봉진

    Abstract: PURPOSE: An apparatus for detecting audio target signal and a method for the same are provided to apply weighted value to a reference model by measuring normal distribution matching degree. CONSTITUTION: A specific parameter extracting unit(10) extracts feature parameters from an audio stream. A regularity measuring unit(20) measures a normal distribution matching degree which is extracted from the feature parameter extracting unit. A target signal detection unit(30) detects the target signal by applying the specific feature parameters and the measured result of regularity measuring unit to a predetermined reference model. The target signal detection unit applies the measured result to the reference model as a weighted value.

    Abstract translation: 目的:提供一种用于检测音频目标信号的装置及其方法,用于通过测量正态分布匹配度将加权值应用于参考模型。 构成:特定参数提取单元(10)从音频流中提取特征参数。 规则性测量单元(20)测量从特征参数提取单元提取的正态分布匹配度。 目标信号检测单元(30)通过将特定特征参数和规则性测量单元的测量结果应用于预定参考模型来检测目标信号。 目标信号检测单元将测量结果作为加权值应用于参考模型。

    오디오 신호 처리 방법 및 장치
    33.
    发明公开
    오디오 신호 처리 방법 및 장치 有权
    处理音频信号的方法和装置

    公开(公告)号:KR1020100134576A

    公开(公告)日:2010-12-23

    申请号:KR1020107019538

    申请日:2009-03-03

    CPC classification number: G10L19/22 G11B2020/00014

    Abstract: PURPOSE: An audio signal process method and a device are provided to classify various audio signals and provide an appropriate audio coding method according to the property of each audio signal thereby more efficiently compressing the audio signals. CONSTITUTION: A demultiplexer(210) extracts the first type information and the second type information from a bit stream. A decoder determiner(220) distinguishes whether the code type of the audio signal is a music signal code type using the first type information. If the code type of the audio signal is not the music signal code type, the decoder determiner distinguishes whether the code type of the audio signal is voice signal code type or complex signal code type using the second type information. The decoder determiner decides the decoding method through the identification result.

    Abstract translation: 目的:提供一种音频信号处理方法和装置,用于对各种音频信号进行分类,并根据每个音频信号的属性提供适当的音频编码方法,从而更有效地压缩音频信号。 构成:解复用器(210)从比特流中提取第一类型信息和第二类型信息。 解码器确定器(220)使用第一类型信息区分音频信号的代码类型是音乐信号代码类型。 如果音频信号的代码类型不是音乐信号代码类型,则解码器确定器使用第二类型信息区分音频信号的代码类型是语音信号代码类型还是复合信号代码类型。 解码器确定器通过识别结果来决定解码方法。

    신호 처리 방법 및 장치
    34.
    发明公开
    신호 처리 방법 및 장치 有权
    一种处理信号的方法和装置

    公开(公告)号:KR1020100095509A

    公开(公告)日:2010-08-31

    申请号:KR1020107006342

    申请日:2008-10-15

    CPC classification number: G10L19/20

    Abstract: PURPOSE: A method and an apparatus for processing a signal are provided to optimally process signals, which have different characteristics, according to the characteristics. CONSTITUTION: A harmonic signal is separated form an input signal(S110), and the power ratio of the harmonic signal for the input signal is calculated(S120). Based on the power ratio, the mode information which is the information on the coding method is determined(S130). The harmonic signal is encoded in a first coding mode(S140), and a residual signal is created(S150). The residual signal is encoded in a second coding method(S160).

    Abstract translation: 目的:提供一种处理信号的方法和装置,以根据特性最佳地处理具有不同特性的信号。 构成:谐波信号由输入信号分离(S110),计算输入信号的谐波信号功率比(S120)。 基于功率比,确定作为编码方法的信息的模式信息(S130)。 谐波信号以第一编码模式编码(S140),产生残留信号(S150)。 以第二编码方法编码残差信号(S160)。

    티티에스 시스템의 음성압축 및 합성방법
    35.
    发明公开
    티티에스 시스템의 음성압축 및 합성방법 有权
    TTS系统中的语音压缩和合成方法

    公开(公告)号:KR1020060029330A

    公开(公告)日:2006-04-06

    申请号:KR1020040078231

    申请日:2004-10-01

    Inventor: 강홍구 이창헌

    Abstract: 본 발명은 TTS(Text-To-Speech) 시스템에서 음성 합성에 사용되는 대용량 데이터베이스를 압축 및 합성하기 위한 것이다. 보다 상세히는 TTS 시스템의 음성압축 및 합성 방법에 있어, 화자 종속적 코드북을 이용하는 것인데, 상기 화자 종속적 코드북은 시간 축에서 잔차 신호 파형의 유사도를 비교함으로써 다양한 형태의 신호로 코드북을 훈련시켜 코드북을 생성하는 것을 특징으로 한다. 또한 본 발명의 TTS 시스템을 지원하기 위해 코덱은 과거 정보가 없는 음소의 시작 부분에서는 화자 종속적 잔차신호 코드북을 사용하고, 그 이후의 음성 신호에 대해선 예측 방식을 사용함으로써 상용 코덱 수준의 압축률을 가지면서도 음소 단위의 가변적이고 부분적인 음성 합성에 있어 우수한 음질을 제공하는 효과가 있다.
    TTS, 음성합성, 화자종속, 코드북, 예측방식

    화자 검출을 이용한 오디오 신호 처리 방법 및 장치
    36.
    发明授权
    화자 검출을 이용한 오디오 신호 처리 방법 및 장치 有权
    一种使用分组器检测处理音频信号的方法及其装置

    公开(公告)号:KR101542647B1

    公开(公告)日:2015-08-12

    申请号:KR1020120142986

    申请日:2012-12-10

    Abstract: 본발명은화자검출을이용한오디오신호처리방법및 장치에관한발명으로써, 더욱상세하게는뎁스카메라을이용하여하나이상의화자의위치정보를검출하고, 이를이용하여각 화자에대응하는음원을추출하기위한발명이다. 이를위해본 발명은, 오디오신호를수신하는단계, 뎁스카메라를통해촬영된뎁스픽쳐데이터를획득하는단계, 상기뎁스픽쳐데이터에서적어도하나의사용자머리위치정보를추출하는단계, 상기추출된사용자머리위치정보를 3차원상의좌표정보로변환하는단계, 상기변환된좌표정보및 상기수신된오디오신호를이용하여, 상기적어도하나의사용자머리위치정보중 화자의위치정보를식별하는단계, 상기식별된화자의위치정보에대응하는가중치를획득하는단계, 및상기가중치를이용하여, 상기수신된오디오신호에빔포밍을수행하여상기화자의음원을분리하는단계를포함하는것을특징으로하는오디오신호처리방법및 이를이용한오디오신호처리장치를개시한다.

    오디오 신호 처리 방법 및 장치
    37.
    发明公开
    오디오 신호 처리 방법 및 장치 有权
    一种用于处理音频信号的装置及其方法

    公开(公告)号:KR1020120098755A

    公开(公告)日:2012-09-05

    申请号:KR1020127013809

    申请日:2010-11-12

    CPC classification number: G10L21/038 G10L19/0204 G10L19/038 G10L19/04

    Abstract: PURPOSE: An audio signal processing method and an apparatus thereof are provided to minimize distortion of sound and to generate an accurate signal to an original copy. CONSTITUTION: It is determined whether a spectral hole exists in a band of a frame(S210). Substitution type information is extracted from a bit stream(S220). A lag extracting unit extracts lag information, prediction mode information, and perceptual gain from the bit stream(S240). A spectral coefficient of a current band is obtained(S245).

    Abstract translation: 目的:提供一种音频信号处理方法及其装置,以最小化声音的失真并产生对原始副本的准确信号。 构成:确定在帧的频带中是否存在频谱孔(S210)。 从比特流中提取替换类型信息(S220)。 滞后提取单元从比特流中提取滞后信息,预测模式信息和感知增益(S240)。 获得当前频带的频谱系数(S245)。

    오디오 타겟 신호의 검출장치 및 그 방법
    38.
    发明授权
    오디오 타겟 신호의 검출장치 및 그 방법 有权
    用于检测音频目标信号的装置及其方法

    公开(公告)号:KR101144162B1

    公开(公告)日:2012-05-10

    申请号:KR1020100076920

    申请日:2010-08-10

    Inventor: 강홍구 이봉진

    Abstract: 오디오 타겟 신호의 검출장치 및 방법이 개시된다. 보다 상세하게는 본 발명은, 오디오 스트림을 미리 결정된 시간 단위의 적어도 하나 이상의 세그먼트들로 분할하는 세그먼트 분할부와, 분할된 세그먼트별로 특성 파라미터들을 추출하는 특성 파라미터 추출부와, 특성 파라미터 추출부에서 추출된 세그먼트별 특성 파라미터들의 정규분포 매칭도를 측정하는 정규성 측정부 및 정규성 측정부에서 측정된 결과값과 특성 파라미터들을 미리 결정된 기준 모델에 적용하여 타겟 신호를 검출하는 타겟 신호 검출부를 포함하는 타겟 신호의 검출장치 및 이를 이용한 타겟 신호의 검출방법에 관한 것이다.

    음성 분석구간 중첩길이의 가변적 선택을 이용한 특징 벡터추출 방법 및 이를 이용한 화자 인식 시스템
    39.
    发明授权
    음성 분석구간 중첩길이의 가변적 선택을 이용한 특징 벡터추출 방법 및 이를 이용한 화자 인식 시스템 失效
    特征向量提取方法利用变量选择重叠长度的语音分析部分和说话人识别系统

    公开(公告)号:KR100933946B1

    公开(公告)日:2009-12-28

    申请号:KR1020070108929

    申请日:2007-10-29

    Abstract: 본 발명은 입력 음성 신호의 길이에 대하여 현재 기준 분석 구간과 M개의 후보 분석 구간들을 설정하여 각 구간의 특징벡터를 추출하고, 현재 기준 분석 구간의 특징벡터와 각각의 후보 분석 구간의 특징벡터 간의 스펙트럼 차이가 최소인 후보 분석 구간을 선택한 후, 선택된 후보 분석 구간의 특징벡터를 추출함과 동시에 선택된 후보 분석 구간과 현재 기준 분석 구간 사이의 길이를 중첩길이로 설정하여 새로운 기준 분석 구간과 새로운 M개의 후보 분석 구간을 재설정하는 과정을 반복하면서 음성 분석 구간의 중첩길이를 가변적으로 선택하여 입력 음성 신호에 대한 특징벡터를 추출하는 음성 분석구간 중첩길이의 가변적 선택을 이용한 특징 벡터 추출 방법 및 이를 이용한 화자 인식 시스템에 관한 것이다.
    본 발명에 따라 음성 분석 구간의 중첩길이를 가변적으로 선택하면 입력 음성 신호에 대한 화자의 다양한 특성을 충분히 뽑아내기 용이하고, 입력 음성에 들어있는 화자의 특성을 모두 모델링하는 것이 용이하므로, 기존의 음성 분석 구간의 중첩길이를 특정한 값으로 고정하는 특징벡터 추출 방법을 이용하는 화자 인식 시스템에 비해 상대적으로 더 월등하게 화자 인식의 성능을 향상시킬 수 있다.
    화자 인식, 음성 분석, 중첩, 특징벡터, 화자 모델

    Abstract translation: 本发明之间的频谱被输入到设置候选分析区间的电流基准分析间隔和M数比音频信号的长度来提取特征向量的每个部分和当前参考分析周期矢量的特性和用于分析间隔的特征矢量的各候选 选择的最小候选分析周期之间的差之后,所选择的候选分析间隔特征提取的载体,并在同一时间选择的候选分析部,并通过设置在重叠长度新的参考分析间隔的电流基准分析间隔和候选的新的M个之间的距离 特征向量提取方法和一个说话人识别系统使用相同的,重复使用由音频分析部分的重叠长度选择的变量的语音分析段重叠长度的可变选择复位分析间隔的步骤中提取输入语音信号的特征向量 Lt。

    오디오 신호 처리 방법 및 장치
    40.
    发明公开
    오디오 신호 처리 방법 및 장치 无效
    一种处理音频信号的方法和装置

    公开(公告)号:KR1020090122142A

    公开(公告)日:2009-11-26

    申请号:KR1020090044622

    申请日:2009-05-21

    CPC classification number: G10L19/032

    Abstract: PURPOSE: An audio signal processing method and an apparatus thereof are provided to minimize cognitive distortion under the low bit rate environment by adjusting masking threshold level based on relation between the sensitivity of the extent of the energy and the quantization noise. CONSTITUTION: The frequency spectrum is generated by frequency-modulating the audio signal(S110). Each bandwidth weighted value for each bandwidth energy is determined by using the frequency spectrum(S120). The masking threshold level according to the psycho acoustic model is received(S140). The transformed masking threshold level is generated by applying the weighted value to the masking threshold level(S160). The signal is quantized by using the transformed masking threshold level.

    Abstract translation: 目的:提供一种音频信号处理方法及其装置,用于通过基于能量范围的灵敏度和量化噪声之间的关系调整掩蔽阈值水平来最小化低比特率环境下的认知失真。 构成:通过频率调制音频信号产生频谱(S110)。 通过使用频谱来确定每个带宽能量的每个带宽加权值(S120)。 接收根据心理声学模型的掩蔽阈值水平(S140)。 通过将加权值应用于掩蔽阈值电平来生成变换的掩蔽阈值电平(S160)。 通过使用变换的掩蔽阈值电平来量化信号。

Patent Agency Ranking