파일 내 트랙 그룹핑 방식 및 그 시스템
    61.
    发明公开
    파일 내 트랙 그룹핑 방식 및 그 시스템 无效
    在文件中分组轨迹的系统和方法

    公开(公告)号:KR1020100000846A

    公开(公告)日:2010-01-06

    申请号:KR1020080060494

    申请日:2008-06-25

    CPC classification number: G10L19/0019 G10L19/008 G11B27/102 G11B27/322

    Abstract: PURPOSE: A system and a method of grouping tracks inside a file are provided to group presentation metadata when multimedia tracks include overlapped presentation metadata, thereby storing the grouped metadata in a file. CONSTITUTION: A plurality of multimedia tracks is saved according to a file format like the ISO file format. The multimedia tracks are compressed in the same encoding method. If parts of presentation metadata information about an included audio track are the same, the metadata information is displayed using a group box not to overlappingly save the metadata information.

    Abstract translation: 目的:当多媒体轨道包括重叠的呈现元数据时,提供将文件内的轨道分组的系统和方法来组合表示元数据,由此将分组的元数据存储在文件中。 构成:根据ISO文件格式的文件格式保存多个多媒体轨道。 多媒体轨道以相同的编码方式进行压缩。 如果关于所包括的音轨的演示元数据信息的部分相同,则使用不重叠保存元数据信息的组框来显示元数据信息。

    음상 외재화를 위한 머리전달함수 생성 방법과, 그를이용한 3차원 오디오 신호 처리 장치 및 그 방법
    62.
    发明授权
    음상 외재화를 위한 머리전달함수 생성 방법과, 그를이용한 3차원 오디오 신호 처리 장치 및 그 방법 有权
    음상외재화를위한머리전달함수생성방법법,그를이용한3차원오디오신호처리장치및그방

    公开(公告)号:KR100932791B1

    公开(公告)日:2009-12-21

    申请号:KR1020080040073

    申请日:2008-04-29

    Abstract: 본 발명은 음상 외재화를 위한 머리전달함수 생성 방법과, 그를 이용한 3차원 오디오 신호 처리 장치 및 그 방법에 관한 것으로서, 구체(球體) 마이크로폰으로 측정된 멀티채널 룸 임펄스 응답을 통해 모델링된 머리 전달 함수(HRTF)를 이용하여 3차원 오디오 신호를 생성함으로써, 음상 내재화를 제거하여 3차원 오디오 신호의 현장감(현실감)을 증대시키고자 한다.
    이를 위하여, 본 발명은, 멀티채널 임펄스 응답을 이용한 3차원 오디오 신호 처리 장치에 있어서, 오디오 데이터를 디코딩하여 원래의 오디오 신호를 복원하기 위한 오디오 디코딩 수단; 및 구체(球體) 마이크로폰으로 측정된 멀티채널 룸 임펄스 응답을 통하여 모델링된 머리 전달 함수(HRTF)를 이용하여, 상기 복원된 오디오 신호에 대한 3차원 오디오 신호를 생성하기 위한 3차원 오디오 생성 수단을 포함한다.
    3차원 오디오, 입체 음향, 고현장감, 머리 전달 함수, HRTF, 멀티채널 임펄스 응답, 구체 마이크로폰, 음상 외재화

    Abstract translation: 提供了一种用于生成用于声音外部化的头部相关传递函数的方法,使用该方法处理3D音频信号的设备和方法,以通过执行3D音频信号处理来增强3D音频信号的存在,所述3D音频信号处理是通过通过 由球形麦克风从空间测量的室内脉冲响应。 高现场多媒体再现系统(30)包括解复用部分(31),视频解码器(32),音频解码器(33)和3D音频生成部分(34)。 解复用部分将多媒体数据分离为视频数据和音频数据。 视频解码器将分离的视频数据解码为原始视频信号。 音频解码器通过解码音频数据来解码原始音频信号。 3D音频生成部分通过由球形麦克风测量的多声道房间脉冲响应建模的头部相关传递函数生成关于解码的音频信号的3D音频信号。

    다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법
    63.
    发明授权
    다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법 有权
    用于编码和解码多个通道的多目标音频信号的装置和方法

    公开(公告)号:KR100917843B1

    公开(公告)日:2009-09-18

    申请号:KR1020070098663

    申请日:2007-10-01

    CPC classification number: G10L19/00 G10L19/008 G10L19/20

    Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
    다양한 채널의 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법에 관한 것임.
    2. 발명이 해결하고자 하는 기술적 과제
    다양한 채널로 구성된 다객체 오디오 신호 부호화 및 복호화 장치 및 방법을 제공함.
    3. 발명의 해결방법의 요지
    상기 서로 상이한 채널로 구성된 다객체 오디오 신호를 하나의 다운믹스된 오디오 신호로 다운믹싱하며, 상기 서로 상이한 채널로 구성된 다객체 오디오 신호 각각에 대한 헤더 정보 및 공간큐 정보를 포함하는 부가정보를 추출하는 다운믹싱수단; 상기 다운믹싱된 오디오 신호를 부호화하는 부호화수단; 및 상기 부가정보를 비트스트림으로 생성하는 부가정보 부호화수단을 포함하되, 상기 헤더 정보는 상기 서로 상이한 채널로 구성된 다객체 오디오 신호 각각에 대한 식별자 정보; 및 상기 서로 상이한 채널로 구성된 다객체 오디오 신호에 대한 채널 정보를 포함함.
    4. 발명의 중요한 용도
    오디오 부호화 및 복호화에 이용됨.
    오디오 객체, 다채널, 다객체

    HHT를 이용한 음성 및 오디오 신호의 부호화/복호화장치 및 방법
    64.
    发明授权
    HHT를 이용한 음성 및 오디오 신호의 부호화/복호화장치 및 방법 失效
    使用HILBERT-HUANG变换编码/解码具有强非固定属性的信号的方法和装置

    公开(公告)号:KR100911994B1

    公开(公告)日:2009-08-13

    申请号:KR1020070080901

    申请日:2007-08-10

    Abstract: 본 발명은 음성 및 오디오 신호의 코딩 및 디코딩에 관한 것으로서, 더욱 구체적으로는 HHT(Hilbert-Huang Transform)을 이용하여 음성 및 오디오신호와 같이 비정규적(non-stationary) 특성이 강한 입력신호를 동시에 부호화 및 복호화 할 수 있는 장치 및 방법에 관한 것이다.
    본 발명은 입력신호에 대하여 HHT를 적용하여 각기 다른 주파수 대역을 갖는 신호들로 분리하는 단계와, 상기 분리된 신호 각각을 독립적으로 부호화하는 단계 및 상기 독립적으로 부호화된 각각의 신호를 다중화하는 단계를 포함하는 부호화 방법을 제공한다.
    힐버트 변환, EMD, HHT, intrinsic mode function,

    가변 서브밴드 분석을 이용한 부호화와 복호화 방법 및 그 장치
    65.
    发明公开
    가변 서브밴드 분석을 이용한 부호화와 복호화 방법 및 그 장치 无效
    使用可变子带分析的编码和解码方法及其设备

    公开(公告)号:KR1020090037806A

    公开(公告)日:2009-04-16

    申请号:KR1020080095541

    申请日:2008-09-29

    CPC classification number: G10L19/008 G10L19/0204 G10L19/20 G10L25/18

    Abstract: An encoding and decoding method using variable subband analysis and an apparatus thereof are provided to increase the number of subbands while minimizing the increase of bit races, thereby outputting more superior sound. Audio objects(1~M) are inputted to an audio encoding unit and a frequency conversion unit. The audio encoding unit down-mixes the audio object. The frequency conversion unit(202) converts an audio object into a frequency domain. A subband configuration unit(203) subdivides a subband of a frequency-converted signal to variable subbands. A parameter generation unit(205) extracts parameters necessary for restoring the audio objects from the down mix signal. An encoding unit(206) encodes parameter information including a parameter generated from a parameter generating unit.

    Abstract translation: 提供了使用可变子带分析的编码和解码方法及其装置,以增加子带的数量,同时最小化比特率的增加,从而输出更优异的声音。 音频对象(1〜M)被输入到音频编码单元和频率转换单元。 音频编码单元将音频对象降混。 频率转换单元(202)将音频对象转换成频域。 子带配置单元(203)将频率转换信号的子带细分到可变子带。 参数生成单元(205)从下混合信号中提取恢复音频对象所需的参数。 编码单元(206)编码包括从参数生成单元生成的参数的参数信息。

    변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화장치 및 그 방법
    67.
    发明公开
    변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화장치 및 그 방법 失效
    音频编码和解码设备和使用线性预测编码的方法

    公开(公告)号:KR1020080023618A

    公开(公告)日:2008-03-14

    申请号:KR1020070026820

    申请日:2007-03-19

    Abstract: An apparatus for audio encoding and decoding using warped linear prediction coding, and a method thereof are provided to remove the redundancy of an original signal by using the warped linear prediction coding in an audio encoding process, provide an error signal to an audio encoder as an input signal, and transform a psychological sound model to be suitable for the error signal, thereby increasing the efficiency of audio signal compression and performing audio signal encoding. An error signal calculating unit(110) performs the warped linear prediction coding of an audio signal inputted from the outside in a temporal area to calculate an error signal. A frequency domain converting unit(120) converts the error signal obtained in the error signal calculating unit into a frequency domain signal. A masking threshold value calculating unit(131,132) calculates a masking threshold value used in the encoding of the error signal by using an original signal and encoding information used in the warped linear prediction coding of the original signal. A perceptual encoding unit(140) performs the perceptual encoding of the error signal converted in the frequency domain converting unit by using the calculated masking threshold value.

    Abstract translation: 提供了一种使用翘曲线性预测编码的音频编码和解码装置及其方法,用于通过在音频编码处理中使用翘曲的线性预测编码来消除原始信号的冗余度,向音频编码器提供误差信号作为 输入信号,并将心理声音模型变换为适合于误差信号,从而提高音频信号压缩和执行音频信号编码的效率。 误差信号计算单元(110)对从时间区域外部输入的音频信号执行翘曲的线性预测编码,以计算误差信号。 频域转换单元(120)将在误差信号计算单元中获得的误差信号转换成频域信号。 屏蔽阈值计算单元(131,132)通过使用原始信号和在原始信号的扭曲线性预测编码中使用的编码信息来计算在误差信号的编码中使用的掩蔽阈值。 感知编码单元(140)通过使用所计算的屏蔽阈值来执行在频域转换单元中转换的误差信号的感知编码。

Patent Agency Ranking