객체기반 오디오 서비스 제공 방법과, 이를 위한 다중객체오디오 콘텐츠 파일의 생성/편집/재생 방법 및 그 파일구조
    171.
    发明公开
    객체기반 오디오 서비스 제공 방법과, 이를 위한 다중객체오디오 콘텐츠 파일의 생성/편집/재생 방법 및 그 파일구조 无效
    用于提供基于对象的音频服务的方法,用于创建/编辑/复制多个对象音频内容文件的方法及其文件结构

    公开(公告)号:KR1020090052780A

    公开(公告)日:2009-05-26

    申请号:KR1020080013807

    申请日:2008-02-15

    CPC classification number: H04N21/2335 H04N21/235 H04N21/236

    Abstract: 본 발명은 객체기반 오디오 서비스 제공 방법과, 이를 위한 다중객체 오디오 콘텐츠 파일의 생성/편집/재생 방법 및 그 파일 구조에 관한 것으로서, 객체 기반 오디오 서비스에 부가 서비스로서 오디오 프리셋에 관련된 이미지/영상/문자 등과 같은 비주얼 데이터 형태의 부가 데이터를 추가로 제공함으로써, 사용자가 자신의 취향에 따라 다양한 오디오 콘텐츠를 저작/편집할 수 있도록 하고자 한다.
    이를 위하여, 본 발명은, 객체기반 오디오 서비스 제공 방법에 있어서, 오디오 콘텐츠를 구성하는 복수의 오디오 객체를 생성하는 단계; 상기 각각의 오디오 객체에 대하여 객체 속성을 정의한 오디오 프리셋을 생성하는 단계; 및 상기 오디오 객체, 상기 오디오 프리셋, 및 상기 오디오 프리셋에 관련된 부가 데이터를 다중화하여 전송하는 단계를 포함하는 것을 특징으로 한다.
    객체기반 오디오, 오디오 객체, 다중객체 오디오 콘텐츠 파일, 부가 데이터, 부기데이터 색인정보

    다객체 오디오 부호화 및 복호화 방법과 그 장치
    172.
    发明公开
    다객체 오디오 부호화 및 복호화 방법과 그 장치 有权
    多对象音频编码和解码方法及其设备

    公开(公告)号:KR1020090040857A

    公开(公告)日:2009-04-27

    申请号:KR1020080103034

    申请日:2008-10-21

    CPC classification number: G10L19/008

    Abstract: A method for encoding/decoding a multi-object and an apparatus therefor are provided to offer various audio services to a user, efficiently. The first down-mix generating unit(102) down-mixes a background object(BGO) and the first foreground object(FGO1) to generate the first down-mix signal and the first residual signal. The second down-mix generating unit(103) down-mixes the first down-mix signal and the second foreground object(FGO2) to generate the second down-mix signal and the second residual signal. A bit stream generating unit produces a bit stream including the down-mix signal and residual signal.

    Abstract translation: 提供了一种用于对多个对象进行编码/解码的方法及其装置,以有效地向用户提供各种音频服务。 第一下混合生成单元(102)将背景物体(BGO)和第一前景物体(FGO1)进行降混,以产生第一缩减混音信号和第一残差信号。 第二下混合生成单元(103)将第一缩混信号和第二前景对象(FGO2)进行下混合,以生成第二缩减混音信号和第二残差信号。 比特流生成单元产生包括缩减混音信号和残留信号的比特流。

    다채널로 구성된 다객체 오디오 신호의 인코딩 및 디코딩장치 및 방법
    173.
    发明公开
    다채널로 구성된 다객체 오디오 신호의 인코딩 및 디코딩장치 및 방법 有权
    多通道编码和解码多目标音频信号的装置和方法

    公开(公告)号:KR1020080089308A

    公开(公告)日:2008-10-06

    申请号:KR1020080029695

    申请日:2008-03-31

    CPC classification number: G10L19/008

    Abstract: An apparatus and a method for encoding and decoding multi-object audio signal including multiple channels are provided to actively consume audio contents according to the need of a user. An SAOC(Spatial Audio Object Coding) encoder(101) downmixes an audio object outputted from an SAC encoder(103) to output a representative downmix signal, and outputs an SAOC bit stream including space queue information and supplementary information about the inputted audio object. The SAC encoder downmixes a multi-channel audio signal into a mono channel or a stereo channel to generate a single audio object. The SAC encoder outputs an SAC bit stream including space queue information and supplementary information about the inputted multi-channel audio signal. A preset-ASI(Audio Scene Information) unit(113) forms a control signal inputted from the exterior, namely, object control information, into preset-ASI and generates a preset-ASI bit stream including the preset-ASI information. A bit stream formatter(105) generates a representative bit stream by combining the SAOC bit stream outputted from the SAOC encoder, the SAC bit stream outputted from the SAC encoder, and a preset-ASI bit stream outputted from the preset-ASI unit.

    Abstract translation: 提供了一种用于编码和解码包括多个通道的多对象音频信号的装置和方法,以根据用户的需要主动消费音频内容。 SAOC(空间音频对象编码)编码器(101)将从SAC编码器(103)输出的音频对象下混合以输出代表性的下混合信号,并输出包括空格队列信息和关于所输入的音频对象的补充信息的SAOC比特流。 SAC编码器将多声道音频信号下混合到单声道或立体声通道中以生成单个音频对象。 SAC编码器输出包括空间队列信息和关于输入的多声道音频信号的补充信息的SAC比特流。 预设ASI(音频场景信息)单元(113)形成从外部输入的控制信号,即对象控制信息,成为预设的ASI,并生成包含预设的ASI信息的预设的ASI比特流。 比特流格式化器(105)通过组合从SAOC编码器输出的SAOC比特流,从SAC编码器输出的SAC比特流和从预设ASI单元输出的预设ASI比特流,生成代表比特流。

    다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법
    174.
    发明公开
    다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법 有权
    用于编码和解码多个通道的多目标音频信号的装置和方法

    公开(公告)号:KR1020080029940A

    公开(公告)日:2008-04-03

    申请号:KR1020070098663

    申请日:2007-10-01

    CPC classification number: G10L19/00 G10L19/008 G10L19/20

    Abstract: An apparatus and a method for encoding and decoding multi-object audio signals with various channels are provided to allow a user to use audio contents actively as necessary. The first and second downmixers(101,103) downmix multi-object audio signals each with different channels into a single downmixed signal, and extract supplementary information including header information and space queue information with respect to the multi-object audio signals each having different channels. An audio encoder(105) encodes the downmixed audio signals. A supplementary information encoder(107) generates the supplementary information as a bit stream. The header information includes identifier information of the multi-object audio signals each with different channels and channel information of the multi-object audio signals each with different channels and channel information.

    Abstract translation: 提供用于对具有各种通道的多对象音频信号进行编码和解码的装置和方法,以允许用户根据需要主动地使用音频内容。 第一和第二下混合器(101,103)将具有不同通道的多对象音频信号混合成单个下混合信号,并且提取关于每个具有不同频道的多对象音频信号的标题信息和空间队列信息的补充信息。 音频编码器(105)对下混合音频信号进行编码。 辅助信息编码器(107)生成补充信息作为比特流。 标题信息包括每个具有不同信道的多对象音频信号的标识符信息和多对象音频信号的信道信息,每个具有不同的信道和信道信息。

    공간지각 단서에 의한 서라운드 음장 시각화 장치 및 그방법
    175.
    发明授权
    공간지각 단서에 의한 서라운드 음장 시각화 장치 및 그방법 有权
    使用空间声音本地化的环境声场可视化

    公开(公告)号:KR100790362B1

    公开(公告)日:2008-01-03

    申请号:KR1020060124837

    申请日:2006-12-08

    CPC classification number: H04S7/40 G01H17/00

    Abstract: An apparatus and a method of surround sound field visualization using a spatial sound localization cue are provided to monitor the arrangement and power balance of a sound source when making multi-channel audio contents by intuitively displaying the present state of the sound source. A sub-band analysis unit(101) represents an inputted multi-channel audio signal as a frequency domain, and divides the frequency domain into sub-bands. A channel power calculating unit(102) calculates the power of a signal for each sub-band. A maximum channel detecting unit(103) compares the power of sub-bands of each channel, and determines at least two channels with the maximum power for each sub-band. An inter-channel cross correlation calculating unit(104) calculates the cross correlation for each adjacent channel and right/left channels. A sound source direction and power calculating unit(105) calculates the direction and power of a sound source by using the information of at least two channels determined by the maximum channel detecting unit and the cross correlation value calculated by the inter-channel cross correlation calculating unit. A surround sound field visualization unit(106) displays the power and direction of the sound source in a display device.

    Abstract translation: 提供了使用空间声音定位提示的环绕声场可视化的装置和方法,以通过直观地显示声源的当前状态来制作多声道音频内容时监视声源的布置和功率平衡。 子带分析单元(101)表示作为频域的输入的多声道音频信号,并将频域划分为子带。 信道功率计算单元(102)计算每个子带的信号功率。 最大信道检测单元(103)比较每个信道的子带的功率,并确定每个子带的最大功率的至少两个信道。 信道间互相关计算单元(104)计算每个相邻信道和右/左信道的互相关。 声源方向和功率计算单元(105)通过使用由最大信道检测单元确定的至少两个信道的信息和通过信道间相互相关计算计算的互相关值来计算声源的方向和功率 单元。 环绕声场可视化单元(106)在显示装置中显示声源的功率和方向。

    혼합된 오디오 스트림으로부터 오디오 객체를 분리하기위한 단말 장치 및 그 방법
    176.
    发明授权
    혼합된 오디오 스트림으로부터 오디오 객체를 분리하기위한 단말 장치 및 그 방법 失效
    从组合音频流中分离音频对象的装置和方法

    公开(公告)号:KR100745689B1

    公开(公告)日:2007-08-03

    申请号:KR1020050061861

    申请日:2005-07-08

    Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
    본 발명은 혼합된 오디오 스트림으로부터 오디오 객체를 분리하기 위한 단말 장치 및 그 방법에 관한 것임.
    2. 발명이 해결하려고 하는 기술적 과제
    본 발명은 하나의 기본 스트림으로 압축된 다수의 오디오 객체들을 BIFS를 이용하여 분리 처리할 수 있는 노드 구조를 제안하고, 그 제안한 노드를 이용하여 혼합된 오디오 스트림으로부터 오디오 객체를 분리하기 위한 단말 장치 및 그 방법을 제공하는데 목적이 있음.
    3. 발명의 해결방법의 요지
    본 발명은, 다수의 오디오 객체가 압축된 기본 스트림(ES)을 디코딩하기 위한 디코딩부; 및 오디오 객체 분리 노드를 이용하여 상기 디코딩된 오디오 스트림에서 오디오 객체들을 분리하고, 분리된 오디오 객체들을 이용하여 오디오 장면을 구성하기 위한 컴포지터를 포함하는 단말 장치로서, 상기 오디오 객체 분리 노드는, 분리하고자 하는 오디오 객체의 수를 기술하는 필드; 및 객체 분리를 수행할지 여부를 기술하는 필드를 포함함.
    4. 발명의 중요한 용도
    본 발명은 MPEG-4 시스템 등에 이용됨.
    MPEG-4, BIFS, 객체, 기본 스트림(ES), 오디오 장면, 분리

    Abstract translation: 本发明涉及一种终端用于从组合音频流中分离音频对象的方法的研究提出了一种节点结构,其可以使用二进制格式场景将被压缩成一个基本流b的音频对象分离,并提供一个分离 通过使用建议的节点结构来自组合音频流的音频对象,以及其方法。 终端包括:解码器,用于解码在其上压缩的音频对象的基本流,从而产生解码的音频流; 以及用于通过使用音频对象分离节点来分离音频对象与解码的audi流的组合,通过使用分离的音频对象形成音频场景,其中音频对象分离节点包括:用于将音频对象的数量描述为 被分开 以及用于描述是否执行对象分离的字段。

    객체기반 오디오 전송/수신 시스템 및 그 방법
    177.
    发明授权
    객체기반 오디오 전송/수신 시스템 및 그 방법 有权
    基于对象的音频发送/接收系统和方法

    公开(公告)号:KR100733965B1

    公开(公告)日:2007-06-29

    申请号:KR1020050123816

    申请日:2005-12-15

    CPC classification number: H04S7/30 G06F3/16 H04S2400/11

    Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
    본 발명은 객체기반의 오디오를 서비스하기 위한 객체기반 오디오 전송/수신 시스템 및 그 방법에 관한 것임.
    2. 발명이 해결하려고 하는 기술적 과제
    본 발명은 사용자에게 편집자가 의도하는 객체기반의 오디오 장면을 제공하고, 사용자가 자신의 취향에 따라 오디오 장면을 변경할 수 있도록 하기 위한, 객체기반 오디오 전송/수신 시스템 및 그 방법을 제공하는데 그 목적이 있음.
    3. 발명의 해결방법의 요지
    본 발명은, 객체기반 오디오 전송 시스템에 있어서, 외부의 다양한 소스로부터 오디오신호를 입력받아 전처리 과정을 통해 객체 오디오신호를 생성하기 위한 전처리 수단; 상기 전처리 수단으로부터의 객체 오디오신호를 편집하여 오디오 장면을 구성하기 위한 객체기반 오디오 편집 수단; 상기 객체기반 오디오 편집 수단으로부터의 객체 오디오신호와 오디오 장면에 관한 정보를 부호화하고 다중화하여 객체기반 오디오 콘텐츠를 생성하기 위한 객체기반 오디오 부호화 수단; 및 상기 객체기반 오디오 부호화 수단으로부터의 객체기반 오디오 콘텐츠를 전송하기 위한 전송 수단을 포함함.
    4. 발명의 중요한 용도
    본 발명은 객체기반의 오디오 서비스 등에 이용됨.
    객체기반 오디오, 오디오 장면구성, 오디오 장면합성, 사용자 제어

    다운믹스 오디오 신호로부터 분리되는 각 출력 채널의스펙트럼 보상 방법 및 장치
    178.
    发明授权
    다운믹스 오디오 신호로부터 분리되는 각 출력 채널의스펙트럼 보상 방법 및 장치 失效
    用于补偿与降混音频信号分离的每个输出通道的频谱的方法和装置

    公开(公告)号:KR100731546B1

    公开(公告)日:2007-06-22

    申请号:KR1020040116789

    申请日:2004-12-30

    Abstract: 본 발명은 적어도 2개 이상의 신호가 다운믹스된 모노 신호로부터 분리되는 각각의 출력 채널의 빈 스펙트럼 밴드를 보상하기 위한 방법을 제공한다. 상기 방법은, 상기 각각의 출력 채널에 대하여, 이전 시간 영역에서의 상기 빈 스펙트럼 밴드의 상기 모노 신호에 대한 상기 출력 채널의 에너지비를 이용하여 상기 빈 스펙트럼 밴드의 현재 시간 영역에서의 에너지비를 추정하는 단계와, 상기 빈 스펙트럼 밴드의 앞 밴드의 상기 모노 신호에 대한 상기 출력 채널의 에너지비와 뒤 밴드의 상기 모노 신호에 대한 상기 출력 채널의 에너지비의 평균값을 이용하여 상기 빈 스펙트럼 밴드의 주파수 영역에서의 에너지비를 추정하는 단계와, 상기 추정된 현재 시간영역에서의 에너지비와 상기 주파수 영역에서의 에너지비를 이용하여 상기 빈 스펙트럼의 복원비를 결정하는 단계와, 상기 복원비를 상기 모노 신호값에 곱함으로써 상기 출력 채널의 빈 스펙트럼을 복원하는 단계를 포함한다.
    바이노럴 큐 코딩(Binaural Cue Coding), 스펙트럼 복원

    객체기반 오디오 전송/수신 시스템 및 그 방법
    179.
    发明公开
    객체기반 오디오 전송/수신 시스템 및 그 방법 有权
    基于对象的音频发送/接收系统和方法

    公开(公告)号:KR1020070047192A

    公开(公告)日:2007-05-04

    申请号:KR1020050123816

    申请日:2005-12-15

    CPC classification number: H04S7/30 G06F3/16 H04S2400/11

    Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
    본 발명은 객체기반의 오디오를 서비스하기 위한 객체기반 오디오 전송/수신 시스템 및 그 방법에 관한 것임.
    2. 발명이 해결하려고 하는 기술적 과제
    본 발명은 사용자에게 편집자가 의도하는 객체기반의 오디오 장면을 제공하고, 사용자가 자신의 취향에 따라 오디오 장면을 변경할 수 있도록 하기 위한, 객체기반 오디오 전송/수신 시스템 및 그 방법을 제공하는데 그 목적이 있음.
    3. 발명의 해결방법의 요지
    본 발명은, 객체기반 오디오 전송 시스템에 있어서, 외부의 다양한 소스로부터 오디오신호를 입력받아 전처리 과정을 통해 객체 오디오신호를 생성하기 위한 전처리 수단; 상기 전처리 수단으로부터의 객체 오디오신호를 편집하여 오디오 장면을 구성하기 위한 객체기반 오디오 편집 수단; 상기 객체기반 오디오 편집 수단으로부터의 객체 오디오신호와 오디오 장면에 관한 정보를 부호화하고 다중화하여 객체기반 오디오 콘텐츠를 생성하기 위한 객체기반 오디오 부호화 수단; 및 상기 객체기반 오디오 부호화 수단으로부터의 객체기반 오디오 콘텐츠를 전송하기 위한 전송 수단을 포함함.
    4. 발명의 중요한 용도
    본 발명은 객체기반의 오디오 서비스 등에 이용됨.
    객체기반 오디오, 오디오 장면구성, 오디오 장면합성, 사용자 제어

Patent Agency Ranking