기존 오디오 포맷의 오디오 장면 정보를 유지하는 WFS재생 방법 및 그 장치
    171.
    发明授权
    기존 오디오 포맷의 오디오 장면 정보를 유지하는 WFS재생 방법 및 그 장치 有权
    在传统音频格式中重新构建原始声场的WFS重现方法和装置

    公开(公告)号:KR100942143B1

    公开(公告)日:2010-02-16

    申请号:KR1020070131258

    申请日:2007-12-14

    Abstract: 본 발명에 따른 기존 오디오 포맷의 오디오 장면 정보를 유지하는 WFS 재생 방법 및 그 장치는, WFS 재생을 위해 별도로 마련된 오디오 객체들이 존재하지 않는, 현존하는 오디오 포맷을 입력 신호로 받아 각 음원 객체와 그 객체의 공간 상 음상 정위 정보를 제공해줌으로써 WFS 렌더링을 가능하게 하는 방법에 관한 것이다.
    즉, 처음부터 WFS 재생을 위해 음원 객체를 독립적으로 보유하고 있는 상황이라면 문제가 없지만, WFS 재생 시스템의 하위 호환성을 고려한다면 스테레오나 5.1채널 오디오 포맷을 입력 받아도 WFS로 재생해줄 수 있어야 하므로 스테레오나 5.1채널 오디오 신호에 음원 분리 기법을 적용하여 채널별 신호에 포함되어 있는 각각의 음원 객체를 추출해낸 후, 이를 채널 별로 짝을 지어 파워 패닝 기법을 활용하여 WFS 렌더링(Rendering) 시 발생하는 원래 음장의 왜곡 현상을 해결하고자 하는 것이다.
    WFS(Wave Field Synthesis), 음장 합성, BSS(Blind Source Extraction)

    음성/오디오 통합 신호의 부호화/복호화 장치
    173.
    发明公开
    음성/오디오 통합 신호의 부호화/복호화 장치 无效
    编码和解码集成语音和音乐的设备

    公开(公告)号:KR1020100007738A

    公开(公告)日:2010-01-22

    申请号:KR1020090061607

    申请日:2009-07-07

    CPC classification number: G10L19/20 G10L19/0212 G10L19/12

    Abstract: PURPOSE: An apparatus for encoding and decoding integrated voice and audio signals is provided to combine a voice codec module with an audio codec module and selectively apply a codec module depending on a characteristic of an input signal, thereby showing excellent performance. CONSTITUTION: A module selecting unit(110) analyzes a characteristic of an input signal to select the first encoding module for encoding the first frame of an input signal. A voice encoding unit(130) encodes the input signal by selection of the module selecting unit to generate a voice bit string. An audio encoder(140) encodes the input signal by selection of the module selecting unit to generate an audio bit string. A bit stream generator(150) generates an output bit string from the audio encoder by selection of the module selecting unit.

    Abstract translation: 目的:提供一种用于编码和解码集成语音和音频信号的装置,用于将语音编解码器模块与音频编解码器模块组合,并且根据输入信号的特性选择性地应用编解码器模块,从而显示出优异的性能。 构成:模块选择单元(110)分析输入信号的特性,以选择用于编码输入信号的第一帧的第一编码模块。 语音编码单元(130)通过选择模块选择单元对输入信号进行编码以产生语音比特串。 音频编码器(140)通过选择模块选择单元对输入信号进行编码以产生音频位串。 比特流生成器(150)通过选择模块选择单元从音频编码器生成输出比特串。

    음원 간 상호상관을 이용한 멀티트랙 다운믹싱 장치 및 그방법
    174.
    发明授权
    음원 간 상호상관을 이용한 멀티트랙 다운믹싱 장치 및 그방법 有权
    使用声源之间互相关的多轨降混装置及其方法

    公开(公告)号:KR100932790B1

    公开(公告)日:2009-12-21

    申请号:KR1020080036085

    申请日:2008-04-18

    Abstract: 본 발명은 음원 간 상호상관을 이용한 멀티트랙 다운믹싱 장치 및 그 방법에 관한 것으로, 개별 음원 신호를 각 음원 간 상호상관을 이용하여 상호상관 값이 높은 조합을 가지는 멀티트랙 신호로 다운믹싱함으로써, 다운믹싱된 멀티트랙 신호로부터 개별 음원을 더욱 충실하게 복원할 수 있는, 음원 간 상호상관을 이용한 멀티트랙 다운믹싱 장치 및 그 방법을 제공하고자 한다.
    이를 위하여, 본 발명은 멀티트랙 다운믹싱 장치에 있어서, 개별 음원 신호를 주파수 대역으로 변환하기 위한 신호 변환 수단; 상기 변환된 개별 음원 신호로부터 각 음원 간 공간정보를 산출하기 위한 공간정보 산출 수단; 상기 산출된 각 음원 간 공간정보를 이용하여 상호상관 값에 따라 믹싱조합 정보를 결정하기 위한 믹싱조합 결정 수단; 및 상기 결정된 믹싱조합 정보에 따라 상기 변환된 개별 음원 신호를 멀티트랙 신호로 다운믹싱하기 위한 멀티트랙 다운믹싱 수단을 포함한다.
    상호상관, 멀티트랙, 개별 음원 신호, 공간정보, 믹싱조합, 폐루프, 믹싱 매트릭스 정보, 멀티트랙 다운믹싱

    Abstract translation: 本发明涉及一种使用该声源之间的互相关性的多轨道下混合设备和方法中,通过下混合使用互相关的各个声源信号到多轨道信号具有相应的声音源之间的高互相关值组合,向下 还有一种多声道缩混设备,利用声源之间的相互相关性,能够更真实地从混合多声道信号中恢复单个声源。

    객체기반 오디오 서비스 제공 방법과, 이를 위한 다중객체오디오 콘텐츠 파일의 생성/편집/재생 방법 및 그 파일구조
    175.
    发明公开
    객체기반 오디오 서비스 제공 방법과, 이를 위한 다중객체오디오 콘텐츠 파일의 생성/편집/재생 방법 및 그 파일구조 无效
    用于提供基于对象的音频服务的方法,用于创建/编辑/复制多个对象音频内容文件的方法及其文件结构

    公开(公告)号:KR1020090052780A

    公开(公告)日:2009-05-26

    申请号:KR1020080013807

    申请日:2008-02-15

    CPC classification number: H04N21/2335 H04N21/235 H04N21/236

    Abstract: 본 발명은 객체기반 오디오 서비스 제공 방법과, 이를 위한 다중객체 오디오 콘텐츠 파일의 생성/편집/재생 방법 및 그 파일 구조에 관한 것으로서, 객체 기반 오디오 서비스에 부가 서비스로서 오디오 프리셋에 관련된 이미지/영상/문자 등과 같은 비주얼 데이터 형태의 부가 데이터를 추가로 제공함으로써, 사용자가 자신의 취향에 따라 다양한 오디오 콘텐츠를 저작/편집할 수 있도록 하고자 한다.
    이를 위하여, 본 발명은, 객체기반 오디오 서비스 제공 방법에 있어서, 오디오 콘텐츠를 구성하는 복수의 오디오 객체를 생성하는 단계; 상기 각각의 오디오 객체에 대하여 객체 속성을 정의한 오디오 프리셋을 생성하는 단계; 및 상기 오디오 객체, 상기 오디오 프리셋, 및 상기 오디오 프리셋에 관련된 부가 데이터를 다중화하여 전송하는 단계를 포함하는 것을 특징으로 한다.
    객체기반 오디오, 오디오 객체, 다중객체 오디오 콘텐츠 파일, 부가 데이터, 부기데이터 색인정보

    다객체 오디오 부호화 및 복호화 방법과 그 장치
    176.
    发明公开
    다객체 오디오 부호화 및 복호화 방법과 그 장치 有权
    多对象音频编码和解码方法及其设备

    公开(公告)号:KR1020090040857A

    公开(公告)日:2009-04-27

    申请号:KR1020080103034

    申请日:2008-10-21

    CPC classification number: G10L19/008

    Abstract: A method for encoding/decoding a multi-object and an apparatus therefor are provided to offer various audio services to a user, efficiently. The first down-mix generating unit(102) down-mixes a background object(BGO) and the first foreground object(FGO1) to generate the first down-mix signal and the first residual signal. The second down-mix generating unit(103) down-mixes the first down-mix signal and the second foreground object(FGO2) to generate the second down-mix signal and the second residual signal. A bit stream generating unit produces a bit stream including the down-mix signal and residual signal.

    Abstract translation: 提供了一种用于对多个对象进行编码/解码的方法及其装置,以有效地向用户提供各种音频服务。 第一下混合生成单元(102)将背景物体(BGO)和第一前景物体(FGO1)进行降混,以产生第一缩减混音信号和第一残差信号。 第二下混合生成单元(103)将第一缩混信号和第二前景对象(FGO2)进行下混合,以生成第二缩减混音信号和第二残差信号。 比特流生成单元产生包括缩减混音信号和残留信号的比特流。

    다채널로 구성된 다객체 오디오 신호의 인코딩 및 디코딩장치 및 방법
    177.
    发明公开
    다채널로 구성된 다객체 오디오 신호의 인코딩 및 디코딩장치 및 방법 有权
    多通道编码和解码多目标音频信号的装置和方法

    公开(公告)号:KR1020080089308A

    公开(公告)日:2008-10-06

    申请号:KR1020080029695

    申请日:2008-03-31

    CPC classification number: G10L19/008

    Abstract: An apparatus and a method for encoding and decoding multi-object audio signal including multiple channels are provided to actively consume audio contents according to the need of a user. An SAOC(Spatial Audio Object Coding) encoder(101) downmixes an audio object outputted from an SAC encoder(103) to output a representative downmix signal, and outputs an SAOC bit stream including space queue information and supplementary information about the inputted audio object. The SAC encoder downmixes a multi-channel audio signal into a mono channel or a stereo channel to generate a single audio object. The SAC encoder outputs an SAC bit stream including space queue information and supplementary information about the inputted multi-channel audio signal. A preset-ASI(Audio Scene Information) unit(113) forms a control signal inputted from the exterior, namely, object control information, into preset-ASI and generates a preset-ASI bit stream including the preset-ASI information. A bit stream formatter(105) generates a representative bit stream by combining the SAOC bit stream outputted from the SAOC encoder, the SAC bit stream outputted from the SAC encoder, and a preset-ASI bit stream outputted from the preset-ASI unit.

    Abstract translation: 提供了一种用于编码和解码包括多个通道的多对象音频信号的装置和方法,以根据用户的需要主动消费音频内容。 SAOC(空间音频对象编码)编码器(101)将从SAC编码器(103)输出的音频对象下混合以输出代表性的下混合信号,并输出包括空格队列信息和关于所输入的音频对象的补充信息的SAOC比特流。 SAC编码器将多声道音频信号下混合到单声道或立体声通道中以生成单个音频对象。 SAC编码器输出包括空间队列信息和关于输入的多声道音频信号的补充信息的SAC比特流。 预设ASI(音频场景信息)单元(113)形成从外部输入的控制信号,即对象控制信息,成为预设的ASI,并生成包含预设的ASI信息的预设的ASI比特流。 比特流格式化器(105)通过组合从SAOC编码器输出的SAOC比特流,从SAC编码器输出的SAC比特流和从预设ASI单元输出的预设ASI比特流,生成代表比特流。

    다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법
    178.
    发明公开
    다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법 有权
    用于编码和解码多个通道的多目标音频信号的装置和方法

    公开(公告)号:KR1020080029940A

    公开(公告)日:2008-04-03

    申请号:KR1020070098663

    申请日:2007-10-01

    CPC classification number: G10L19/00 G10L19/008 G10L19/20

    Abstract: An apparatus and a method for encoding and decoding multi-object audio signals with various channels are provided to allow a user to use audio contents actively as necessary. The first and second downmixers(101,103) downmix multi-object audio signals each with different channels into a single downmixed signal, and extract supplementary information including header information and space queue information with respect to the multi-object audio signals each having different channels. An audio encoder(105) encodes the downmixed audio signals. A supplementary information encoder(107) generates the supplementary information as a bit stream. The header information includes identifier information of the multi-object audio signals each with different channels and channel information of the multi-object audio signals each with different channels and channel information.

    Abstract translation: 提供用于对具有各种通道的多对象音频信号进行编码和解码的装置和方法,以允许用户根据需要主动地使用音频内容。 第一和第二下混合器(101,103)将具有不同通道的多对象音频信号混合成单个下混合信号,并且提取关于每个具有不同频道的多对象音频信号的标题信息和空间队列信息的补充信息。 音频编码器(105)对下混合音频信号进行编码。 辅助信息编码器(107)生成补充信息作为比特流。 标题信息包括每个具有不同信道的多对象音频信号的标识符信息和多对象音频信号的信道信息,每个具有不同的信道和信道信息。

    공간지각 단서에 의한 서라운드 음장 시각화 장치 및 그방법
    179.
    发明授权
    공간지각 단서에 의한 서라운드 음장 시각화 장치 및 그방법 有权
    使用空间声音本地化的环境声场可视化

    公开(公告)号:KR100790362B1

    公开(公告)日:2008-01-03

    申请号:KR1020060124837

    申请日:2006-12-08

    CPC classification number: H04S7/40 G01H17/00

    Abstract: An apparatus and a method of surround sound field visualization using a spatial sound localization cue are provided to monitor the arrangement and power balance of a sound source when making multi-channel audio contents by intuitively displaying the present state of the sound source. A sub-band analysis unit(101) represents an inputted multi-channel audio signal as a frequency domain, and divides the frequency domain into sub-bands. A channel power calculating unit(102) calculates the power of a signal for each sub-band. A maximum channel detecting unit(103) compares the power of sub-bands of each channel, and determines at least two channels with the maximum power for each sub-band. An inter-channel cross correlation calculating unit(104) calculates the cross correlation for each adjacent channel and right/left channels. A sound source direction and power calculating unit(105) calculates the direction and power of a sound source by using the information of at least two channels determined by the maximum channel detecting unit and the cross correlation value calculated by the inter-channel cross correlation calculating unit. A surround sound field visualization unit(106) displays the power and direction of the sound source in a display device.

    Abstract translation: 提供了使用空间声音定位提示的环绕声场可视化的装置和方法,以通过直观地显示声源的当前状态来制作多声道音频内容时监视声源的布置和功率平衡。 子带分析单元(101)表示作为频域的输入的多声道音频信号,并将频域划分为子带。 信道功率计算单元(102)计算每个子带的信号功率。 最大信道检测单元(103)比较每个信道的子带的功率,并确定每个子带的最大功率的至少两个信道。 信道间互相关计算单元(104)计算每个相邻信道和右/左信道的互相关。 声源方向和功率计算单元(105)通过使用由最大信道检测单元确定的至少两个信道的信息和通过信道间相互相关计算计算的互相关值来计算声源的方向和功率 单元。 环绕声场可视化单元(106)在显示装置中显示声源的功率和方向。

    혼합된 오디오 스트림으로부터 오디오 객체를 분리하기위한 단말 장치 및 그 방법
    180.
    发明授权
    혼합된 오디오 스트림으로부터 오디오 객체를 분리하기위한 단말 장치 및 그 방법 失效
    从组合音频流中分离音频对象的装置和方法

    公开(公告)号:KR100745689B1

    公开(公告)日:2007-08-03

    申请号:KR1020050061861

    申请日:2005-07-08

    Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
    본 발명은 혼합된 오디오 스트림으로부터 오디오 객체를 분리하기 위한 단말 장치 및 그 방법에 관한 것임.
    2. 발명이 해결하려고 하는 기술적 과제
    본 발명은 하나의 기본 스트림으로 압축된 다수의 오디오 객체들을 BIFS를 이용하여 분리 처리할 수 있는 노드 구조를 제안하고, 그 제안한 노드를 이용하여 혼합된 오디오 스트림으로부터 오디오 객체를 분리하기 위한 단말 장치 및 그 방법을 제공하는데 목적이 있음.
    3. 발명의 해결방법의 요지
    본 발명은, 다수의 오디오 객체가 압축된 기본 스트림(ES)을 디코딩하기 위한 디코딩부; 및 오디오 객체 분리 노드를 이용하여 상기 디코딩된 오디오 스트림에서 오디오 객체들을 분리하고, 분리된 오디오 객체들을 이용하여 오디오 장면을 구성하기 위한 컴포지터를 포함하는 단말 장치로서, 상기 오디오 객체 분리 노드는, 분리하고자 하는 오디오 객체의 수를 기술하는 필드; 및 객체 분리를 수행할지 여부를 기술하는 필드를 포함함.
    4. 발명의 중요한 용도
    본 발명은 MPEG-4 시스템 등에 이용됨.
    MPEG-4, BIFS, 객체, 기본 스트림(ES), 오디오 장면, 분리

    Abstract translation: 本发明涉及一种终端用于从组合音频流中分离音频对象的方法的研究提出了一种节点结构,其可以使用二进制格式场景将被压缩成一个基本流b的音频对象分离,并提供一个分离 通过使用建议的节点结构来自组合音频流的音频对象,以及其方法。 终端包括:解码器,用于解码在其上压缩的音频对象的基本流,从而产生解码的音频流; 以及用于通过使用音频对象分离节点来分离音频对象与解码的audi流的组合,通过使用分离的音频对象形成音频场景,其中音频对象分离节点包括:用于将音频对象的数量描述为 被分开 以及用于描述是否执行对象分离的字段。

Patent Agency Ranking