-
公开(公告)号:KR100852223B1
公开(公告)日:2008-08-13
申请号:KR1020070011539
申请日:2007-02-05
Applicant: 한국전자통신연구원
IPC: G10L19/008 , H03M7/30 , G11B20/10
Abstract: 1. 청구범위에 기재된 발명이 속하는 기술분야
본 발명은 멀티채널 오디오 신호 시각화 장치 및 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 공간 오디오 부호화 기반의 멀티채널 오디오 복호화 장치에 있어서, 공간 파라메터를 이용하여 멀티채널 오디오 신호의 동적인 음량감과 음장감을 시각적으로 표현할 수 있는 멀티채널 오디오 신호 시각화 장치 및 방법을 제공하는데 그 목적이 있음.
3. 발명의 해결 방법의 요지
본 발명은, 공간 파라메터를 이용한 멀티채널 오디오 신호 복호화 장치로서, 시간 영역의 다운 믹스 신호를 입력받아 주파수 영역의 신호로 변환하여 주파수 영역 다운 믹스 신호를 출력하고, 상기 공간 파라메터 및 다운 믹스 신호를 이용하여 멀티채널 오디오 신호를 합성하는 공간 오디오 복호화부; 및 상기 주파수 영역 다운 믹스 신호 및 공간 파라메터를 이용하여 멀티채널 오디오 신호의 시각화 정보를 생성하기 위한 멀티채널 시각화부를 포함함.
3. 발명의 중요한 용도
본 발명은 멀티채널 오디오 신호 시각화 장치 등에 이용됨.
멀티채널 오디오, 시각화, 공간 오디오 부호화(SAC), MPEG Surround-
公开(公告)号:KR1020080053875A
公开(公告)日:2008-06-16
申请号:KR1020070076460
申请日:2007-07-30
Applicant: 한국전자통신연구원
CPC classification number: H04S7/302 , H04S2400/11 , H04S2420/01
Abstract: An apparatus and a method of controlling a sound scene for a virtual reality are provided to change the sound scene by using a viewpoint changing angle as control data. An apparatus of controlling a sound scene for virtual reality includes an audio input member(101), a user control input member(103), and a surround sound scene control member(102). The audio input member receives audio data from the outside. The user control input member receives an angle between a predetermined initial direction and a direction to be changed. The surround sound control member controls a surround sound scene by changing signal power for each channel of audio data inputted in the audio input member according to the changed angle inputted in the user control input member.
Abstract translation: 提供一种用于控制虚拟现实的声音场景的装置和方法,以通过使用视点改变角度作为控制数据来改变声音场景。 用于控制虚拟现实的声场的装置包括音频输入部件(101),用户控制输入部件(103)和环绕声场景控制部件(102)。 音频输入构件从外部接收音频数据。 用户控制输入构件在预定的初始方向和要改变的方向之间接收角度。 环绕声控制构件通过根据输入到用户控制输入构件中的改变的角度来改变输入到音频输入构件中的每个音频数据通道的信号功率来控制环绕声场景。
-
公开(公告)号:KR1020080051042A
公开(公告)日:2008-06-10
申请号:KR1020070107406
申请日:2007-10-24
Applicant: 한국전자통신연구원
IPC: G10L19/008 , G10L19/02 , H04S3/00
Abstract: An apparatus and a method for decoding the multi-channel audio signal by using the cross correlation are provided to produce the multi-channel audio signal from the down-mixing audio signal by means of the cross correlation between the left and right channels and to control the produced audio signal by using the encoding information. A multi-channel signal producing member(121) produces plural audio signals in channels from the down-mixing stereo audio signal by means of the cross correlation value between the left/right channel. A multi-channel signal regulating member(122) regulates the produced cross correlation value of plural audio signals in channels and the power values in sub-bands by means of the cross correlation information between channels of an original signal and virtual sound source direction information. The multi-channel signal producing member includes the first surround channel signal producing member for producing the down-mixing surround left channel signal. The second surround channel signal producing member produces the down-mixing surround left channel signal.
Abstract translation: 提供了通过使用互相关来解码多声道音频信号的装置和方法,以通过左声道和右声道之间的互相关从下混合音频信号产生多声道音频信号,并且控制 通过使用编码信息产生的音频信号。 多声道信号产生构件(121)通过左/右声道之间的互相关值从下混合立体声音频信号产生多个音频信号。 多通道信号调节部件(122)通过原始信号的通道与虚拟声源方向信息之间的互相关信息来调节通道中的多个音频信号的产生的互相关值和子频带的功率值。 多通道信号产生部件包括用于产生下混合环绕左声道信号的第一环绕声道信号产生部件。 第二环绕声道信号产生部件产生下混频环绕左声道信号。
-
公开(公告)号:KR1020080041972A
公开(公告)日:2008-05-14
申请号:KR1020070036513
申请日:2007-04-13
Applicant: 한국전자통신연구원 , 세종대학교산학협력단 , 광운대학교 산학협력단
Inventor: 최해철 , 정세윤 , 서정일 , 백승권 , 장인선 , 김재곤 , 문경애 , 장대영 , 홍진우 , 김진웅 , 심동규 , 이영렬 , 오승준 , 안창범 , 박호종 , 유상준
IPC: H04N19/51
CPC classification number: H04N19/159 , H04N19/167 , H04N19/176 , H04N19/513
Abstract: An apparatus and a method for encoding and decoding video by referencing reconstructed blocks of a current frame are provided to perform the block-based prediction encoding with reference to the previously restored area within the present image frame, thereby increasing the image compression ratio. An image prediction member(20) produces a prediction image with reference to the previous restoring area of the present image relating to the present image as an object for ending. A differential signal producing member(21) produces the differential signal between the present image and the prediction image. An encoding member(22) encodes the differential signal. A decoding member(23) restores the encoded differential signal and combines the restored differential signal with the prediction image produced by the image prediction member so that the present image is restored. The image prediction member performs additionally any one prediction manner between the inter prediction or intra prediction and then selects the optimum prediction image between the prediction images.
Abstract translation: 提供了通过参考当前帧的重构块来对视频进行编码和解码的装置和方法,以参照当前图像帧中的先前恢复的区域来执行基于块的预测编码,从而增加图像压缩比。 图像预测构件(20)参照与当前图像相关的当前图像的先前恢复区域作为结束对象产生预测图像。 差分信号产生部件(21)产生本图像与预测图像之间的差分信号。 编码构件(22)对差分信号进行编码。 解码构件(23)恢复编码的差分信号,并将恢复的差分信号与由图像预测构件产生的预测图像组合,使得当前图像被恢复。 图像预测构件在帧间预测或帧内预测之间另外执行任一预测方式,然后选择预测图像之间的最佳预测图像。
-
公开(公告)号:KR1020080034812A
公开(公告)日:2008-04-22
申请号:KR1020070104554
申请日:2007-10-17
Applicant: 한국전자통신연구원
IPC: H04N21/233 , H04N21/236
CPC classification number: G10L19/167 , G10L19/008
Abstract: An apparatus and a method for transmitting or replaying multi-channel audio signals are provided to increase reversed compatibility with a stereo audio based system by receiving multi channel audio signals, converting the signals into down mix audio signals and additional signals, adding the additional signals of the frames, and then generating additional signals of one super frame. An apparatus for transmitting multi-channel audio signals comprises a multi channel audio down mixer part(102), a super frame generating part(106), a stereo audio encoding part(104), a video encoding part(108) and a packetizing part. The multi channel audio down mixer part receives multi channel audio signals and converts the signals into down mix audio signals and additional signals. The super frame generating part adds the additional signals of the frames and generates additional signals of one super frame. The down mix audio signal is a stereo audio signal or a mono audio signal. The packetizing part which consists of a system encoding module(150) and an M4-over-M2 module receives an additional signal, an audio/video signal and signaling information and packetizes the signals and information at MPEG-2 TS format.
Abstract translation: 提供了用于发送或重放多声道音频信号的装置和方法,以通过接收多声道音频信号,将信号转换成混合音频信号和附加信号来增加与基于立体声音频的系统的反向兼容性, 帧,然后产生一个超帧的附加信号。 一种用于发送多声道音频信号的装置,包括多声道音频下混频器部分(102),超帧生成部分(106),立体声音频编码部分(104),视频编码部分(108)和打包部分 。 多声道音频下混频器部分接收多声道音频信号并将信号转换成混合音频信号和附加信号。 超帧生成部分添加帧的附加信号并产生一个超帧的附加信号。 下混合音频信号是立体声音频信号或单声道音频信号。 由系统编码模块(150)和M4-over-M2模块组成的分组部分接收附加信号,音频/视频信号和信令信息,并以MPEG-2TS格式分组信号和信息。
-
96.
公开(公告)号:KR100802179B1
公开(公告)日:2008-02-12
申请号:KR1020060045184
申请日:2006-05-19
Applicant: 한국전자통신연구원
IPC: H04N21/233
CPC classification number: H04H40/36 , H04H20/47 , H04H20/88 , H04H20/89 , H04H60/04 , H04N21/44012 , H04N21/8106
Abstract: 본 발명은 객체기반 3차원 오디오 서비스를 사용자(시청자)에게 제공함에 있어서, 사용자(시청자)의 각 음원별 오디오 신호를 제어하여야 하는 조작의 불편함을 해소하여, 사용자(시청자)로 하여금 쉽고 편리하게 객체기반 3차원 오디오 서비스를 청취할 수 있도록 하기 위한 프리셋 오디오 장면을 이용한 객체기반 3차원 오디오 서비스 시스템 및 그 방법에 관한 것으로, 3차원 오디오 서비스 제공 장치에 있어서, 오디오 신호를 입력받기 위한 오디오 입력 수단; 상기 입력된 오디오 신호로부터 객체 오디오 신호를 추출하고, 상기 추출된 객체 오디오 신호를 3차원 공간상에 배치하고, 미리 설정된 각 객체 오디오 신호에 대한 오디오 장면 정보를 바탕으로 상기 객체 오디오 신호들 각각에 대해 객체 속성을 편집하여, 서로 다른 객체 속성을 갖는 복수의 3차원 오디오 장면 정보를 생성하기 위한 오디오 장면 생성 수단; 및 상기 객체 오디오 신호들과 상기 복수의 3차원 오디오 장면 정보들을 부호화(다중화)하여 객체기반 3차원 오디오 콘텐츠를 출력하는 부호화 수단을 포함한다.
오디오, 방송, 객체, 기반, 장면, 프리셋, 서비스, 정보, 재생, 제공-
97.
公开(公告)号:KR1020070061100A
公开(公告)日:2007-06-13
申请号:KR1020060045184
申请日:2006-05-19
Applicant: 한국전자통신연구원
IPC: H04N21/233
CPC classification number: H04H40/36 , H04H20/47 , H04H20/88 , H04H20/89 , H04H60/04 , H04N21/44012 , H04N21/8106
Abstract: An object-based 3-dimensional audio service providing system and method using preset audio scenes are provided to offer previously generated preset audio scenes to users such that the users do not personally control audio signals and easily use object-based audio service. A 3-dimensional audio service providing system includes an audio input unit(31), an audio scene generator(32), an encoder(33), and a transmitter(34). The audio input unit receives an audio signal. The audio scene generator extracts object audio signals from the received audio signal, arranges the extracted object audio signals in a 3-dimensional space, and edits attributes of the object audio signals to generate at least one 3-dimensional audio scene. An encoder encodes the audio signal and the 3-dimensional audio scene. The transmitter converts the encoded object-based 3-dimensional audio scene according to a transmission format and transmits the object-based 3-dimensional audio scene to an audio playing terminal(40) through a digital broadcasting network(50).
Abstract translation: 提供使用预设音频场景的基于对象的三维音频服务提供系统和方法,以向用户提供先前生成的预设音频场景,使得用户不亲自控制音频信号并且容易地使用基于对象的音频服务。 三维音频服务提供系统包括音频输入单元(31),音频场景发生器(32),编码器(33)和发射机(34)。 音频输入单元接收音频信号。 音频场景生成器从接收到的音频信号中提取对象音频信号,将所提取的对象音频信号排列在3维空间中,并且编辑对象音频信号的属性以生成至少一个3维音频场景。 编码器对音频信号和3维音频场景进行编码。 发射机根据传输格式转换编码的基于对象的三维音频场景,并通过数字广播网络(50)将基于对象的三维音频场景发送到音频播放终端(40)。
-
公开(公告)号:KR100715281B1
公开(公告)日:2007-05-08
申请号:KR1019990062275
申请日:1999-12-24
Abstract: 본 발명은 영상 입력 위치 및 크기의 자동 조절이 가능한 영상 통신 방법 및 그 장치에 관한 것으로, 이 방법은 상대방에게 전송하고자 하는 대상체를 포함하는 영상을 입력받는 동시에, 상기 대상체까지의 거리를 계산하는 제1 단계; 상기 제1 단계에서 입력된 전체 영상 중에서 상기 대상체에 대응되는 영상의 중심 위치를 검출하는 제2 단계; 상기 제1 단계에서 계산된 상기 대상체까지의 거리 및 상기 제2 단계에서 검출된 중심 위치를 참조하여 상기 제1 단계에서 입력된 전체 영상 중 상기 대상체에 대응되는 영상이 상대방에게 전송되는 화면의 중심부에 적절한 크기로 보여지도록 영상의 위치 및 크기를 조절하여 상대방에게 전송하는 제3 단계를 포함한다.
본 발명에 따르면, 휴대용 영상 통신 단말기에서와 같이 사용자 및 영상 통신 단말기의 움직임이 많은 영상 통신 환경에서 간편하게 사용할 수 있는 효과가 있다.
영상 통신 방법, 영상 통신 장치, 거리 측정, 중심 위치, 크기 조절, 영상 부호화, 영상 전송, 얼굴 윤곽 검출 방식-
公开(公告)号:KR100626670B1
公开(公告)日:2006-09-21
申请号:KR1020040047262
申请日:2004-06-23
Applicant: 한국전자통신연구원
Abstract: 1. 청구범위에 기재된 발명이 속하는 기술분야
본 발명은 잔향 처리를 위한 음향 장면 생성 및 소비 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 직접 녹음을 하거나 소프트웨어를 이용하여 취득된 특정 잔향패턴(실내응답신호)을 유알엘(URL) 주소를 이용하여 직접 참조(referencing)함으로써 잔향(Reverberation) 처리를 할 수 있는 음향 장면 생성 및 소비 방법을 제공하고자 함.
3. 발명의 해결 방법의 요지
본 발명은, 잔향(Reverberation) 처리를 위한 음향 장면 생성 방법에 있어서, 음향 객체를 생성하는 단계; 및 실내응답신호를 이용하여 상기 음향 객체에 잔향 처리를 하기 위한 잔향 특성 정보를 포함한 음향 장면 기술 정보를 생성하는 단계를 포함하되, 상기 잔향 특성 정보는 상기 실내응답신호를 참조하기 위한 유알엘(URL) 주소를 기술하는 주소 기술 정보를 포함함.
4. 발명의 중요한 용도
본 발명은 컨텐츠 제공 시스템 등에 이용됨.
컨텐츠, 잔향, AudioBIFS, MPEG-4, 실내응답신호-
100.
公开(公告)号:KR1020060009090A
公开(公告)日:2006-01-31
申请号:KR1020040056549
申请日:2004-07-20
Applicant: 재단법인서울대학교산학협력재단 , 한국전자통신연구원
IPC: H04S7/00
CPC classification number: H04S7/303 , H04S3/002 , H04S7/305 , H04S2400/11
Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 입체음향의 공간감 및 거리감 제어를 위한 공간 임펄스 응답 제어 장치에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 음원의 위치이동 시 기준 임펄스 응답의 직접음 및 초기 반사음 포락선 구간을 제어함으로써, 입체음향의 공간감 및 거리감을 제어하기 위한, 공간 임펄스 응답 제어 장치를 제공하는데 그 목적이 있음.
3. 발명의 해결방법의 요지
본 발명은, 임펄스 응답을 제어하여 음원의 거리감을 제어하는 임펄스 응답 제어 장치에 있어서, 상기 임펄스 응답을 직접음, 초기 반사음 구간 및 후기 잔향 구간으로 분할하기 위한 임펄스 응답 분석수단; 상기 임펄스 응답 분석수단으로부터 출력된 직접음 및 초기 반사음 구간의 포락선을 갱신하고, 갱신된 직접음 및 초기 반사음 구간의 임펄스 응답을 출력하기 위한 초기 반사음 포락선 제어수단; 상기 갱신된 직접음 및 초기 반사음 구간의 임펄스 응답과 상기 후기 잔향 구간의 임펄스 응답을 합성하기 위한 임펄스 응답 합성수단; 및 상기 임펄스 응답 합성수단으로부터 출력된 합성 임펄스 응답과 상기 음원으로부터 입력된 입체음향을 컨벌루션(convolution)하여 필터링하기 위한 필터링수단을 포함함.
4. 발명의 중요한 용도
본 발명은 가상 입체 음향 환경 시스템에 이용됨.
입체음향, 임펄스 응답, 직접음, 초기 반사음, 잔향
-
-
-
-
-
-
-
-
-