Abstract:
Provided are a method and a system for stabilizing an image by selectively using multiple motion models. A method for stabilizing an image according to an embodiment of the present invention comprises creating stabilization images, of which the shaking cause by a photographing device is corrected, by using multiple motion models, by unit of motion model; comparing a key frame with the stabilization images to select one of the motion models; and outputting an stabilization image by using the selected motion model. Therefore, the distortion which can occur in the signal model estimation can be minimized by selecting the best motion model among motion models in an image with shaking phenomenon due to a camera and correcting the shaking.
Abstract:
홀 발생 억제를 위한 3D-워핑 방법 및 이를 적용한 영상 처리 장치가 제공된다. 본 발명의 실시예에 따른 영상 처리 방법은, 영상을 다수의 영역들로 분할하여, 영역들 단위로 영상을 3D-워핑한다. 이에 의해, 3D-워핑을 수행함에 있어 홀을 발생시키지 않거나, 발생시키더라도 최대한 억제시킬 수 있게 되어, 3D-워핑된 RGB-영상의 경우 정확한 화소값을 보유하게 되고, 3D-워핑된 Z-영상의 경우 정확한 깊이 정보를 보유하게 된다.
Abstract:
PURPOSE: A depth image processing method and a 3D image generating apparatus are provided to completely agree a depth image with a color image in terms of the size and view even when performing 3D-warping. CONSTITUTION: An RGB camera (110) produces a color image. A time of flight (TOF) camera (120) produces a depth image. An image processor (130) implements up-sampling for the size of the depth image to the size of the color image before implementing 3D-warping. Upon completion of the up-sampling, the image processor implements 3D-warping for the view of the up-sampled depth image to the view of the color image. [Reference numerals] (110) RGB camera; (120) ToF camera; (131) RGB image correcting/aligning unit; (133) Z-image correcting/aligning unit; (135) Up-sampling unit; (137) 3D-warping unit; (139) Correcting unit; (140) Image application unit
Abstract:
본 발명은 실감 객체 오디오 재생 및 생성 장치에 관한 것으로, 본 발명의 일면에 따른 실감 객체 오디오 재생 장치는 입력되는 오디오 파일로부터 SD(Scene Description) 압축 데이터 및 객체 오디오 압축 데이터를 각각 분리하는 디포맷터부, SD 압축 데이터를 복호화하여 SD 정보(Scene Description Information)를 복원하는 SD 복호화부, 객체 오디오 압축 데이터를 복호화하여 복수 객체 각각의 오디오 신호인 객체 오디오 신호를 복원하는 객체 오디오 복호화부 및 SD 정보 중 각 객체 오디오 신호에 대응하는 객체별 SD 정보에 따라 객체별 오디오 효과를 객체 오디오 신호에 부가하여 각 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성하는 객체 오디오 효과부를 포함한다.
Abstract:
본 발명은 VLC 코드들의 상관관계에 따라 VLC 코드들을 그룹으로 분류한 후, 각 그룹을 디코딩할 수 있는 산술식을 정의하고 이에 따라 디코딩을 수행함으로써, 테이블 룩-업에 의한 메모리 접근을 최소화하고 디코딩 시간 및 전력 소모량을 감소시킬 수 있는 효율적인 H.264/AVC CAVLC 디코딩 방법에 관한 것이다. 본 발명에 따른 CAVLC 디코딩 방법은 (a) TotalCoeffs와 TrailingOnes의 조합으로 구성된 Coeff_Token의 디코딩 단계, (b) 각각의 0이 아닌 계수들 앞에 있는 0의 개수인 run_before의 디코딩 단계, (c) 마지막 0이 아닌 계수 이전의 0인 계수들의 개수인 total_zeros의 디코딩 단계, (d) 상기 TrailingOnes의 부호의 디코딩 단계 및 (e) 0 이 아닌 계수들의 레벨값의 디코딩 단계를 포함하되, 상기 Coeff_Token의 디코딩 단계, 상기 run_before의 디코딩 단계 및 상기 total_zeros의 디코딩 단계는 각각 (1) VLC 코드들을 소정의 기준에 따라 정렬 및 그룹으로 분류하는 단계; (2) 상기 각 그룹마다 디코딩을 위한 산술식을 지정하는 단계; 및 (3) 상기 산술식에 따라 디코딩을 수행하는 단계를 포함하는 것을 특징으로 한다.
Abstract:
본 발명은 다시점 정방향 카메라 구조 기반 메쉬를 이용한 중간 영상 합성 방법으로서, 합성하고자 하는 중간 영상과 이에 이웃하는 세 개의 참조 영상이 중첩하는 영역을 확인하는 거리매칭 단계와, 상기 중첩 영역에 따라서 나타나는 차분의 위치 특성을 고려하여 객체(object)의 윤곽선을 기반으로 절점(vertex)을 추출하여 메쉬를 구성하는 메쉬 매핑 단계와, 상기 추출된 절점을 중심으로 에피폴라 라인 상에서 지정된 일정한 블록 단위로 블록 매칭을 수행하여 상기 절점에 대한 시차 벡터를 획득하는 에피폴라 라인 기반 블록 매칭 단계와, 상기 블록 매칭 결과에 따라서 상기 참조 영상을 기초로 영상 변환 및 영상 변형을 수행하여 상기 중첩 영역의 영상을 보정하는 영상 보정 단계와, 상기 보정된 중첩 영역을 통합하여 중간 영상을 합성하는 영상 합성 단계를 포함하는 다시점 정방향 카메라 구조 기반 메쉬를 이용한 중간 영상 합성 방법에 관한 것이다. 본 발명에 따르면, 거리 매칭을 이용하여 일정시간 간격으로 공유 영역을 찾고 이를 기반으로 영역별로 합성 영상을 만들어내기 때문에 정확한 시차 벡터를 획득할 수 있으며, 3개의 참조 영상을 이용함으로써 폐색 영역을 줄이고, 시차가 큰 참조 영상에 대해서도 용이하게 합성영상을 만들어 낼 수 있으며, 윤곽선의 절점을 중심으로 메쉬를 통한 영상 변환이 이루어지기 때문에 변환된 윤곽을 정확히 표현할 수 있고, 높은 입체감을 표시할 수 있다. 다시점, 중간영상, 합성, 3D, 참조영상, 거리 매칭, 블록 매칭, 영상 블렌딩, 메쉬, 절점, 에피폴라 라인, 메쉬 클러스터링, 시차 벡터, 홀 필링, 어파인 변환
Abstract:
본 발명은 디지털 오디오 방송 시스템에서 부가정보를 포함한 음원 및 멀티미디어 데이터 저장방법에 관한 것으로, 보다 자세하게는 채널 디코딩 칩에서 엠펙 형태의 오디오 데이터를 직접 획득하여 저장하는 방법과 엠펙 오디오의 특성을 이용하여 적절히 데이터를 생성 및 저장 이용하는 방법에 관한 것이다. 본 발명의 디지털 오디오 방송 시스템에서 부가정보를 포함한 음원 및 멀티미디어 데이터 저장방법은 디지털 방송 신호를 수신하여 사용자가 선택한 주파수 대역의 방송 신호를 출력하는 제 1단계; 상기 출력된 방송 신호를 엠펙 형태의 디지털 오디오 비트 스트림과 다른 종류의 데이터 비트 스트림으로 디코딩하여 출력하는 제 2단계; 상기 디코딩된 엠펙 오디오 비트 스트림을 원 신호 오디오 데이터로 신장하고 기타 데이터 비트 스트림을 처리하는 제 3단계; 부가 정보 데이터를 생성하여 원 신호에 삽입하는 제 4단계 및 상기 부가 정보 데이터가 삽입된 신호를 저장하는 제 5단계로 이루어짐에 기술적 특징이 있다. 따라서, 본 발명의 디지털 오디오 방송 시스템에서 부가정보를 포함한 음원 및 멀티미디어 데이터 저장방법은 시스템의 부하를 줄이고, 저장 매체를 보다 효율적으로 사용하면서 디지털 방송 데이터를 사용자의 기기에 보다 빠르게 저장 및 재생하는 것이 가능하며, 재생시 원 신호와 동일한 음질의 신호를 반복하여 재생하는 것이 가능한 장점이 있고, 원 신호를 획득하여 저장할 경우 사용자의 분류 정보 등을 삽입하여 저장하는 것이 가능하여 추후 각종 정보를 보다 쉽게 검색하여 재생하 는 것이 가능하며 저장된 정보를 직접 액세스하지 않고서도 정보를 간략히 파악하는 것이 가능한 효과가 있다. DAB, 저장매체, 원 신호, 부가 영역
Abstract:
본 발명은 3차원 다시점 멀티미디어 처리용 적응형 다중화/역다중화 장치 및 그 방법에 관한 것으로, 보다 자세하게는 디지털 방송과 같은 응용분야에서와 같이 다시점 영상을 효율적으로 원격지의 수신기에게 보내고 원격지의 수신기에서 효율적으로 다시점 영상을 복원할 수 있는 장치 및 그 방법에 관한 것이다. 본 발명의 3차원 다시점 멀티미디어 처리용 적응형 다중화 방법은 소정의 카메라로부터 입력된 다시점 영상에 대해 카메라의 특성차로 인한 파라메타 등을 보정하고 노이즈를 제거하는 전처리 단계; 각 카메라에서 출력되는 영상들간의 시간적, 공간적 중복성을 제거하여 압축하는 다시점 영상 압축 단계 및 상기 압축된 각각의 영상 스트림에 시간 및 동기 정보를 추가하고 AU 단위로 나누어 SL 패킷을 생성하는 단계, 여러 개의 SL 패킷들로부터 하나의 스트림인 플렉스 멀티플렉서 패킷을 생성하는 단계, 상기 플렉스 멀티플렉서 패킷을 엠펙-2 시스템의 규격에 맞게 각각 AU 단위로 분리하고 시간 및 동기 정보를 획득하여 PES 패킷을 생성하는 단계 및 상기 PES 패킷을 188 바이트의 TS 패킷화하여 수신부로 전송하는 단계를 포함하여 이루어지는 다중화 단계로 이루어짐에 기술적 특징이 있다. 따라서, 본 발명의 3차원 다시점 멀티미디어 처리용 적응형 다중화/역다중화 장치 및 그 방법은 다시점 영상에서 획득한 영상을 효과적으로 전송할 수 있는 장점이 있고, 종래의 시스템과 호환이 가능하여 효율적으로 다시점 영상을 규격화할 수 있는 효과가 있다.
Abstract:
PURPOSE: A receiver for digital audio broadcasting controllable on an information processing apparatus and a method for controlling the same are provided to control digital audio broadcasting and process data on an information processing apparatus having an operating system, to realize an economical receiver for digital audio broadcasting, and to easily debug all commercial chip sets on software. CONSTITUTION: An RF(Radio Frequency) terminal(109) receives a digital broadcasting signal and converts the received digital broadcasting signal into an analog signal, and executes a series of preprocessing. A digital audio broadcasting baseband terminal(111) receives the data processed at the RF terminal(109) to sample and decode the processed data. An RF processing unit(201) controls the RF terminal(109) by a series of commands processed on software of a host which is an information processing apparatus, and processes the RF terminal(109) to communicate with the host. A baseband processing unit(203) controls the baseband terminal(111) by a series of commands processed on software of a host which is the information processing apparatus, and divides the decoded data into multimedia data and service data, and stores the divided data. A data storing unit(205) temporarily stores the data processed at the baseband terminal(111) and the data processed at the host. An interface part(207) interfaces the host and a receiver. A control unit(215) controls the RF terminal(109), the baseband terminal(111), and other terminals.
Abstract:
PURPOSE: A multiview video communication system for three-dimensional images including a search function is provided to allow a user to view three-dimensional stereo images displayed on a three-dimensional display at various angles and distances. CONSTITUTION: A transmitter includes an image acquisition unit for capturing two-dimensional images from cameras, a multiview image pre-processor(100) for correcting parameters caused by a difference between characteristics of the cameras, an image compressor(200) for removing temporal and spatial redundancy among the images output from the cameras, an image search system(300) for extracting meta data from the two-dimensional images captured by the image acquisition unit, and a multiplexer(400) for multiplexing each video stream compressed by the image compressor and the meta data into one stream. A receiver includes an image demultiplexer(500) for demultiplexing the multiplexed video stream into the meta data and video streams and regenerating multiplexed streams including no meta data, a multimedia storage and search system for temporarily storing the meta data and the multiplexed video streams including no meta data and searching the video streams using the meta data, an image restoring unit(600) for decompressing the compressed images of the multiplexed video streams to restore the images, an intermediate image generator(700) for generating an intermediate image among the stored images, and a 3D display controller(800) for outputting the tow-dimensional images on a three-dimensional display.