Abstract:
PURPOSE: An audio generating method, and an audio reproducing apparatus and method are provided to create and reproduce audio using description information including scene effects recoded with audio effects to be applied to audio objects. CONSTITUTION: Description information including scene effects recorded with audio effects applied to audio objects is created. Audio bit stream is created by merging the description information and the audio objects. The scene effects include audio effect application start time, audio effect application end time, and information representing the audio effect. The description information also includes object descriptions, each recorded with information on reproduction areas for each audio object.
Abstract:
본 발명은 SVC 비디오 콘텐츠 제공 장치 및 방법에 대하여 개시한다. 본 발명은 비디오 또는 오디오 신호를 공용 데이터 구조의 비디오 및 오디오 스트림으로 부호화하는 비디오/오디오 부호화부와, 사용자의 실시간 또는 VoD 스트리밍 모드 선택에 따라 상기 비디오 및 오디오 스트림 입력을 실시간 스트리밍 모드이면 출력으로 바이패스하고, VoD 스트리밍 모드이면 SVC 파일 포맷으로 변환/역변환하는 멀티플렉서/디멀티플렉서부와, 상기 VoD 스트리밍 모드에서 생성된 상기 SVC 파일 포맷 파일을 저장하는 저장부와, 상기 비디오 스트림의 일부를 추출하여 타깃 비디오 스트림을 출력하는 비디오 데이터 추출기와, 상기 타깃 비디오 스트림 및 상기 오디오 스트림으로 구성된 SVC 비디오 콘텐츠를 송출하는 송수신 유니트를 포함하는 점에 그 특징이 있다. 본 발명은 효율적인 SVC 비디오 콘텐츠 생성으로 연산 및 데이터 양이 적어 실시간 스트리밍 서비스 제공이 가능하고, VoD 스트리밍 서비스 제공시에는 저장공간을 절약할 수 있다 SVC 비디오 콘텐츠, 공용 데이터 구조, SVC 파일 포맷, 비디오 데이터 추출기
Abstract:
PURPOSE: An image prediction method in a multi-view video codec and a computer readable recording medium recording a program from the method are provided to induce a global disparity vector value with the highest frequency by a macro block unit, thereby improving accuracy. CONSTITUTION: A disparity vector value is selected as a candidate value(S100). A global disparity vector value is obtained based on the selected candidate value(S200). A disparity vector value for searching a correspondence macro block is obtained(S300). A macro block of another view point is searched. A current macro block is encoded.
Abstract:
PURPOSE: An image encoder, an image encoding method, an image decoder device, an image decoding method and a computer readable recording medium including a rotation unit and an encoder are provided to efficiently decode and encode both images of various formats. CONSTITUTION: A rotation unit(110) outputs a second image frame by rotating a first image frame in a first mode. An encoding unit(120) classifies a second video frame into a top field and a bottom filed in an interlace mode. The encoder uses the top field and bottom field and encodes the second video frame. The rotation unit offers a rotation direction flag informing the rotational direction of the first video frame.
Abstract:
본 발명은 비트 효율성 및 처리 효율성을 향상시킬 수 있는 입체형 비디오 파일 포맷 및 그에 따른 입체형 비디오 파일을 기록한 컴퓨터로 판독 가능한 기록매체에 관한 것이다. 이와 같은 본 발명은, 파일 포맷 정보 및 모노 데이터 포함 여부를 나타내는 정보를 저장하는 파일 타입 박스와; 입체형 비디오 스트림을 구성하는 다수의 트랙 박스들을 저장하는 무비 박스와; 멀티미디어 리소스를 저장하는 미디어 데이터 박스와; 적어도 하나의 공통되는 입체형 비디오 스트림 배열 정보를 저장하는 입체형 비디오 미디어 정보 박스와; 상기 다수의 트랙 박스들이 참조할 카메라 파라미터 및 권장 디스플레이 정보를 저장하는 입체형 카메라 및 디스플레이 정보 레퍼런스 박스와; 상기 입체형 비디오 스트림의 각 입체형 영상 프레임마다에 존재하며 상기 입체형 카메라 및 디스플레이 정보 레퍼런스 박스의 참조 정보를 저장하는 입체형 카메라 및 디스플레이 정보 박스와; 메타데이터의 저장을 위한 메타 박스를 포함하여, 중복되는 데이터를 최소화함과 동시에 파일 포맷의 구성을 단순한 형태로 최적화할 수 있도록 한다. 입체형 비디오, 파일 포맷, TRAK, SCDI, SVMI, SCDR
Abstract:
An apparatus and a method for coding video are provided to enable other encoding units to code other GOP(Group Of Picture)s in parallel while the first encoding unit codes the first GOP, thereby maximizing efficiency of coding video during multi core processing. The first to n encoding units(31a~31n) encodes video correspondingly to a GOP composed of a plurality of pictures grouping images of video. At this time, the first to n encoding units perform encoding according to a control signal of a control unit(33). The control unit controls the first to n encoding units to encode other pictures of a preceding GOP and a following GOP after encoding a key picture of the preceding GOP.
Abstract:
본 발명은 다시점 정방향 카메라 구조 기반 메쉬를 이용한 중간 영상 합성 방법으로서, 합성하고자 하는 중간 영상과 이에 이웃하는 세 개의 참조 영상이 중첩하는 영역을 확인하는 거리매칭 단계와, 상기 중첩 영역에 따라서 나타나는 차분의 위치 특성을 고려하여 객체(object)의 윤곽선을 기반으로 절점(vertex)을 추출하여 메쉬를 구성하는 메쉬 매핑 단계와, 상기 추출된 절점을 중심으로 에피폴라 라인 상에서 지정된 일정한 블록 단위로 블록 매칭을 수행하여 상기 절점에 대한 시차 벡터를 획득하는 에피폴라 라인 기반 블록 매칭 단계와, 상기 블록 매칭 결과에 따라서 상기 참조 영상을 기초로 영상 변환 및 영상 변형을 수행하여 상기 중첩 영역의 영상을 보정하는 영상 보정 단계와, 상기 보정된 중첩 영역을 통합하여 중간 영상을 합성하는 영상 합성 단계를 포함하는 다시점 정방향 카메라 구조 기반 메쉬를 이용한 중간 영상 합성 방법에 관한 것이다. 본 발명에 따르면, 거리 매칭을 이용하여 일정시간 간격으로 공유 영역을 찾고 이를 기반으로 영역별로 합성 영상을 만들어내기 때문에 정확한 시차 벡터를 획득할 수 있으며, 3개의 참조 영상을 이용함으로써 폐색 영역을 줄이고, 시차가 큰 참조 영상에 대해서도 용이하게 합성영상을 만들어 낼 수 있으며, 윤곽선의 절점을 중심으로 메쉬를 통한 영상 변환이 이루어지기 때문에 변환된 윤곽을 정확히 표현할 수 있고, 높은 입체감을 표시할 수 있다. 다시점, 중간영상, 합성, 3D, 참조영상, 거리 매칭, 블록 매칭, 영상 블렌딩, 메쉬, 절점, 에피폴라 라인, 메쉬 클러스터링, 시차 벡터, 홀 필링, 어파인 변환
Abstract:
본 발명은 미디어 서버와 하나 이상의 미디어 디바이스와 각각에 연결된 센서 네트워크 노드들을 포함하는 센서 네트워크 및 메타데이터를 이용한 미디어 서비스 제공 시스템으로서, 상기 미디어 서버는, 미디어 컨텐츠의 위치와 내용 정보를 포함하는 미디어 정보를 저장하는 미디어 정보 저장부와, 상기 미디어 서버에 연결된 센서 네트워크 노드와의 데이터 송수신의 인터페이스를 수행하는 센서 인터페이스부와, 사용자 선호 정보와 상기 미디어 디바이스에 대한 메타데이터를 저장하며 상기 센서 인터페이스부를 통하여 상기 미디어 디바이스에 저장된 메타데이터를 수신하고 비교하여 갱신된 메타데이터를 저장하는 메타데이터 저장부와, 상기 메타데이터 저장부에 저장된 메타데이터를 사용하여 상기 미디어 정보 저장부에 저장된 미디어 정보를 검색하여 상기 미디어 디바이스로 전송될 미디어 컨텐츠를 선택하는 컨텐츠 선택부와, 상기 컨텐츠 선택부에서 선택된 미디어 컨텐츠를 상기 미디어 디바이스에 전송하는 컨텐츠 전송부를 포함하고, 상기 미디어 디바이스는, 상기 미디어 서버의 컨텐츠 전송부로부터 전송된 미디어 컨텐츠를 수신하는 컨텐츠 수신부와, 상기 미디어 디바이스에 연결된 센서 네트워크 노드와의 데이터 송수신의 인터페이스를 수행하는 센서 인터페이스부와, 사용자 선호 정보와 상기 미디어 디바이스에 대한 메타데이터를 저장하며 상기 센서 인터페이스부를 통하여 상기 미디어 서버에 저장된 메타데이터를 수신하고 비교하여 갱신된 메타데이터를 저장하는 메타데이터 저장부를 포함하고, 상기 센서 네트워크 노드들 각각은, 상기 미디 어 서비스 제공 시스템 내의 다른 디바이스의 센서 네트워크 노드와의 데이터 송수신을 수행하는 센서 네트워크 인터페이스부와, 자신이 연결된 디바이스와의 데이터 송수신의 인터페이스를 수행하는 디바이스 인터페이스부와, 상기 디바이스 인터페이스부를 통하여 자신이 연결되어 있는 디바이스에 저장된 메타데이터를 전송받아 저장하고 상기 센서 네트워크 인터페이스부를 통하여 다른 센서 네트워크 노드에 저장되어 있는 메타데이터를 수신하고 비교하여 갱신된 메타데이터를 저장하는 메타데이터 저장부를 포함하는 것인 센서 네트워크 및 메타데이터를 이용한 미디어 서비스 제공 시스템에 관한 것이다. 본 발명에 따르면, 센서 네트워크 노드에 메타데이터를 입력하고 이러한 메타데이터를 기초로 사용자가 원하는 미디어 컨텐츠를 지능적으로 검색하여 사용자가 소지하고 있는 모바일 미디어 디바이스를 포함하는 미디어 디바이스에게 사용자가 원하는 미디어 컨텐츠를 사용자가 원하는 시간에 사용자가 원하는 미디어 디바이스에 제공할 수 있다. 메타데이터, 센서 네트워크, 모바일 미디어 디바이스, WPAN, USN, TV-Anytime, 방송 통신 융합, 미디어 컨텐츠
Abstract:
본 발명은 다시점 영상통신 시스템에 관한 것으로 보다 상세하게는 여러 개의 영상입력장치로부터 입력된 원영상을 전처리, 압축, 다중화, 역다중화, 복원, 합성의 과정을 통해 원영상보다 더 많은 영상을 디스플레이장치에서 출력하는 것이 가능하고 다양한 각도와 다양한 거리에서 3차원 입체영상을 시청하며 검색기능을 포함한 3차원 입체영상을 위한 다시점 영상통신 시스템에 관한 것이다. 본 발명은 크게 송신단과 수신단으로 나뉘며, 송신단은 여러대의 카메라로부터 2차원 영상을 획득하는 영상 획득부와, 카메라의 특성차이로 인한 파라메타 등을 보정하는 다시점영상 전처리부(100)와, 각 카메라에서 출력되는 영상들간의 시간적, 공간적 리던던시(redundancy)를 제거하는 다시점영상 압축부(200)와, 상기 영상획득부에서 획득된 2차원 영상으로부터 바로 검색이 가능한 정보를 가지고 있는 메타데이터(Meta data)를 추출하는 다시점 영상검색시스템(300)과, 상기 다시점영상 압축부에서 압축된 각 영상 스트림과 상기 메타데이터를 하나의 스트림으로 다중화하는 다시점영상 다중화부(400)를 포함하며 수신단은 다중화된 영상스트림으로부터 메타데이터 및 각각의 독립된 영상스트림으로 복원하며 저장을 위해 메타데이터를 제외한 다중화된 스트림을 재생성하는 다시점영상 역다중화부(500)와, 상기 다시점영상 역다중화부(500)에서 생성된 메타데이터 및 메타데이터를 포함하지 않는 3DSS스트림을 임시저장하고 메타데이터를 이용하여 검색하는 멀티미디어 저장 및 검색 시스템(Multimedia StorageSearch system)과, 상기 다시점영상 역다중화부(500) 및 상기 멀티미디어 저장 및 검색 시스템에서 검색된 3DSS스트림의 압축된 각각의 영상을 압축해제하여 복원하는 다시점영상 복원부(600)와, 복원된 다시점 영상간의 중간영상을 생성하는 다시점 중간영상합성부(700)와, 전기단계에서 형성된 2차원영상을 3차원 디스플레이장치에 출력하는 3D 디스플레이 제어부(800)를 포함한다. 따라서 본 발명은 한정된 인원만이 3차원 영상을 볼 수 있었던 기존기술과는 달리 카메라로부터 얻을 수 있는 시점보다 많은 시점을 확보할 수 있으므로 많은 인원이 동시에 여러 각도 또는 여러 시점에서 시청할 수 있는 장점이 있다. 또한 본 발명을 구성하는 각 수단들은 3차원 다시점 비디오 시스템외에도 각각이 독립적으로 디지털 방송, 의료분야, 게임/오락분야 등의 제품에 적용이 가능하며 영상검색이 가능한 메타데이터를 다시점영상 통신시스템내에 함께 존재하도록 함으로써 무조건적인 재생 뿐만 아니라 사용자의 기호 및 선택에 따라서 3차원적으로 여러각도 및 여러시점에서 재생이 가능하다.
Abstract:
PURPOSE: A coding device for multi-view motion pictures is provided to minimize the volume of multi view video information. CONSTITUTION: A coding device for multi-view motion pictures includes a preprocessing part(10), a transition estimating part(30), a motion estimating part(40), a transition/motion compensating part(50), a difference picture coding part(60), a bit rate control part(70), and an entropy coding part(80). The preprocessing part increases the reliability of vectors obtained by transition estimation and motion estimation by increasing the temporal and spatial correlation between multi view video source data through preprocessing while resolving the imbalancing and the noise as the multi view video source data is input. The imbalancing is corrected by average and distribution of pictures to correct and a reference picture, and the noise is removed simply by using a median filter. A transition/motion compensating part compensates the pictures restored by the transition and motion estimating parts by half pixel compensation. The difference picture coding part carries out difference picture coding for difference information between the original picture provided from the preprocessing part with the restored picture, thereby providing better quality and three-dimensional feeling. The entropy coding part generates bit streams for the multi view motion picture source data according to a bit rate controlled by the bit rate control part.