Abstract:
본 발명은 스테레오스코픽 이미지 및 비디오에 대한 시각적 불편감 또는 시각적 피로 정도를 영상 분석을 통하여 자동으로 평가하고, 한 영상 내에서 어느 부분이 시각 피로를 일으킬 수 있는 문제의 영역인지를 시각화하여 보여줄 수 있는 장치 및 방법에 관한 것이다. 이를 위하여 본 발명의 실시 예에 따른 3D 스테레오스코픽 영상에서 시각 피로도를 시각화하는 장치는 촬영되는 또는 촬영된 스테레오스코픽 영상에서 시각적 중요 영역 검출하고, 상기 영상의 전체적인 시각적 불편감을 정량적인 점수로 계산하며, 상기 영상의 내의 세부 영역들의 시각적 불편감 정도를 나타내는 시각적 불편감 맵을 생성하여 출력하는 것을 특징으로 한다.
Abstract:
The present invention relates to apparatus and method for extracting a video signature using an inclined video cross section. The apparatus comprises: a video input unit for receiving videos or learning videos; a visuospatial video processing unit for extracting a visuospatial cube from the videos or the learning videos and generating a visuospatial subcube from the extracted visuospatial cube; a cross section extracting unit for calculating the amount of motion for the generated visuospatial subcube and extracting an inclined video cross section with a gradient depending on the calculated among of motion; a descriptor processing unit for extracting texture and edges from the extracted inclined video cross section to generate descriptor; a vocabulary of visual words (VoVW) storage unit for storing VoVW which has been previously generated from the learning videos; and a bag of spatio-temporal words (BoSTW) output unit for assigning a proximity word to the descriptor generated from the videos by comparison between the descriptor and the VoVW to output BoSTW. [Reference numerals] (110) Video input unit; (120) Visuospatial video processing unit; (130) Cross section extracting unit; (140) Descriptor processing unit; (150) VoVW storage unit; (160) BoSTW output unit
Abstract:
본 발명은 멀티미디어 콘텐츠 내 존재하는 인물들의 얼굴 영상을 색인함에 있어서, 공유 가능한 개인 영상들의 집합을 활용하여 개인 영상 내 속한 다수의 다른 사용자들과의 사회적 관계 모델을 형성하고, 사회적 관계 모델을 기반으로 온라인 커뮤니티 네트워크 또는 P2P 플랫폼 기반 검색 시스템 등에 분산된 다수의 얼굴 인식 엔진을 협동적으로 활용하여 얼굴 색인을 수행함으로써, 하나의 얼굴 인식 엔진만을 사용했을 때와 비교하여 우수한 얼굴 색인 및 검색 성능을 확보할 수 있다. 또한, 다른 사용자들의 얼굴 색인 시스템에 등록된 얼굴 영상 집합을 공유하고 활용할 수 있기 때문에 등록 얼굴 영상의 부재로 인한 얼굴인식 성능 저하를 방지시켜 얼굴 인식의 신뢰성과 정확도를 높일 수 있다. 얼굴, 색인, 협동, 얼굴인식 엔진, 분산, 네트워크, 온라인 네트워크
Abstract:
PURPOSE: A harmful image discriminating and blocking apparatus is provided to efficiently model big harmful meaning through a meaning based feature and to efficiently block a harmful image. CONSTITUTION: A pre-processing unit(2000) divides an input image into one or more areas. A visual feature generator(3000) generates visual feature about the divided areas. A meaning feature generator(4000) generates the meaning feature from visual features by area. A harmful image blocking unit(5000) decides the final harmfulness of the image. A meaning feature modeling unit(6000) models meaning feature models which are stored in a meaning feature model storage(4300).
Abstract:
PURPOSE: A face image indexing apparatus and a method therefor are provided to index a face through collaboration of distributed face recognition engines based on a social relationship model, thereby providing superior indexing and searching performance. CONSTITUTION: A face image extracting unit(140) extracts a face image from multimedia content. A face recognition engine selecting unit(120) selects the face recognition engines among distributed face recognition engines. A face feature extracting unit(150) includes face feature information extracting devices to which a feature of a selected face recognition engine is applied to extract face feature information by the face recognition engines. A collaboration face recognizing unit(160) combines the face feature information to generate one combined face recognition result for the face image and generate indexing information for the recognized face.
Abstract:
본 발명은 스케일러블 비디오 코딩에서 다중 ROI 설정, 복원을 위한 장치 및 방법에 관한 것이다. 본 발명의 다중 ROI 설정 장치는 매크로 블락을 적어도 하나의 슬라이스 그룹으로 할당된 패턴으로 규정함으로써 적어도 하나 이상의 ROI를 설정하고 각각의 ROI에 ROI 식별번호를 할당하는 관심영역 설정부, 적어도 하나 이상의 ROI 식별번호에 적어도 하나 이상의 슬라이스 그룹 식별번호를 할당하는 매핑부 및 ROI 관련 정보, 슬라이스 그룹 관련 정보, ROI 식별번호와 하나 이상의 슬라이스 그룹 식별번호 간의 매핑 정보 및 스케일러빌러티 정보를 포함하는 메시지를 생성하는 메시지 생성부;를 포함한다. ROI, SVC, 다중 ROI 부호화, 다중 ROI 복호화
Abstract:
A method and an apparatus for encoding multimedia contents, and a method and a system for applying encoded multimedia contents are provided to encode a picture into an MAF(Multimedia Application Format) file using picture data, visual characteristic information obtained from picture contents and hint characteristic information for effective picture indexing as meta data. Media data and meta data are separated from multimedia contents. Meta data conforming to a predetermined standard format is generated using the separated meta data. The media data and the meta data conforming to the standard format are encoded to generate an MAF file including a header having information indicating the media data, the meta data and the media data. The meta data conforming to the standard format includes media album meta data.