Abstract:
모니터링 장치가 개시된다. 본 모니터링 장치는, 이격된 위치에서 촬영된 복수의 이미지 및 이격된 위치에서 청취된 복수의 음원을 입력받는 입력부, 복수의 이미지 각각에 대한 복수의 모노 돌출맵을 생성하고, 생성된 복수의 모노 돌출맵을 이용하여 동적 돌출맵을 생성하는 돌출맵 생성부, 복수의 음원을 분석하여 음원의 위치를 판단하는 위치 판단부, 생성된 동적 돌출맵 및 판단된 음원 위치를 기초로 복수의 이미지에 대한 경로를 생성하는 시선 경로 인식부 및 생성된 시선 경로를 출력하는 출력부를 포함한다.
Abstract:
시선 경로 제공장치가 개시된다. 본 시선 경로 제공장치는, 이격된 위치에서 촬영된 복수의 이미지 및 이격된 위치에서 청취된 복수의 음원을 입력받는 입력부, 복수의 음원을 분석하여 음원의 위치를 판단하는 위치 판단부, 복수의 이미지 각각에 대한 복수의 모노 돌출맵을 생성하고, 생성된 복수의 모노 돌출맵을 이용하여 동적 돌출맵을 생성하는 돌출맵 생성부, 생성된 동적 돌출맵 및 판단된 음원 위치를 기초로 복수의 이미지에 대한 시선 경로를 생성하는 시선 경로 생성부, 및, 생성된 시선 경로를 출력하는 출력부를 포함한다.
Abstract:
음성 인식 장치가 개시된다. 본 음성 인식 장치는, 사용자를 촬상한 복수의 이미지 및 음원을 입력받는 입력부, 복수의 이미지 각각에서 사용자의 입술 영역을 검출하는 검출부, 복수의 이미지 각각의 검출된 입술 영역에 대한 동적 돌출맵을 생성하는 돌출맵 생성부, 생성된 동적 돌출맵을 이용하여 입술의 움직임 정보를 취득하는 정보 취득부. 취득된 움직임 정보를 기초로 입력된 음원에 대한 음성 인식을 수행하는 음성 인식부, 및, 음성 인식의 결과를 출력하는 출력부를 포함한다.
Abstract:
PURPOSE: A device and method for recognizing a voice are provided to easily recognize the voice with accurately identifying a juncture in which a speaker speaks. CONSTITUTION: A device for recognizing a voice includes an input part (110), a detecting part (150), a saliency map generating part (160), an information obtaining part (170), a voice recognizing part (180), and an output part (120). The input part is inputted with multiple photographed images and sound sources, and a user is included in the photographed images. The detecting part detects the lip regions of a user from the respective images. The saliency map generating part generates dynamic saliency maps for the lip regions. The information obtaining part obtains motion information for a lip using the dynamic saliency maps. The voice recognizing part recognizes a voice for the sound sources based on the motion information for the lip. The output part outputs a result from recognizing the voice. [Reference numerals] (110) Input part; (120) Extracting unit; (130) Storage unit; (140) Location determination unit; (160) Saliency map generating part; (170) Information obtaining part; (180) Voice recognizing part; (190) Control unit; (200) Face detecting unit; (300) Lips detecting unit
Abstract:
PURPOSE: A view path providing apparatus and a view path providing method are provided to consider the dynamic movement of the image and the location of the sound source, at the same time, by the audio visual fusion information, thereby selecting the information with high reliability. CONSTITUTION: An input unit(110) receives an input of a plurality of image which is photographed in the separated position and a plurality of sound source which is listened from the separated location. A location decision unit(140) determines the location of the sound source through the analysis of a plurality of sound source. A protrusion map generator(150) produces a plurality of mono protrusion map about each image and produces the dynamic protrusion maps by using the produced mono protrusion map. A view path generator(160) produces the view path about a plurality of image based on the dynamic protrusion map and the sound source location. [Reference numerals] (110) Input unit; (120) Output unit; (130) Storage unit; (140) Location decision unit; (150) Protrusion map generator; (160) View path generator; (170) Control unit
Abstract:
수광 장치가 개시된다. 본 장치는, 레이저 신호를 수광하는 수광부, 복수의 신호 패턴 별로 대응되는 제어 코드를 저장하고 있는 저장부, 수광된 레이저 신호의 신호 패턴에 대응되는 제어 코드를 상기 저장부로부터 검출하는 제어부, 검출된 제어 코드에 대응되는 제어 신호를 외부 기기로 전송하는 전송부를 포함한다. 이에 따라 여러 개의 리모컨을 통합 관리할 수 있으며 원래부터 리모컨이 없던 전자기기까지 제어할 수 있게 되었다.
Abstract:
A method for providing information of a server apparatus is disclosed. The method for providing the information of the server apparatus comprises the steps of: receiving an image of a user taken; detecting a face of the user in the image; comparing the detected face of the user with stored multiple user faces to recognize the user; and providing the information corresponding to the user which has been recognized.