Abstract:
본 발명은 양자 해싱에 기초한 멀티미디어 핑거프린트 생성 방법 및 그 시스템에 관한 것으로, 멀티미디어 파일을 입력받는 단계와; 입력된 멀티미디어 파일에서 양자 해시 형태의 핑거프린트를 추출하는 단계와; 입력에서 추출한 양자 해시 핑거프린트와 데이터베이스에 존재하는 바이너리 핑거프린트의 유사도를 계산하는 단계; 및 계산 결과 유사도가 가장 높은 핑거프린트를 가지는 데이터를 선택하는 단계를 포함하는 것을 특징으로 한다. 멀티미디어, 핑거프린트, 생성, 양자, 해시, 큐빗
Abstract:
An apparatus and a method for recognizing a speaker are provided to improve the accuracy in recognition of the speaker by using the reliabilities of speaker voices, which are received in the past. A reference voice database stores reference voices, which correspond to voices of one or more users registered, while the reference voices are matched to the users. A voice reception unit receives a voice of a speaker. A voice feature extraction unit extracts one or more features for speaker-recognition from the received voice. A reliability measurement unit measures the similarity between the extracted features of the received voice and each of the reference voices, thereby obtaining the reliability of voice, which represents a possibility that the speaker corresponds each of the users. A reliability database stores the measured reliability for each of the users. A weight computation unit computes respective weight values for a series of reliabilities stored in the reliability database, according to a predetermined rule. A weight appliance unit applies the computed weight values to the reliabilities, respectively. A determination unit determines whether the received voice is identical to one of the reference voices by calculating an average of the reliabilities to which the weight values are respectively applied and comparing the average with the reliability of the received voice.
Abstract:
본 발명은 정규화된 스펙트럼 부밴드 중심점(Normalized Spectral Subband Centroid; NSSC)을 기반으로 핑거프린트를 생성하는 방법과, 미지의 오디오 신호가 입력으로 주어졌을 때, 이를 이미 구축되어 있는 대용량 오디오 데이터베이스에서 검색하여 입력 오디오 신호에 대한 정보를 출력해 주기 위한 오디오 핑거프린팅 시스템에 대한 것이다. 오디오 핑거프린팅 시스템은 사용된 핑거프린트에 의해 그 성능이 크게 좌우된다. 본 발명의 NSSC 핑거프린트는 오디오 신호의 특징을 잘 나타내어 인식에 사용하기 적합하면서도 오디오 신호에 가해질 수 있는 여러 가지 왜곡들, 예를 들어 MP3 압축, 이퀄라이제이션(equalization) 등에 매우 강인하며, 대용량 데이터베이스 구축과 실시간 검색에도 유리한 장점을 가지고 있다. 실험 결과에 따르면, 본 발명에 의한 시스템은 기존의 오디오 핑거프린팅 시스템에 비해 향상된 성능을 보인다. 본 발명은 인터넷 상의 오디오 불법 유통을 막기 위한 실시간 필터링 서비스, 대용량 오디오 데이터베이스의 자동 인덱싱(indexing), 그리고 방송 모니터링 등에 응용될 수 있다. 핑거프린트, 정규화된 스펙트럼 부밴드 중심점, 오디오, MP3
Abstract:
본 발명은 입력 영상의 각 프레임에서 핑거프린트를 추출하고, 상기 추출된 핑거프린트를 이용하여 상기 영상을 분절 단위로 나누는 영상 분절부, 상기 나누어진 각 분절을 노드로 설정하고, 각 노드의 관측변수와 숨겨진 변수를 설정하여 마르코프 랜덤 필드(MRF)를 구축하는 마르코프 랜덤 필드 구축부, 상기 구축된 마르코프 랜덤 필드의 확률 값을 최대화시키는 숨겨진 변수값 을 추정하는 변수값 추정부, 상기 추정된 숨겨진 변수값을 이용하여 각 분절이 속하는 영상 및 그 영상에서의 위치를 인식하는 영상 인식부로 구성되어, 화질 저하, 손실 압축은 물론 속도 변화가 있는 멀티미디어 및 편집이 가해진 멀티미디어를 인식할 수 있다.
Abstract:
PURPOSE: An apparatus and method for realizing multimedia content is provided to recognize a multimedia content with a video quality deterioration, a compression loss, a speed variation, or an editing added. CONSTITUTION: An image segment unit(300) extracts a finger print in each frame of an input image. The image segments unit divides the image into the segment unit using the extracted fingerprint. A Markov random field constructing unit(310) establishes the divided each segment as a node. The Markov random field constructing unit constructs an MRF(Markov Random Field) by establishing the observation variable and the hidden variable of each node. A variable value estimation unit(320) assumes the hidden variable for maximizing the probability value of the constructed Markov random field.
Abstract:
본 발명은 정규화된 스펙트럼 부밴드 중심점(Normalized Spectral Subband Centroid; NSSC)을 기반으로 핑거프린트를 생성하는 방법과, 미지의 오디오 신호가 입력으로 주어졌을 때, 이를 이미 구축되어 있는 대용량 오디오 데이터베이스에서 검색하여 입력 오디오 신호에 대한 정보를 출력해 주기 위한 오디오 핑거프린팅 시스템에 대한 것이다. 오디오 핑거프린팅 시스템은 사용된 핑거프린트에 의해 그 성능이 크게 좌우된다. 본 발명의 NSSC 핑거프린트는 오디오 신호의 특징을 잘 나타내어 인식에 사용하기 적합하면서도 오디오 신호에 가해질 수 있는 여러 가지 왜곡들, 예를 들어 MP3 압축, 이퀄라이제이션(equalization) 등에 매우 강인하며, 대용량 데이터베이스 구축과 실시간 검색에도 유리한 장점을 가지고 있다. 실험 결과에 따르면, 본 발명에 의한 시스템은 기존의 오디오 핑거프린팅 시스템에 비해 향상된 성능을 보인다. 본 발명은 인터넷 상의 오디오 불법 유통을 막기 위한 실시간 필터링 서비스, 대용량 오디오 데이터베이스의 자동 인덱싱(indexing), 그리고 방송 모니터링 등에 응용될 수 있다. 핑거프린트, 정규화된 스펙트럼 부밴드 중심점, 오디오, MP3
Abstract:
PURPOSE: A higher-order electronic magazine data searching device and method thereof are provided to improve accuracy and reduce calculation amount. CONSTITUTION: A real number vector extractor(300) extracts a real number vector by analyzing input information. A binary part(310) is applied to the quantum scheme and converts the real number vector into a binary data. A candidate generating unit(320) generates a candidate point based on the reliability. A searching unit selects the closest data based on non-similarity between the candidate point and the binary data. The candidate generating unit generates the candidate point by selecting the binary data based on the reliability per bit about the binary data.
Abstract:
PURPOSE: A multimedia fingerprint producing method based on quantum hashing, and a system thereof are provided to generate a multimedia fingerprint robust to the compression or distortion regardless of a multimedia environment. CONSTITUTION: A fingerprint extractor(20) extracts a fingerprint of quantum hashing format from an inputted multimedia file. A database(40) stores a fingerprint of binary format. A database searcher(30) calculates the similarity of binary fingerprint stored in a database with the extracted finger print. A fingerprint matcher(50) selects and outputs data having a fingerprint which has the highest similarity.