Abstract:
A device and a method for measuring similarity based on feature of music, and a music recommendation system and method using the same are provided to calculate the similarity in an Internet or digital broadcasting environment based on the feature of the preferred music of a user and recommend the music effectively to the user based on the similarity. A music feature extractor(131) extracts feature information, which is at least one of rhythm or tone feature information, reflecting characteristics of music. A music feature information database(132) stores the extracted feature information in a feature vector row. A similarity calculator(133) calculates similarity between music by comparing a music list(16) extracted based on genre/singer information of the current queried music(14) of a user with the feature information of the current queried music or accumulative feature information of the past queried music. An updater updates the feature information of the current queried music to the accumulative feature information of the past queried music. A music recommender generates and provides a recommendation list in high similarity order depending on a similarity calculation result.
Abstract:
본 발명은 음악 컨텐츠 분류 방법 그리고 이를 이용한 음악 컨텐츠 제공 시스템 및 그 방법에 관한 것이다. 본 발명에서는 음악 컨텐츠들을 클래식, 팝, 블루스, 가곡 등 일반적인 음악적 카테고리에 따라 분류하는 것이 아니고, 음악 컨텐츠간의 유사도를 표현하는 보다 근본적인 방법으로 음악 컨텐츠를 음색(Timbre), 리듬(Rhythm), 무드(Mood) 등으로 분류한다. 그리고 이와 같이 분류된 음악 컨텐츠를 토대로 하여 사용자가 요청한 음악 컨텐츠뿐만 아니라 비슷한 음악적 특징을 가진 음악 컨텐츠들도 함께 제공한다. 이러한 본 발명에 따르면 사용자에게 음악 컨텐츠를 다양하게 제공할 수 있으며, 또한 신뢰성을 가진 유사 음악 컨텐츠를 제공할 수 있다. 음악컨텐츠, 내용기반 음악검색, 유사음악, 유사도, 특징벡터, 벡터양자화
Abstract:
본 발명은 음악 컨텐츠 분류 방법 그리고 이를 이용한 음악 컨텐츠 제공 시스템 및 그 방법에 관한 것이다. 본 발명에서는 음악 컨텐츠들을 클래식, 팝, 블루스, 가곡 등 일반적인 음악적 카테고리에 따라 분류하는 것이 아니고, 음악 컨텐츠간의 유사도를 표현하는 보다 근본적인 방법으로 음악 컨텐츠를 음색(Timbre), 리듬(Rhythm), 무드(Mood) 등으로 분류한다. 그리고 이와 같이 분류된 음악 컨텐츠를 토대로 하여 사용자가 요청한 음악 컨텐츠뿐만 아니라 비슷한 음악적 특징을 가진 음악 컨텐츠들도 함께 제공한다. 이러한 본 발명에 따르면 사용자에게 음악 컨텐츠를 다양하게 제공할 수 있으며, 또한 신뢰성을 가진 유사 음악 컨텐츠를 제공할 수 있다. 음악컨텐츠, 내용기반 음악검색, 유사음악, 유사도, 특징벡터, 벡터양자화
Abstract:
본 발명은 클래스 기반 히스토그램 등화 기법을 이용한 음성인식 시스템 및 방법에 관한 것으로, 음성인식 시스템은 디지털 음성신호를 일정한 시간 간격의 프레임 단위로 분할하고, 프레임마다 음향 특징 파라메터를 추출하는 특징추출기, 특징 파라메터에 대해 클래스별로 히스토그램 등화 기법을 적용한 후 각 클래스 가중치를 곱하여 각 클래스별 특징 보상 성분을 생성하고, 전체 클래스별 특징 보상 성분을 가산하여 음향 불일치가 보상된 특징 파라메터를 구하는 특징보상기 및, 보상된 특징 파라메터로부터 음성인식을 수행하는 음성인식기를 구비한다. 음성인식, 음향 특징 파라메터 보상, 히스토그램 등화, 클래스
Abstract:
PURPOSE: A method for recognizing a speaker and environment adaptive voice of a small-sized mobile terminal is provided to enable a voice recognition server to perform an operation for speaker or environment adaptation, thereby quickly and exactly carrying out the operation without restrictions on hardware performance. CONSTITUTION: A small-sized mobile terminal continuously monitors a change of a speaker or a peripheral environment(S1). The terminal transmits a non-adaptive voice signal to a voice recognition server(S2). The voice recognition server carries out a speaker or environment adaptive operation by using a compensation technique(S3). The voice recognition server quickly sends conversion parameters for adapting to model parameters to the terminal(S4). When a voice is inputted to the terminal, a highly reliable voice recognition performance is guaranteed(S5,S6).
Abstract:
A system and a method for recognizing a voice by using class-based histogram equalization are provided to bring plural classes to a voice characteristic parameter and perform the histogram equalization by class, thereby preventing the performance of the voice recognition system from being deteriorated by effectively reducing sound discordance existing in a sound characteristic parameter. A system for recognizing a voice comprises a characteristic extractor(101), a characteristic corrector(102), and a voice recognizer(103). The characteristic extractor divides a digital voice signal into a frame unit with regular time intervals and extracts a sound characteristic parameter. The characteristic corrector generates characteristic correction components by class by multiplying each class weight after applying histogram equalization to the characteristic parameter, and obtains a characteristic parameter where sound discordance is corrected by adding the entire characteristic correction components by class to the characteristic correction components by class. The voice recognizer performs voice recognition from the corrected characteristic parameter.
Abstract:
A bell sound and/or RBT(Ring Back Tone) generation system of a user preference melody section through real-time music recognition and a method are provided to detect a sound source and an offset position through music recognition if a user inputs a particular melody section of the preferred sound source as an audio query, thereby offering the particular melody section of the sound source as a bell sound and/or an RBT according to the personal preference of a user. An audio query input unit(104) inputs a melody section of particular music selected by a user as an audio query. An audio fingerprint extractor(105) extracts audio fingerprints for a music signal outputted from the input unit(104). A music DB(103) indexes meta data of a lot of music and audio fingerprints to store the indexed data and fingerprints. A music recognition and information searcher(106) recognizes music by matching the extracted audio fingerprints with the stored audio fingerprints, and searches meta information of the recognized music. An offset searcher(107) detects a user's preferred particular melody section from the DB(103) for the recognized music. A bell sound and/or RBT generator(108) generates a bell sound and/or an RBT as the detected particular melody section.
Abstract:
A segment-unit voice/non-voice classification method using a Poisson polling method and an apparatus therefor are provided to classify whether an input signal in a segment interval is a voice or a non-voice accurately and need only a memory of a low calculation quantity and low capacity. A signal input device(100) receives a voice or non-voice signal, and converts the received voice or non-voice signal into a digital signal. A feature extractor(101) classifies the digital signal inputted from the signal input device(100) by a frame unit, and extracts a feature parameter per frame. A score converter(102) receives the feature parameter of the frame unit extracted in the feature extractor(101), compares the received feature parameter with a voice and non-voice pattern, and converts voice or non-voice degree into a score. A score quantizer(103) quantizes the scores obtained in the score converter(102). A voice/non-voice classifier(104) judges whether an input signal is a voice/non-voice per segment on the basis of a Poisson polling method from the score of the frame unit and the quantized scores inputted from the score converter(102) and the score quantizer(103). An output device(105) outputs voice/non-voice information judged in the voice/non-voice classifier(104).
Abstract:
본 발명은 소형 이동 단말기의 음성 인식 방법에 관한 것이다. 소형 이동 단말기의 음성 인식 방법은, 소형의 음성인식기를 내장한 소형 이동 단말기가 화자 또는 환경 변화를 감지하면 주변 환경의 잡음 신호를 수집하거나 화자로부터 정해진 발성을 입력받아 미적응 음성신호로 변환하여 음성인식 서버로 전송하고, 음성인식 서버는 화자 또는 환경 적응 연산을 수행하여 변화된 화자 또는 환경에 적응된 모델 파라미터를 산출하여 단말기로 전송함으로써 소형 이동 단말기는 모델 파라미터를 이용하여 최적의 음성인식 성능을 보장하게 된다. 이와 같이 하면, 화자 적응이나 환경 적응을 위한 연산을 음성인식 서버가 담당하도록 함으로써 하드웨어 성능 제약 없이 빠르고 정확하게 연산을 수행하여 단말기의 음성 인식 성능이나 신뢰도를 향상시킬 수 있다. 소형 이동 단말기, 음성인식기, 음성인식 서버, 화자 또는 환경 적응 연산
Abstract:
본 발명은 개개의 화자식별 결과의 신뢰도 측정 방법에 관한 것으로, 각 프레임의 화자식별 결과에 대한 공헌 정도를 측정하고, 이 각 프레임의 화자식별 공헌도를 기반으로 화자식별 결과의 신뢰도를 측정하고, 이를 화자 진위 판단에 이용함으로써, 화자 검증시에 제시된 화자의 진위를 정확하게 판단하여, 원거리 다채널 환경에서 화자식별의 정확도를 높일 수 있다. 화자식별, 화자식별 결과의 신뢰도, 원거리 다채널 환경, 화자식별 결과 통합.