음악 특성 기반 유사도 측정 장치 및 그 방법과 그를이용한 음악 추천 시스템 및 그 방법
    1.
    发明公开
    음악 특성 기반 유사도 측정 장치 및 그 방법과 그를이용한 음악 추천 시스템 및 그 방법 无效
    基于音乐特征和音乐推荐系统的乐器测量装置和方法及其使用方法

    公开(公告)号:KR1020080082022A

    公开(公告)日:2008-09-11

    申请号:KR1020070011725

    申请日:2007-02-05

    CPC classification number: G06F17/30761 G06F17/30749

    Abstract: A device and a method for measuring similarity based on feature of music, and a music recommendation system and method using the same are provided to calculate the similarity in an Internet or digital broadcasting environment based on the feature of the preferred music of a user and recommend the music effectively to the user based on the similarity. A music feature extractor(131) extracts feature information, which is at least one of rhythm or tone feature information, reflecting characteristics of music. A music feature information database(132) stores the extracted feature information in a feature vector row. A similarity calculator(133) calculates similarity between music by comparing a music list(16) extracted based on genre/singer information of the current queried music(14) of a user with the feature information of the current queried music or accumulative feature information of the past queried music. An updater updates the feature information of the current queried music to the accumulative feature information of the past queried music. A music recommender generates and provides a recommendation list in high similarity order depending on a similarity calculation result.

    Abstract translation: 提供了一种基于音乐特征来测量相似度的装置和方法,并且提供了使用该装置和音乐推荐系统和方法的方法,以基于用户的首选音乐的特征来计算因特网或数字广播环境中的相似度,并推荐 基于相似性,音乐有效地向用户提供。 音乐特征提取器(131)提取特征信息,其是节奏或音调特征信息中的至少一个,其反映音乐的特征。 音乐特征信息数据库(132)将所提取的特征信息存储在特征向量行中。 相似度计算器(133)通过将根据用户的当前查询音乐(14)的类型/歌手信息提取的音乐列表(16)与当前查询音乐的特征信息或累积特征信息 过去的查询音乐。 更新者将当前查询的音乐的特征信息更新为过去查询的音乐的累积特征信息。 音乐推荐器根据相似度计算结果产生并以高相似性顺序提供推荐列表。

    음악 컨텐츠 분류 방법 그리고 이를 이용한 음악 컨텐츠 제공 시스템 및 그 방법
    2.
    发明授权
    음악 컨텐츠 분류 방법 그리고 이를 이용한 음악 컨텐츠 제공 시스템 및 그 방법 失效
    音乐内容分类方法,以及使用分类方法提供音乐内容的系统和方法

    公开(公告)号:KR100615522B1

    公开(公告)日:2006-08-25

    申请号:KR1020050011668

    申请日:2005-02-11

    Abstract: 본 발명은 음악 컨텐츠 분류 방법 그리고 이를 이용한 음악 컨텐츠 제공 시스템 및 그 방법에 관한 것이다.
    본 발명에서는 음악 컨텐츠들을 클래식, 팝, 블루스, 가곡 등 일반적인 음악적 카테고리에 따라 분류하는 것이 아니고, 음악 컨텐츠간의 유사도를 표현하는 보다 근본적인 방법으로 음악 컨텐츠를 음색(Timbre), 리듬(Rhythm), 무드(Mood) 등으로 분류한다. 그리고 이와 같이 분류된 음악 컨텐츠를 토대로 하여 사용자가 요청한 음악 컨텐츠뿐만 아니라 비슷한 음악적 특징을 가진 음악 컨텐츠들도 함께 제공한다.
    이러한 본 발명에 따르면 사용자에게 음악 컨텐츠를 다양하게 제공할 수 있으며, 또한 신뢰성을 가진 유사 음악 컨텐츠를 제공할 수 있다.
    음악컨텐츠, 내용기반 음악검색, 유사음악, 유사도, 특징벡터, 벡터양자화

    음악 컨텐츠 분류 방법 그리고 이를 이용한 음악 컨텐츠 제공 시스템 및 그 방법
    3.
    发明公开
    음악 컨텐츠 분류 방법 그리고 이를 이용한 음악 컨텐츠 제공 시스템 및 그 방법 失效
    音乐内容分类方法,以及使用分类方法提供音乐内容的系统和方法

    公开(公告)号:KR1020060091063A

    公开(公告)日:2006-08-18

    申请号:KR1020050011668

    申请日:2005-02-11

    CPC classification number: G10L25/27 G06F17/30755 G06Q50/10 G10H2210/036

    Abstract: 본 발명은 음악 컨텐츠 분류 방법 그리고 이를 이용한 음악 컨텐츠 제공 시스템 및 그 방법에 관한 것이다.
    본 발명에서는 음악 컨텐츠들을 클래식, 팝, 블루스, 가곡 등 일반적인 음악적 카테고리에 따라 분류하는 것이 아니고, 음악 컨텐츠간의 유사도를 표현하는 보다 근본적인 방법으로 음악 컨텐츠를 음색(Timbre), 리듬(Rhythm), 무드(Mood) 등으로 분류한다. 그리고 이와 같이 분류된 음악 컨텐츠를 토대로 하여 사용자가 요청한 음악 컨텐츠뿐만 아니라 비슷한 음악적 특징을 가진 음악 컨텐츠들도 함께 제공한다.
    이러한 본 발명에 따르면 사용자에게 음악 컨텐츠를 다양하게 제공할 수 있으며, 또한 신뢰성을 가진 유사 음악 컨텐츠를 제공할 수 있다.
    음악컨텐츠, 내용기반 음악검색, 유사음악, 유사도, 특징벡터, 벡터양자화

    클래스 기반 히스토그램 등화 기법을 이용한 음성인식시스템 및 방법
    4.
    发明授权
    클래스 기반 히스토그램 등화 기법을 이용한 음성인식시스템 및 방법 失效
    使用基于类的直方图均衡的语音识别系统和方法

    公开(公告)号:KR100808775B1

    公开(公告)日:2008-03-07

    申请号:KR1020060070305

    申请日:2006-07-26

    Abstract: 본 발명은 클래스 기반 히스토그램 등화 기법을 이용한 음성인식 시스템 및 방법에 관한 것으로, 음성인식 시스템은 디지털 음성신호를 일정한 시간 간격의 프레임 단위로 분할하고, 프레임마다 음향 특징 파라메터를 추출하는 특징추출기, 특징 파라메터에 대해 클래스별로 히스토그램 등화 기법을 적용한 후 각 클래스 가중치를 곱하여 각 클래스별 특징 보상 성분을 생성하고, 전체 클래스별 특징 보상 성분을 가산하여 음향 불일치가 보상된 특징 파라메터를 구하는 특징보상기 및, 보상된 특징 파라메터로부터 음성인식을 수행하는 음성인식기를 구비한다.
    음성인식, 음향 특징 파라메터 보상, 히스토그램 등화, 클래스

    소형 이동 단말기의 화자 및 환경적응 음성 인식 방법
    5.
    发明公开
    소형 이동 단말기의 화자 및 환경적응 음성 인식 방법 失效
    用于识别小型移动终端的扬声器和环境自适应语音的方法,特别是通过使用模型参数来保证最佳语音识别性能

    公开(公告)号:KR1020050021392A

    公开(公告)日:2005-03-07

    申请号:KR1020050003877

    申请日:2005-01-14

    Inventor: 김회린 지미경

    Abstract: PURPOSE: A method for recognizing a speaker and environment adaptive voice of a small-sized mobile terminal is provided to enable a voice recognition server to perform an operation for speaker or environment adaptation, thereby quickly and exactly carrying out the operation without restrictions on hardware performance. CONSTITUTION: A small-sized mobile terminal continuously monitors a change of a speaker or a peripheral environment(S1). The terminal transmits a non-adaptive voice signal to a voice recognition server(S2). The voice recognition server carries out a speaker or environment adaptive operation by using a compensation technique(S3). The voice recognition server quickly sends conversion parameters for adapting to model parameters to the terminal(S4). When a voice is inputted to the terminal, a highly reliable voice recognition performance is guaranteed(S5,S6).

    Abstract translation: 目的:提供一种用于识别小型移动终端的扬声器和环境自适应语音的方法,以使得语音识别服务器能够对扬声器或环境适配执行操作,从而快速准确地执行操作而不限制硬件性能 。 规定:小型移动终端持续监控扬声器或周边环境的变化(S1)。 终端向语音识别服务器发送非自适应语音信号(S2)。 语音识别服务器通过使用补偿技术来执行扬声器或环境自适应操作(S3)。 语音识别服务器快速向终端发送适应模型参数的转换参数(S4)。 当向终端输入语音时,保证了高度可靠的语音识别性能(S5,S6)。

    클래스 기반 히스토그램 등화 기법을 이용한 음성인식시스템 및 방법
    6.
    发明公开
    클래스 기반 히스토그램 등화 기법을 이용한 음성인식시스템 및 방법 失效
    使用基于类的组织均衡的语音识别的系统和方法

    公开(公告)号:KR1020080010167A

    公开(公告)日:2008-01-30

    申请号:KR1020060070305

    申请日:2006-07-26

    Abstract: A system and a method for recognizing a voice by using class-based histogram equalization are provided to bring plural classes to a voice characteristic parameter and perform the histogram equalization by class, thereby preventing the performance of the voice recognition system from being deteriorated by effectively reducing sound discordance existing in a sound characteristic parameter. A system for recognizing a voice comprises a characteristic extractor(101), a characteristic corrector(102), and a voice recognizer(103). The characteristic extractor divides a digital voice signal into a frame unit with regular time intervals and extracts a sound characteristic parameter. The characteristic corrector generates characteristic correction components by class by multiplying each class weight after applying histogram equalization to the characteristic parameter, and obtains a characteristic parameter where sound discordance is corrected by adding the entire characteristic correction components by class to the characteristic correction components by class. The voice recognizer performs voice recognition from the corrected characteristic parameter.

    Abstract translation: 提供一种通过使用基于类的直方图均衡来识别语音的系统和方法,以使多个等级成为语音特征参数,并且按类进行直方图均衡,从而通过有效地减少语音识别系统的性能而不会恶化 声音特征参数中存在声音不一致。 用于识别语音的系统包括特征提取器(101),特征校正器(102)和语音识别器(103)。 特征提取器将数字语音信号以规则的时间间隔划分成帧单元并提取声音特性参数。 特征校正器通过将直方图均衡后的每个等级权重与特征参数相乘来生成特征校正分量,并且通过将类别的整个特征校正分量通过类别添加到特征校正分量中来获得校正声音不一致的特性参数。 语音识别器从校正的特征参数执行语音识别。

    실시간 음악 인식을 통한 사용자 선호 멜로디 구간의벨소리 및/또는 컬러링 생성 시스템 및 방법
    7.
    发明授权
    실시간 음악 인식을 통한 사용자 선호 멜로디 구간의벨소리 및/또는 컬러링 생성 시스템 및 방법 失效
    基于用户偏好的音调部分通过实时音乐识别产生铃音/铃声的系统和方法

    公开(公告)号:KR100774708B1

    公开(公告)日:2007-11-08

    申请号:KR1020060066766

    申请日:2006-07-18

    CPC classification number: G06F17/30743 H04M3/42017

    Abstract: A bell sound and/or RBT(Ring Back Tone) generation system of a user preference melody section through real-time music recognition and a method are provided to detect a sound source and an offset position through music recognition if a user inputs a particular melody section of the preferred sound source as an audio query, thereby offering the particular melody section of the sound source as a bell sound and/or an RBT according to the personal preference of a user. An audio query input unit(104) inputs a melody section of particular music selected by a user as an audio query. An audio fingerprint extractor(105) extracts audio fingerprints for a music signal outputted from the input unit(104). A music DB(103) indexes meta data of a lot of music and audio fingerprints to store the indexed data and fingerprints. A music recognition and information searcher(106) recognizes music by matching the extracted audio fingerprints with the stored audio fingerprints, and searches meta information of the recognized music. An offset searcher(107) detects a user's preferred particular melody section from the DB(103) for the recognized music. A bell sound and/or RBT generator(108) generates a bell sound and/or an RBT as the detected particular melody section.

    Abstract translation: 提供通过实时音乐识别的用户偏好旋律部分的铃声和/或RBT(回铃音)生成系统,以及如果用户输入特定旋律,通过音乐识别来检测声源和偏移位置 作为音频查询的优选声源的部分,从而根据用户的个人喜好将声源的特定旋律部分提供为铃声和/或RBT。 音频查询输入单元(104)输入由用户选择的特定音乐的旋律部分作为音频查询。 音频指纹提取器(105)提取用于从输入单元(104)输出的音乐信号的音频指纹。 音乐DB(103)索引许多音乐和音频指纹的元数据以存储索引的数据和指纹。 音乐识别和信息搜索器(106)通过将所提取的音频指纹与存储的音频指纹进行匹配来识别音乐,并且搜索识别的音乐的元信息。 偏移搜索器(107)从DB(103)中检测出用于所识别的音乐的用户优选的特定旋律部分。 钟声和/或RBT发生器(108)产生铃声和/或RBT作为检测到的特定旋律部分。

    포아송 폴링 기법을 이용한 세그먼트 단위의 음성/비음성분류 방법 및 장치
    8.
    发明授权
    포아송 폴링 기법을 이용한 세그먼트 단위의 음성/비음성분류 방법 및 장치 失效
    使用POISSON抛光技术的分段级语音/非专业分类设备和方法

    公开(公告)号:KR100774800B1

    公开(公告)日:2007-11-07

    申请号:KR1020060085461

    申请日:2006-09-06

    Abstract: A segment-unit voice/non-voice classification method using a Poisson polling method and an apparatus therefor are provided to classify whether an input signal in a segment interval is a voice or a non-voice accurately and need only a memory of a low calculation quantity and low capacity. A signal input device(100) receives a voice or non-voice signal, and converts the received voice or non-voice signal into a digital signal. A feature extractor(101) classifies the digital signal inputted from the signal input device(100) by a frame unit, and extracts a feature parameter per frame. A score converter(102) receives the feature parameter of the frame unit extracted in the feature extractor(101), compares the received feature parameter with a voice and non-voice pattern, and converts voice or non-voice degree into a score. A score quantizer(103) quantizes the scores obtained in the score converter(102). A voice/non-voice classifier(104) judges whether an input signal is a voice/non-voice per segment on the basis of a Poisson polling method from the score of the frame unit and the quantized scores inputted from the score converter(102) and the score quantizer(103). An output device(105) outputs voice/non-voice information judged in the voice/non-voice classifier(104).

    Abstract translation: 提供一种使用泊松轮询方法的分段单元语音/非语音分类方法及其装置,用于分类段间隔中的输入信号是语音还是非语音,并且仅需要低计算的存储器 数量少,容量低。 信号输入装置(100)接收语音或非话音信号,并将接收到的语音或非话音信号转换为数字信号。 特征提取器(101)将从信号输入装置(100)输入的数字信号分类为帧单位,并且提取每帧的特征参数。 分数转换器(102)接收在特征提取器(101)中提取的帧单元的特征参数,将接收的特征参数与语音和非语音模式进行比较,并将语音或非语音程度转换为分数。 得分量化器(103)对得分转换器(102)中获得的得分进行量化。 语音/非语音分类器(104)基于来自帧单位的分数的泊松轮询方法和从分数转换器(102)输入的量化分数来判断输入信号是每个分段的语音/非语音 )和分数量化器(103)。 输出设备(105)输出在语音/非语音分类器(104)中判断的语音/非语音信息。

    소형 이동 단말기의 화자 및 환경적응 음성 인식 방법
    9.
    发明授权
    소형 이동 단말기의 화자 및 환경적응 음성 인식 방법 失效
    基于扬声器的语音识别方法和移动设备中的环境适应

    公开(公告)号:KR100676084B1

    公开(公告)日:2007-01-31

    申请号:KR1020050003877

    申请日:2005-01-14

    Inventor: 김회린 지미경

    Abstract: 본 발명은 소형 이동 단말기의 음성 인식 방법에 관한 것이다. 소형 이동 단말기의 음성 인식 방법은, 소형의 음성인식기를 내장한 소형 이동 단말기가 화자 또는 환경 변화를 감지하면 주변 환경의 잡음 신호를 수집하거나 화자로부터 정해진 발성을 입력받아 미적응 음성신호로 변환하여 음성인식 서버로 전송하고, 음성인식 서버는 화자 또는 환경 적응 연산을 수행하여 변화된 화자 또는 환경에 적응된 모델 파라미터를 산출하여 단말기로 전송함으로써 소형 이동 단말기는 모델 파라미터를 이용하여 최적의 음성인식 성능을 보장하게 된다.
    이와 같이 하면, 화자 적응이나 환경 적응을 위한 연산을 음성인식 서버가 담당하도록 함으로써 하드웨어 성능 제약 없이 빠르고 정확하게 연산을 수행하여 단말기의 음성 인식 성능이나 신뢰도를 향상시킬 수 있다.
    소형 이동 단말기, 음성인식기, 음성인식 서버, 화자 또는 환경 적응 연산

    다채널 화자 식별 시스템 및 다채널 화자 식별 방법
    10.
    发明授权
    다채널 화자 식별 시스템 및 다채널 화자 식별 방법 失效
    多声道扬声器识别系统和多声道扬声器识别方法

    公开(公告)号:KR101059892B1

    公开(公告)日:2011-08-29

    申请号:KR1020080114116

    申请日:2008-11-17

    Abstract: 본 발명은 개개의 화자식별 결과의 신뢰도 측정 방법에 관한 것으로, 각 프레임의 화자식별 결과에 대한 공헌 정도를 측정하고, 이 각 프레임의 화자식별 공헌도를 기반으로 화자식별 결과의 신뢰도를 측정하고, 이를 화자 진위 판단에 이용함으로써, 화자 검증시에 제시된 화자의 진위를 정확하게 판단하여, 원거리 다채널 환경에서 화자식별의 정확도를 높일 수 있다.
    화자식별, 화자식별 결과의 신뢰도, 원거리 다채널 환경, 화자식별 결과 통합.

    Abstract translation: 本发明测量测量的程度基于每个帧结果的扬声器识别的贡献以促进与所述个体说话者识别结果的可靠性测量方法的每个帧的说话者识别结果,识别所述说话者的可靠性,它 可以准确地确定在验证讲话者时呈现的讲话者的真实性,从而提高远程多信道环境中讲话者识别的准确性。

Patent Agency Ranking