화자 인식 결과의 이력을 이용한 화자 인식 방법 및 장치
    2.
    发明公开
    화자 인식 결과의 이력을 이용한 화자 인식 방법 및 장치 无效
    使用扬声器识别结果历史的扬声器识别装置和方法

    公开(公告)号:KR1020080066394A

    公开(公告)日:2008-07-16

    申请号:KR1020070003798

    申请日:2007-01-12

    Abstract: An apparatus and a method for recognizing a speaker are provided to improve the accuracy in recognition of the speaker by using the reliabilities of speaker voices, which are received in the past. A reference voice database stores reference voices, which correspond to voices of one or more users registered, while the reference voices are matched to the users. A voice reception unit receives a voice of a speaker. A voice feature extraction unit extracts one or more features for speaker-recognition from the received voice. A reliability measurement unit measures the similarity between the extracted features of the received voice and each of the reference voices, thereby obtaining the reliability of voice, which represents a possibility that the speaker corresponds each of the users. A reliability database stores the measured reliability for each of the users. A weight computation unit computes respective weight values for a series of reliabilities stored in the reliability database, according to a predetermined rule. A weight appliance unit applies the computed weight values to the reliabilities, respectively. A determination unit determines whether the received voice is identical to one of the reference voices by calculating an average of the reliabilities to which the weight values are respectively applied and comparing the average with the reliability of the received voice.

    Abstract translation: 提供用于识别扬声器的装置和方法,以通过使用过去接收到的扬声器声音的可靠性来提高扬声器识别的准确性。 参考语音数据库存储与登记的一个或多个用户的语音相对应的参考语音,同时参考语音与用户匹配。 语音接收单元接收扬声器的声音。 语音特征提取单元从接收到的语音中提取用于说话者识别的一个或多个特征。 可靠性测量单元测量所接收的语音的提取特征与每个参考语音之间的相似度,从而获得语音的可靠性,其表示说话者对应每个用户的可能性。 可靠性数据库存储每个用户的测量可靠性。 权重计算单元根据预定规则计算存储在可靠性数据库中的一系列可靠性的相应权重值。 权重装置单元分别将计算的权重值应用于可靠性。 确定单元通过计算分别应用权重值的可靠性的平均值并将平均值与接收到的语音的可靠性进行比较来确定接收到的语音是否与参考语音之一相同。

    정규화된 스펙트럼 부밴드 중심점에 기반한 핑거프린트생성 방법 및 오디오 핑거프린팅 시스템
    3.
    发明公开
    정규화된 스펙트럼 부밴드 중심점에 기반한 핑거프린트생성 방법 및 오디오 핑거프린팅 시스템 有权
    基于归一化频谱子带中心点的指纹生成方法和音频指纹识别系统

    公开(公告)号:KR1020070031765A

    公开(公告)日:2007-03-20

    申请号:KR1020050086557

    申请日:2005-09-15

    CPC classification number: G06F17/30743 G11B27/28

    Abstract: 본 발명은 정규화된 스펙트럼 부밴드 중심점(Normalized Spectral Subband Centroid; NSSC)을 기반으로 핑거프린트를 생성하는 방법과, 미지의 오디오 신호가 입력으로 주어졌을 때, 이를 이미 구축되어 있는 대용량 오디오 데이터베이스에서 검색하여 입력 오디오 신호에 대한 정보를 출력해 주기 위한 오디오 핑거프린팅 시스템에 대한 것이다. 오디오 핑거프린팅 시스템은 사용된 핑거프린트에 의해 그 성능이 크게 좌우된다. 본 발명의 NSSC 핑거프린트는 오디오 신호의 특징을 잘 나타내어 인식에 사용하기 적합하면서도 오디오 신호에 가해질 수 있는 여러 가지 왜곡들, 예를 들어 MP3 압축, 이퀄라이제이션(equalization) 등에 매우 강인하며, 대용량 데이터베이스 구축과 실시간 검색에도 유리한 장점을 가지고 있다. 실험 결과에 따르면, 본 발명에 의한 시스템은 기존의 오디오 핑거프린팅 시스템에 비해 향상된 성능을 보인다. 본 발명은 인터넷 상의 오디오 불법 유통을 막기 위한 실시간 필터링 서비스, 대용량 오디오 데이터베이스의 자동 인덱싱(indexing), 그리고 방송 모니터링 등에 응용될 수 있다.
    핑거프린트, 정규화된 스펙트럼 부밴드 중심점, 오디오, MP3

    Abstract translation: 本发明涉及基于归一化频谱子带质心(NSSC)生成指纹的方法以及当未知音频信号作为输入给出时搜索已经建立的大型音频数据库的方法 以及用于输出关于输入音频信号的信息的音频指纹识别系统。 音频指纹识别系统的性能在很大程度上取决于使用的指纹。 本发明的NSSC指纹对于可以应用于诸如MP3压缩,均衡等的音频信号的各种失真非常健壮, 它在实时搜索中具有有利的优势。 根据实验结果,与传统的音频指纹识别系统相比,根据本发明的系统显示出改进的性能。 本发明可以应用于防止因特网上的音频非法流通,大容量音频数据库的自动索引和广播监视的实时过滤服务。

    멀티미디어 인식 장치 및 방법
    4.
    发明授权
    멀티미디어 인식 장치 및 방법 失效
    用于实现多媒体的装置和方法

    公开(公告)号:KR101094896B1

    公开(公告)日:2011-12-15

    申请号:KR1020100013886

    申请日:2010-02-16

    Abstract: 본 발명은 입력 영상의 각 프레임에서 핑거프린트를 추출하고, 상기 추출된 핑거프린트를 이용하여 상기 영상을 분절 단위로 나누는 영상 분절부, 상기 나누어진 각 분절을 노드로 설정하고, 각 노드의 관측변수와 숨겨진 변수를 설정하여 마르코프 랜덤 필드(MRF)를 구축하는 마르코프 랜덤 필드 구축부, 상기 구축된 마르코프 랜덤 필드의 확률 값을 최대화시키는 숨겨진 변수값 을 추정하는 변수값 추정부, 상기 추정된 숨겨진 변수값을 이용하여 각 분절이 속하는 영상 및 그 영상에서의 위치를 인식하는 영상 인식부로 구성되어, 화질 저하, 손실 압축은 물론 속도 변화가 있는 멀티미디어 및 편집이 가해진 멀티미디어를 인식할 수 있다.

    고차원 이진 데이터 검색 장치 및 방법
    5.
    发明授权
    고차원 이진 데이터 검색 장치 및 방법 失效
    高维二进制数据搜索的装置与方法

    公开(公告)号:KR101081459B1

    公开(公告)日:2011-11-08

    申请号:KR1020100013892

    申请日:2010-02-16

    Inventor: 유창동 진민호

    Abstract: 본발명은입력정보를분석하여실수벡터를추출하는실수벡터추출부, 상기추출된실수벡터에양자화기법을적용하여이진데이터로변환하는이진화부, 상기변환된이진데이터의신뢰도를구하고, 그신뢰도를기반으로하나이상의후보점을생성하는후보점생성부, 상기생성된후보점중에서최근접데이터를선택하는검색부로구성되어, 이진데이터를추출하는과정에서손실되는정보를양자비트로표현하고, 이러한양자비트표현에서신뢰도를계산함으로써검색에수반되는연산량을줄이며정확도를향상시키는효과가있다.

    멀티미디어 인식 장치 및 방법
    6.
    发明公开
    멀티미디어 인식 장치 및 방법 失效
    用于实现多媒体的装置和方法

    公开(公告)号:KR1020110094487A

    公开(公告)日:2011-08-24

    申请号:KR1020100013886

    申请日:2010-02-16

    Abstract: PURPOSE: An apparatus and method for realizing multimedia content is provided to recognize a multimedia content with a video quality deterioration, a compression loss, a speed variation, or an editing added. CONSTITUTION: An image segment unit(300) extracts a finger print in each frame of an input image. The image segments unit divides the image into the segment unit using the extracted fingerprint. A Markov random field constructing unit(310) establishes the divided each segment as a node. The Markov random field constructing unit constructs an MRF(Markov Random Field) by establishing the observation variable and the hidden variable of each node. A variable value estimation unit(320) assumes the hidden variable for maximizing the probability value of the constructed Markov random field.

    Abstract translation: 目的:提供一种用于实现多媒体内容的装置和方法,用于识别具有视频质量恶化,压缩丢失,速度变化或添加的编辑的多媒体内容。 构成:图像段单元(300)在输入图像的每一帧中提取指纹。 图像段单元使用提取的指纹将图像分割成段单元。 马尔可夫随机场构造单元(310)将划分的每个段建立为节点。 马尔可夫随机场构造单元通过建立观测变量和每个节点的隐藏变量构建MRF(马尔可夫随机场)。 可变值估计单元(320)假设用于使构造的马尔科夫随机场的概率值最大化的隐藏变量。

    정규화된 스펙트럼 부밴드 중심점에 기반한 핑거프린트생성 방법 및 오디오 핑거프린팅 시스템
    7.
    发明授权
    정규화된 스펙트럼 부밴드 중심점에 기반한 핑거프린트생성 방법 및 오디오 핑거프린팅 시스템 有权
    基于归一化频谱子带质心的指纹产生方法和音频指纹系统

    公开(公告)号:KR100733145B1

    公开(公告)日:2007-06-27

    申请号:KR1020050086557

    申请日:2005-09-15

    Abstract: 본 발명은 정규화된 스펙트럼 부밴드 중심점(Normalized Spectral Subband Centroid; NSSC)을 기반으로 핑거프린트를 생성하는 방법과, 미지의 오디오 신호가 입력으로 주어졌을 때, 이를 이미 구축되어 있는 대용량 오디오 데이터베이스에서 검색하여 입력 오디오 신호에 대한 정보를 출력해 주기 위한 오디오 핑거프린팅 시스템에 대한 것이다. 오디오 핑거프린팅 시스템은 사용된 핑거프린트에 의해 그 성능이 크게 좌우된다. 본 발명의 NSSC 핑거프린트는 오디오 신호의 특징을 잘 나타내어 인식에 사용하기 적합하면서도 오디오 신호에 가해질 수 있는 여러 가지 왜곡들, 예를 들어 MP3 압축, 이퀄라이제이션(equalization) 등에 매우 강인하며, 대용량 데이터베이스 구축과 실시간 검색에도 유리한 장점을 가지고 있다. 실험 결과에 따르면, 본 발명에 의한 시스템은 기존의 오디오 핑거프린팅 시스템에 비해 향상된 성능을 보인다. 본 발명은 인터넷 상의 오디오 불법 유통을 막기 위한 실시간 필터링 서비스, 대용량 오디오 데이터베이스의 자동 인덱싱(indexing), 그리고 방송 모니터링 등에 응용될 수 있다.
    핑거프린트, 정규화된 스펙트럼 부밴드 중심점, 오디오, MP3

    고차원 이진 데이터 검색 장치 및 방법
    8.
    发明公开
    고차원 이진 데이터 검색 장치 및 방법 失效
    用于高维二进制数据搜索的装置和方法

    公开(公告)号:KR1020110094490A

    公开(公告)日:2011-08-24

    申请号:KR1020100013892

    申请日:2010-02-16

    Inventor: 유창동 진민호

    CPC classification number: G06F17/30495 G06F17/16

    Abstract: PURPOSE: A higher-order electronic magazine data searching device and method thereof are provided to improve accuracy and reduce calculation amount. CONSTITUTION: A real number vector extractor(300) extracts a real number vector by analyzing input information. A binary part(310) is applied to the quantum scheme and converts the real number vector into a binary data. A candidate generating unit(320) generates a candidate point based on the reliability. A searching unit selects the closest data based on non-similarity between the candidate point and the binary data. The candidate generating unit generates the candidate point by selecting the binary data based on the reliability per bit about the binary data.

    Abstract translation: 目的:提供高级电子杂志数据搜索装置及其方法,以提高精度并减少计算量。 构成:实数向量提取器(300)通过分析输入信息提取实数向量。 将二进制部分(310)应用于量子方案,并将实数向量转换为二进制数据。 候选生成单元(320)基于可靠性生成候补点。 搜索单元基于候选点和二进制数据之间的非相似性来选择最接近的数据。 候选生成单元通过基于关于二进制数据的每位的可靠性选择二进制数据来生成候选点。

    양자 해싱에 기초한 멀티미디어 핑거프린트 생성 방법 및 그 시스템
    9.
    发明公开
    양자 해싱에 기초한 멀티미디어 핑거프린트 생성 방법 및 그 시스템 有权
    多媒体指纹生产方法和系统基于量子冲击

    公开(公告)号:KR1020100094296A

    公开(公告)日:2010-08-26

    申请号:KR1020090020416

    申请日:2009-03-10

    Inventor: 진민호 유창동

    Abstract: PURPOSE: A multimedia fingerprint producing method based on quantum hashing, and a system thereof are provided to generate a multimedia fingerprint robust to the compression or distortion regardless of a multimedia environment. CONSTITUTION: A fingerprint extractor(20) extracts a fingerprint of quantum hashing format from an inputted multimedia file. A database(40) stores a fingerprint of binary format. A database searcher(30) calculates the similarity of binary fingerprint stored in a database with the extracted finger print. A fingerprint matcher(50) selects and outputs data having a fingerprint which has the highest similarity.

    Abstract translation: 目的:提供一种基于量子散列的多媒体指纹制作方法及其系统,以产生无论多媒体环境如何,对于压缩或失真而言都能保持鲁棒的多媒体指纹。 规定:指纹提取器(20)从输入的多媒体文件中提取量子散列格式的指纹。 数据库(40)存储二进制格式的指纹。 数据库搜索器(30)计算存储在数据库中的二进制指纹与所提取的指纹的相似度。 指纹匹配器(50)选择并输出具有最高相似度的指纹的数据。

Patent Agency Ranking