클러스터 기반 손실 특징 복원 알고리즘을 위한 마스크 추정 방법 및 장치
    43.
    发明公开
    클러스터 기반 손실 특징 복원 알고리즘을 위한 마스크 추정 방법 및 장치 有权
    基于群集丢失特征重构的掩蔽估计方法和设备

    公开(公告)号:KR1020150026634A

    公开(公告)日:2015-03-11

    申请号:KR1020130105728

    申请日:2013-09-03

    Abstract: 본 발명에 따르는 클러스터 기반 손실 특징 복원 알고리즘을 위한 마스크 추정 방법은, 관찰신호를 입력받아 관심음원을 검출하는 단계; 상기 관찰신호와 상기 관심음원을 제공받아 주파수별 SIR을 산출하는 단계; 상기 주파수별 SIR를 토대로 주파수마다 상이한 문턱값을 가지는 이진 마스크를 추정하는 단계;를 구비함을 특징으로 한다.

    Abstract translation: 根据本发明,用于基于簇的丢失特征恢复算法的掩模估计方法包括:接收观测信号的输入并检测感兴趣的声源的步骤; 接收观测信号和感兴趣的声源并按频率计算SIR的步骤; 以及基于所述SIR频率来估计针对每个频率具有不同阈值的二进制掩码的步骤。

    3차원 기하정보를 이용한 음성 인식 방법 및 이를 이용한 음성 인식 시스템
    44.
    发明公开
    3차원 기하정보를 이용한 음성 인식 방법 및 이를 이용한 음성 인식 시스템 有权
    语音识别系统和使用3D几何信息的方法

    公开(公告)号:KR1020140100743A

    公开(公告)日:2014-08-18

    申请号:KR1020130013854

    申请日:2013-02-07

    CPC classification number: G10L15/063 G10L15/24

    Abstract: The present invention relates to a method and a system for recognizing a voice using three-dimensional geometry information. The voice recognition system comprises a learning module and a recognizing module. The learning module generates a recognition unit using three-dimensional geometry information for study and three-dimensional features for study extracted from the information. The recognizing module applies the three-dimensional geometry information acquired from a physical target related or belonged to a voice or three-dimensional features extracted from the geometry information to the recognition unit, and conducts voice recognition. The method and the system for recognizing a voice according to the present invention, recognizes a voice using three-dimensional geometry information on lips, a part around the lips, or one or more arbitrary regions of a human body in speech. Also, final voice recognition is conducted by combining two-dimensional features and sound features, and three-dimensional features and sound features in speech, and by combining recognition result of the two-dimensional features or sound features, or recognition result of the three-dimensional geometry information or three-dimensional features in speech. Therefore, the accuracy of voice recognition is improved.

    Abstract translation: 本发明涉及使用三维几何信息识别语音的方法和系统。 语音识别系统包括学习模块和识别模块。 学习模块使用三维几何信息生成识别单元,用于学习和从信息中提取的三维特征。 识别模块将从与几何信息提取的语音或三维特征相关或属于的物理目标获取的三维几何信息应用于识别单元,并进行语音识别。 根据本发明的用于识别语音的方法和系统使用在嘴唇上的三维几何信息,嘴唇周围的一部分或人体的一个或多个任意区域来识别声音。 此外,通过组合二维特征和声音特征,语音中的三维特征和声音特征,以及通过组合二维特征或声音特征的识别结果或三维特征或声音特征的识别结果来进行最终语音识别, 立体几何信息或言语中的三维特征。 因此,提高了语音识别的准确性。

    사운드 신호를 기반으로 한 반주제공방법 및 이를 이용한 반주제공장치
    45.
    发明授权
    사운드 신호를 기반으로 한 반주제공방법 및 이를 이용한 반주제공장치 有权
    基于旋律声信号的自动播放系统

    公开(公告)号:KR101361033B1

    公开(公告)日:2014-02-11

    申请号:KR1020120029237

    申请日:2012-03-22

    Inventor: 박형민 정일영

    Abstract: 본 발명은 외부의 사운드 신호를 기반으로 한 반주 제공 장치에 관한 것이다. 상기 반주 제공 장치는 외부의 입력 장치로부터 사운드 신호가 입력되는 신호 입력부; 다수 개의 음원들에 대한 정보가 저장된 음원 데이터베이스; 상기 신호 입력부로부터 사운드 신호가 제공되면, 사전 설정된 시간 간격의프레임으로 분할하고 각 프레임에 대한 멜로디를 추출하는 멜로디 추출부; 상기 멜로디 추출부에 의해 추출된 각 프레임에 대한 멜로디를 반음계로 변환시키는 반음계 변환부; 상기 신호 입력부로부터 사운드 신호가 제공되면, 각 프레임에 대한 온셋 정보를 검출하여 제공하는 온셋 검출부; 상기 반음계 변환부로부터 각 프레임에 대한 반음 정보를 수신하고, 상기 온셋 검출부로부터 각 프레임에 대한 온셋 정보를 수신하며, 상기 온셋 정보를 이용하여 사운드 신호의 시작 프레임을 검출하고, 상기 사운드 신호의 시작 프레임부터 일정시간동안 기본 주파수에 해당하는 멜로디 시퀀스를 추정하여 제공하는 멜로디 시퀀스 추정부; 상기 멜로디 시퀀스 추정부에 의해 추정된 멜로디 시퀀스와 상기 음원 데이터베이스의 음원들의 멜로디 시퀀스를 비교하여 상기 사운드 신호의 멜로디 시퀀스와 가장 유사한 멜로디 시퀀스를 갖는 유사 음원을 검색하는 음원 선택부; 상기 사운드 신호의 음정과 박자에 따라 유사 음원에 대한 반주를 보정하여 출력하는 반주 보정부와 반주 출력부;를 구비한다.

    단일채널 음성신호에 대한 반향신호 제거방법 및 이를 이용한 음성인식장치
    46.
    发明授权
    단일채널 음성신호에 대한 반향신호 제거방법 및 이를 이용한 음성인식장치 有权
    使用方法对单声道语音和语音识别装置进行解码的方法

    公开(公告)号:KR101334991B1

    公开(公告)日:2013-12-02

    申请号:KR1020120067873

    申请日:2012-06-25

    Inventor: 박형민 정일영

    CPC classification number: G10L21/0208 G10L15/28

    Abstract: A reverberated signal removal method according to the present invention is characterized by estimating a reverberation filter from a reverberated voice signal in a single channel inputted through a single microphone and then estimating a clean voice signal in which the reverberated signal is removed. To do so, considering a case where the reverberated voice signal has an excellent sparseness characteristic, a magnitude spectrum is used to expand the sparseness difference between the clean voice signal and the reverberated voice signal. Also, a cost function is determined considering general characteristics that the spectral components of a voice signal have frequency dependency on each other. Moreover, the method according to the present invention is characterized by estimating the original voice signal and a reverberation filter considering that the power spectrum of a reverberation filter has an envelope in which the amplitude of a signal exponentially declines against a time variable. [Reference numerals] (AA) Start;(BB) End;(S100) Input a voice signal in which the original voice signal and a reverberation filter are synthesized;(S110) Transform the voice signal into short-time fourier;(S120) Determine a cost function considering the voice signal, the original voice signal, and the reverberation filter;(S130) Estimate the original voice signal and the reverberation filter by repeating the cost function;(S140) Correct the cost function;(S150) Re-estimate the original signal again by repeatedly applying the estimated reverberation filter to the corrected cost function

    Abstract translation: 根据本发明的混响信号去除方法的特征在于,通过单个麦克风输入的单个信道中的混响语音信号估计混响滤波器,然后估计去除了混响信号的干净的语音信号。 为此,考虑到混响语音信号具有优异的稀疏特性的情况,使用幅度谱来扩大干净语音信号和混响语音信号之间的稀疏差。 此外,考虑到语音信号的频谱分量彼此具有频率依赖性的一般特性来确定成本函数。 此外,根据本发明的方法的特征在于,考虑到混响滤波器的功率谱具有信号的幅度与时间变量指数下降的包络线,估计原始语音信号和混响滤波器。 (AA)开始;(BB)结束;(S100)输入合成原始语音信号和混响滤波器的语音信号;(S110)将语音信号变换成短时间;(S120) 考虑语音信号,原始语音信号和混响滤波器,确定成本函数;(S130)重复成本函数估算原始语音信号和混响滤波器;(S140)校正成本函数;(S150) 通过将估计的混响滤波器重复地应用于校正成本函数来再次估计原始信号

    잡음 제거 장치 및 방법
    47.
    发明公开
    잡음 제거 장치 및 방법 审中-实审
    用于消除噪音的装置和方法

    公开(公告)号:KR1020130126318A

    公开(公告)日:2013-11-20

    申请号:KR1020120050356

    申请日:2012-05-11

    CPC classification number: G10L21/0208 G10L19/02

    Abstract: The present invention relates to a noise removing device and a method thereof, more specifically, to a noise removing device and a method thereof for speech recognition. The present invention is a device for removing input signal noise and comprises a target signal extraction part extracting a first target signal from the input signals; a target signal removing part extracting a first noise signal from the input signals by using a second separation vector; a detection part extracting speech section information of the first target signal; and a first noise removing part calculating a weighted value from the first noise signal by using the speech section information and removing the noise from the first target signal by using the weighted value. [Reference numerals] (101) Target signal extraction part;(103) Target signal removing part;(105) Detection unit;(107) First noise removing part;(109) Second noise removing part;(111) Sound recognition unit

    Abstract translation: 噪声去除装置及其方法技术领域本发明涉及噪声消除装置及其方法,更具体地,涉及用于语音识别的噪声去除装置及其方法。 本发明是一种用于去除输入信号噪声的装置,包括从输入信号提取第一目标信号的目标信号提取部分; 目标信号去除部分,通过使用第二分离矢量从所述输入信号提取第一噪声信号; 提取第一目标信号的语音部分信息的检测部分; 以及第一噪声去除部分,通过使用语音部分信息从第一噪声信号计算加权值,并通过使用加权值从第一目标信号中去除噪声。 (101)目标信号提取部;(103)目标信号去除部;(105)检测部;(107)第一噪声消除部;(109)第二噪声去除部;(111)声音识别单元

    사운드 신호를 기반으로 한 반주제공방법 및 이를 이용한 반주제공장치
    48.
    发明公开
    사운드 신호를 기반으로 한 반주제공방법 및 이를 이용한 반주제공장치 有权
    基于MELODY SOUND SIGNAL的自动回放系统

    公开(公告)号:KR1020130107451A

    公开(公告)日:2013-10-02

    申请号:KR1020120029237

    申请日:2012-03-22

    Inventor: 박형민 정일영

    CPC classification number: G10H1/361 G10H2240/141

    Abstract: PURPOSE: An accompaniment providing method and an accompaniment providing system using the same are provided to provide an accompaniment which fits for the intonation and rhythm of a user by extracting a melody from a sound and searching the most similar sound source. CONSTITUTION: A sound signal is inputted from an external input unit to a signal input unit (105). Information about multiple sound sources is stored in a sound source database. A melody extracting unit (110) divides a melody into preset time interval frames. The melody extracting unit extracts a melody about each frame. A chromatic scale converting unit (120) converts the melody about each frame which is extracted by the melody extracting unit into a chromatic scale. An onset detecting unit detects and provides onset information about each frame. [Reference numerals] (100) Sound source database; (105) Signal input unit; (110) Melody extracting unit; (120) Chromatic scale converting unit; (130) Onset extracting unit; (140) Melody sequence estimating unit; (150) Similar sound source selecting unit; (160) Accompaniment correction unit; (170) Accompaniment output unit

    Abstract translation: 目的:提供伴奏提供方法和使用其的伴奏提供系统,以通过从声音提取旋律并搜索最相似的声源来提供适合用户的语调和节奏的伴奏。 构成:声音信号从外部输入单元输入到信号输入单元(105)。 有关多个声源的信息存储在声源数据库中。 旋律提取单元(110)将旋律分成预设的时间间隔帧。 旋律提取单元提取关于每个帧的旋律。 色度刻度转换单元(120)将由旋律提取单元提取的每个帧的旋律转换成色标。 起始检测单元检测并提供关于每个帧的发作信息。 (附图标记)(100)声源数据库; (105)信号输入单元; (110)旋律提取单元; (120)色标变换单元; (130)启动提取单元; (140)旋律序列估计单元; (150)相似的声源选择单元; (160)伴奏矫正单位; (170)伴奏输出单位

    관심음원 제거방법 및 그에 따른 음성인식방법
    49.
    发明授权
    관심음원 제거방법 및 그에 따른 음성인식방법 有权
    感兴趣的音源消除方法及其语音识别方法

    公开(公告)号:KR101305373B1

    公开(公告)日:2013-09-06

    申请号:KR1020110136285

    申请日:2011-12-16

    Inventor: 박형민 오명우

    Abstract: 본 발명에 따르는 관심음원 제거방법은, 두 개의 마이크 각각으로부터의 입력 혼합신호를 제공받아 단구간 푸리에 변환하여 시간-주파수 영역으로 변환하는 단계; 상기 시간-주파수 영역의 입력 혼합신호들로부터 관심음원을 제거하기 위한 관심음원제거 벡터를 설정하는 단계; 상기 관심음원제거 벡터를 이용하여 입력 혼합신호에서 관심음원을 제거하여 혼합된 잡음신호를 생성하는 단계;를 구비함을 특징으로 한다.

    Abstract translation: 提供了一种感兴趣的音频源消除方法,使用感兴趣的音频源消除方法的语音识别方法,用于实现该方法的计算机可读记录介质记录程序,以及通过使用感兴趣的音频源消除方法来执行语音识别的语音识别装置 。 感兴趣的音频源消除方法包括以下步骤:从两个麦克风接收输入混合信号,并通过短期傅里叶变换将信号转换成时频域; 设置感兴趣的音频源消除矢量,用于从时频域中的输入混合信号中消除感兴趣的音频源信号; 以及通过使用感兴趣的音频源消除矢量从输入的混合信号中消除感兴趣的音频源信号来产生混合噪声信号。

    신호의 시간 지연 및 감쇄 추정에 기반한 반향 환경에서의 암묵 음원 분리 방법
    50.
    发明授权
    신호의 시간 지연 및 감쇄 추정에 기반한 반향 환경에서의 암묵 음원 분리 방법 有权
    基于时间延迟和信号衰减的估计,混响环境中的盲源分离方法

    公开(公告)号:KR101243897B1

    公开(公告)日:2013-03-20

    申请号:KR1020110061697

    申请日:2011-06-24

    Abstract: 본 발명에 따르는 신호의 시간 지연 및 감쇄 추정에 기반한 반향 환경에서의 암묵 음원 분리 방법은, 본 발명의 암묵 음원 분리 방법은, 둘 이상의 마이크로부터의 혼합신호들을 입력받는 단계; 상기 혼합신호들을 STFT(Short Time Fourier Transform)하여 시간-주파수 영역의 혼합신호들로 변환하는 단계; STFT된 혼합신호들에 대해, 주파수별 감쇄 및 시간 지연 값에 대한 초기화를 수행하고, 초기화된 주파수별 감쇄 및 시간 지연 값이 수렴되도록 학습시키고, 학습된 주파수별 감쇄 및 시간 지연 값을 토대로 주파수별 이진 마스크를 생성하고, 상기 주파수별 이진 마스크를 이용하여 주파수별로 신호를 분리하고, 상기 주파수별로 분리된 신호들에 대해 상관 계수를 구하여 주파수별로 분리된 신호들에 대한 순서를 맞추는 단계; 상기 순서가 맞춰진 신호들을 ISTFT(Inverse Short Time Fourier Transform)하여 시간 영역의 음원 신호들로 복원하는 단계;를 구비한다.

Patent Agency Ranking