연속 숫자의 음성 인식에 있어서 혼동행렬과 신뢰도치 기반의 다중 인식후보 생성 장치 및 방법
    61.
    发明授权
    연속 숫자의 음성 인식에 있어서 혼동행렬과 신뢰도치 기반의 다중 인식후보 생성 장치 및 방법 有权
    基于混合矩阵和连续数字语音识别中的置信度度量生成N最优假设的装置和方法

    公开(公告)号:KR101095864B1

    公开(公告)日:2011-12-21

    申请号:KR1020090027532

    申请日:2009-03-31

    Abstract: 본 발명은 연속으로 발성되는 한국어 숫자음성에 대한 음성인식을 수행하여 그 인식 결과에 대해 혼동행렬과 신뢰도 치에 기반하여 다수의 음성인식 후보를 생성하는 기술에 관한 것으로, 혼동행렬은 숫자음성에 대해 오인식이 발생하는 숫자들로 구성되므로, 사전에 실험용 데이터베이스를 사용하여 인식을 수행한다. 또한 음성인식의 결과로 도출되는 숫자별 인식 점수인 통계적 우도를 그 단어의 지속시간 지수인 프레임 수로 나눈 로그 우도비를 신뢰도 치로써 사용하는 것을 특징으로 한다. 본 발명에 의하면, 음성인식 알고리즘에서 성능의 저하 없이 N-best를 생성하기 위해 사용하는 기억장치 사용량과 탐색시간을 절약함으로써 음성인식 엔진의 효율을 높일 수 있다.
    음성인식, 숫자음성, N-best, 신뢰도치, 혼동행렬

    전자책 시스템에서 인터랙티브 컨텐츠 제공 장치 및 방법
    63.
    发明公开
    전자책 시스템에서 인터랙티브 컨텐츠 제공 장치 및 방법 有权
    在电子书系统中提供交互式内容的系统和方法

    公开(公告)号:KR1020110070496A

    公开(公告)日:2011-06-24

    申请号:KR1020090127336

    申请日:2009-12-18

    Abstract: PURPOSE: Interactive contents providing device and method in an e-book system are provided to interactive contents by editing the contents provided from CP. CONSTITUTION: CP(Contents Provider)(102,103) generates and provides the contents. A contents making device(110) creates interactive contents by manufacturing and editing the contents received from the CP. The contents making device provides to the interactive contents to the CP. Terminals(105-108,119) receive the interactive contents from the CP and provide the interactive contents to users. The interactive contents comprise script, object data and scene data.

    Abstract translation: 目的:通过编辑CP提供的内容,将电子书系统中的互动内容提供设备和方法提供给交互式内容。 构成:CP(内容提供者)(102,103)生成并提供内容。 内容制作装置(110)通过制造和编辑从CP接收的内容来创建交互式内容。 内容制作设备提供给CP的交互内容。 终端(105-108,119)从CP接收交互内容,并向用户提供交互式内容。 交互内容包括脚本,对象数据和场景数据。

    음원 분리 방법 및 장치
    64.
    发明公开
    음원 분리 방법 및 장치 无效
    用于分离声音的方法和装置

    公开(公告)号:KR1020110057525A

    公开(公告)日:2011-06-01

    申请号:KR1020090113966

    申请日:2009-11-24

    Abstract: PURPOSE: A device for separating a sound source and a method thereof are provided to extract only a desired sound from various sound sources. CONSTITUTION: An input unit(610) changes the offered signal in to a frequency domain. A processing unit(620) divides the sound source of the converted signal in the frequency band unit. The processing unit aligns the separated sound source through the phase difference of a mixed filter for mixing the sound sources. An output unit(630) changes the aligned sound sources into the time domain.

    Abstract translation: 目的:提供一种用于分离声源的装置及其方法,以从各种声源提取期望的声音。 构成:输入单元(610)将提供的信号改变为频域。 处理单元(620)以频带单位划分转换信号的声源。 处理单元通过用于混合声源的混合滤波器的相位差来对准分离的声源。 输出单元(630)将对准的声源改变为时域。

    비터비 디코더와 이를 이용한 음성 인식 방법
    65.
    发明公开
    비터비 디코더와 이를 이용한 음성 인식 방법 失效
    VITERBI解码器和用于识别语音的方法

    公开(公告)号:KR1020100072838A

    公开(公告)日:2010-07-01

    申请号:KR1020080131365

    申请日:2008-12-22

    CPC classification number: G10L15/08 G10L15/142

    Abstract: PURPOSE: A viterbi decoder and a method for recognizing a voice are provided to prevent the dramatic lowering of an observation probability of a contaminated portion caused by an unintended impulse noise. CONSTITUTION: An optimal state calculator(220) obtains the state of the maximum accumulated similarity in each measurement vector of an observation vector row for the inputted voice. A buffer unit(240) stores an observation probability value for the plural voices inputted prior to the inputted voice. A non-linear filtering unit(250) calculates the observation probability value based on the observation probability value calculated by an observation probability calculator(230). A maximum similarity producer(260) calculates a local maximum similarity value based on the observation probability value.

    Abstract translation: 目的:提供维特比解码器和用于识别语音的方法,以防止由非预期脉冲噪声引起的污染部分的观察概率的显着降低。 构成:最佳状态计算器(220)获得输入语音的观测向量行的每个测量向量中的最大累积相似度的状态。 缓冲单元(240)存储在输入的语音之前输入的多个语音的观察概率值。 非线性滤波单元250基于由观测概率计算器计算出的观测概率值来计算观测概率值。 最大相似度生成器(260)基于观察概率值计算局部最大相似度值。

    잡음 제거 장치 및 방법
    66.
    发明公开
    잡음 제거 장치 및 방법 有权
    减少噪声的方法和装置

    公开(公告)号:KR1020100072751A

    公开(公告)日:2010-07-01

    申请号:KR1020080131243

    申请日:2008-12-22

    Abstract: PURPOSE: A method and an apparatus for reducing noises are provided to reinforce isolation function of voice and noise through voice/noise isolation function like soft masking technique thereby accurately presuming clean voice. CONSTITUTION: A noise estimator(130) presumes noise component within inputted voice signal. A posterior probability estimator(140) presumes posterior probability value from the noise component. A noise parameter adapting unit(150) applies noise Gaussian mixture model to the inputted voice signal. A voice/noise separating unit(160) divides noise and voice signal primarily. A noise removing unit(170) eliminates residual noise components of the voice signal.

    Abstract translation: 目的:提供减少噪声的方法和装置,通过语音/噪声隔离功能(如软掩蔽技术)来加强语音和噪声的隔离功能,从而准确地推断干净的声音。 构成:噪声估计器(130)假设输入的语音信号内的噪声分量。 后验概率估计器(140)假设来自噪声分量的后验概率值。 噪声参数适应单元(150)将噪声高斯混合模型应用于输入的语音信号。 语音/噪声分离单元(160)主要分离噪声和语音信号。 噪声去除单元(170)消除语音信号的残余噪声分量。

    통계적 모델에 기반한 선험적 음성 부재 확률 추정 방법
    67.
    发明授权
    통계적 모델에 기반한 선험적 음성 부재 확률 추정 방법 失效
    基于统计模型的先验SAP估计方法

    公开(公告)号:KR100821177B1

    公开(公告)日:2008-04-14

    申请号:KR1020060095820

    申请日:2006-09-29

    Inventor: 이성주

    CPC classification number: G10L25/78

    Abstract: 선험적 음성 부재 확률은 입력신호로부터 주어진 프레임 인덱스와 주파수 빈(bin) 인텍스에 대하여 음성이 존재하지 않을 확률을 말하는데 과거에는 이를 추정하기가 곤란하여 일반적인 상수(일반적으로 0.5)로 간주하였다.
    그러나, 2002년 이후 이러한 선험적 음성 부재 확률을 추정하고자 하는 노력들이 시작되는데 본 발명에서는 통계적 모델을 이용하여 선험적 음성 부재 확률을 추정하기 위한 새로운 방법을 제안한다.
    즉, 상기 목적을 달성하기 위한 본 발명의 선험적 음성 부재 확률 추정 방법은, 입력되는 음성 데이터의 선험적 음성 부재 확률을, 로컬 파라미터, 글로벌 파라미터 및 평균 파라미터를 이용하여 구하는 방법으로서, 상기 로컬 파라미터 및 글로벌 파라미터는, 제1 문턱값 보다 작은 값에 대한 0 판단과, 제2 문턱값 보다 큰 값에 대한 1 판단과,상기 제1 문턱값 및 제2 문턱값 사이의 값에 대한 라이즈드 코사인 함수 적용에 의해 구해지며, 상기 평균 파라미터는, 로그 스케일의 후험적 신호대잡음비 프레임의 평균에 의해 구해지는 것을 특징으로 한다.
    a priori 음성 부재 확률, 음질향상, 잡음, 선험적, 필터

    인간 청각 모델을 이용한 부가잡음 제거장치
    68.
    发明授权
    인간 청각 모델을 이용한 부가잡음 제거장치 有权
    通过使用人类审计模型来移除附加噪声的装置

    公开(公告)号:KR100565428B1

    公开(公告)日:2006-03-30

    申请号:KR1020030057646

    申请日:2003-08-20

    Inventor: 이성주

    Abstract: 본 발명은 인간 청각 모델을 이용한 부가잡음 제거장치에 관한 것이다. 본 발명의 부가잡음 제거장치는 입력신호 버퍼링 및 프레이밍부와 주파수 스펙트럼 추정부 사이에 인간 청각 모델 적용부가 구비된다. 상기 인간 청각 모델 적용부는 입력된 음성 신호에 대해 자동 이득 제어 과정, 외이 및 중이의 주파수 응답 적용 과정, 미세한 내부 잡음 처리 과정을 각각 수행하여 인간 청각 모델을 상기 음성 신호에 적용시킨다. 따라서, 음성 언어의 신호 성분 중에서 언어를 인지하는데 필요한 신호 성분들이 강조되어 부가잡음이 제거된 음성 신호의 음질을 향상시킬 수 있으며, 특히, 부가잡음 제거의 전처리 과정을 거치는 음성인식 시스템의 경우, 이러한 인간 청각 모델을 고려함으로써 그 성능을 크게 향상시킬 수 있다.
    인간 청각 모델(human auditory model), 음성 인식, 자동 이득 제어, 부가잡음 제거

    대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법
    69.
    发明公开
    대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법 无效
    对话式连续语音识别系统及其端点检测方法

    公开(公告)号:KR1020050049207A

    公开(公告)日:2005-05-25

    申请号:KR1020030083115

    申请日:2003-11-21

    Inventor: 이성주

    Abstract: 본 발명은 대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점 검출방법에 관한 것으로, 상기 대화형 음성인식 시스템의 끝점 검출부, 후처리부, 대화 턴(dialogue turn)검출부의 상호작용을 통하여 대화체 연속 음성인식 시스템의 끝점 검출성능을 높임과 동시에 연속 음성인식 시스템의 응답 지연시간을 최적화하는 것이다.
    이에 따라, 본 발명의 대화형 연속 음성인식 시스템은 음성입력 신호를 음성구간과 비음성 구간으로 구분하여 음성인식 시스템의 불필요한 계산량 부하를 막는 끝점 검출부와, 상기 음성입력 신호로부터 음성인식에 필요한 특징벡터들을 추출하는 특징벡터 추출부와, 상기 특징벡터 추출부에서 추출된 음성의 특징벡터를 기반으로 음성을 인식하는 음성 인식부와, 상기 음성 인식부의 출력정보를 기반으로 음성인식 결과를 검증하는 후처리부 및 상기 후처리부를 통하여 전달된 음성인식 결과를 기반으로 사용자의 의도를 파악하고, 다음 대화를 예측하는 대화 턴 검출부를 포함하여 구성된다.

    자동 음성번역 서비스를 위한 전화망 사용자 인터페이스시스템 및 그 제어 방법
    70.
    发明公开
    자동 음성번역 서비스를 위한 전화망 사용자 인터페이스시스템 및 그 제어 방법 失效
    用于自动语音翻译服务的电话网络用户界面系统及其控制方法

    公开(公告)号:KR1020040056471A

    公开(公告)日:2004-07-01

    申请号:KR1020020082856

    申请日:2002-12-23

    CPC classification number: G06F17/289 G10L15/26

    Abstract: PURPOSE: A phone network user interface system for automatic voice translation service and a control method thereof are provided to implement a multi-language support automatic voice translation service system through wired/wireless telephone network. CONSTITUTION: A telephone network user interface system(20) is connected to a wired/wireless telephone network(10) and also to automatic voice translation service systems(30,40). A wired/wireless telephone network interface(212) processes a call processing-related signal. A user interface(213) supports a service flow previously defined to obtain information required for an automatic voice translation service and information on call connection with the other party. An automatic voice translation service system interface(214) interfaces the telephone network user interface system(20) and the automatic voice translation service systems(30,40). An overall system controller(211) controls the wired/wireless telephone network interface(212), the user interface(213) and the automatic voice translation service system interface(214.).

    Abstract translation: 目的:提供一种用于自动语音翻译服务的电话网络用户界面系统及其控制方法,通过有线/无线电话网络实现多语言支持自动语音翻译服务系统。 构成:电话网络用户接口系统(20)连接到有线/无线电话网络(10),并且连接到自动语音翻译服务系统(30,40)。 有线/无线电话网络接口(212)处理呼叫处理相关信号。 用户界面(213)支持先前定义的服务流,以获得自动语音翻译服务所需的信息和与对方的呼叫连接的信息。 自动语音翻译服务系统接口(214)将电话网络用户接口系统(20)和自动语音翻译服务系统(30,40)接口。 整个系统控制器(211)控制有线/无线电话网络接口(212),用户接口(213)和自动语音翻译服务系统接口(214)。

Patent Agency Ranking