-
公开(公告)号:KR1020050054378A
公开(公告)日:2005-06-10
申请号:KR1020030087746
申请日:2003-12-04
Applicant: 한국전자통신연구원
IPC: G10L15/02
Abstract: 본 발명은 전화망 환경에서 한국어 연속 숫자음 인식의 성능을 향상시키기 위한 인식 시스템에 관한 것이다. 본 발명에 따른 연속 숫자음 인식 시스템은 화자에 의해 발성된 음성 신호를 입력받아 음성 구간을 결정하고, 상기 결정된 음성 구간으로부터 특징 벡터를 추출하는 전처리부; 다중 음향 모델을 이용하여 상기 전처리부에서 얻어진 특징 벡터에 대해 1차적으로 디코딩을 수행하고, 상기 1차 디코딩 결과를 이용하여 인식 대상 어휘 및 음향 모델을 재구성하며, 상기 재구성된 인식 대상 어휘 및 음향 모델을 이용하여 상기 1차 디코딩된 특징 벡터에 대해 2차 디코딩을 수행하는 인식부; 및, 상기 인식부에서 출력된 디코딩 결과에 대해 음소/단어 모델과 반음소/반단어 모델을 적용하여 해당 발성을 검증하는 후처리부를 포함하는 것을 특징으로 한다.
-
公开(公告)号:KR1020050038223A
公开(公告)日:2005-04-27
申请号:KR1020030073460
申请日:2003-10-21
Applicant: 한국전자통신연구원
IPC: G06F17/40
Abstract: 본 발명은 온라인 음성검증 기반의 음성 데이터베이스 구축방법에 관한 것으로, 발화자가 발성한 음성데이터와 발성 목록에 저장된 데이터의 전사를 온라인으로 자동 검증하여 정확하고 신속한 음성 데이터베이스를 구축하는 것이다.
본 발명은 온라인 음성검증 기반의 음성 데이터베이스 구축방법에 있어서, 상기 온라인 음성 데이터베이스 구축에 필요한 발성 목록 및 음향 모델을 생성하는 전처리 단계, 상기 전처리 단계에 의해 생성된 발성 목록 및 음향 모델을 사용하여 온라인으로 발성된 데이터를 검증하고, 상기 데이터베이스 구축에 필요한 정보를 자동 생성하는 온라인 음성 데이터베이스 수집/검증 단계, 상기 음성 데이터베이스 수집/검증 단계에서 오류로 분류한 데이터를 검증하는 후처리 단계로 이루어진다.-
公开(公告)号:KR1020030042286A
公开(公告)日:2003-05-28
申请号:KR1020010073007
申请日:2001-11-22
Applicant: 한국전자통신연구원
IPC: G10L15/20
CPC classification number: G10L25/78
Abstract: PURPOSE: A method for detecting a voice signal in noise environment and an apparatus thereof are provided to find out the voice signal without errors by using a basis function trained by an independent component analysis. CONSTITUTION: A mike signal(302) including a voice is inputted. A generation coefficient is estimated from the mike signal. A likelihood value is calculated from the estimated generation coefficient and a basis function. Judging information I is calculated from a likelihood value of a voice signal and a likelihood value of a noise signal. A voice beginning point judging unit(304) judges a voice beginning point from the judging information. When the voice begins, the mike signal is inputted to a voice recognizer(305). A generation coefficient is estimated from the voice signal to detect a voice ending point. A likelihood value is calculated from the estimated generation coefficient and the basis function. Judging information II is calculated from the likelihood value of the voice signal and the likelihood value of the noise signal. A voice ending point judging unit(306) judges a voice ending point.
Abstract translation: 目的:提供一种用于检测噪声环境中的语音信号的方法及其装置,其通过使用由独立分量分析训练的基函数来无误地发现语音信号。 构成:输入包含声音的麦克风信号(302)。 从麦克信号估计发电系数。 从估计的生成系数和基函数计算似然值。 判断信息I是根据语音信号的似然值和噪声信号的似然值计算的。 声音开始点判断单元(304)根据判断信息判断语音开始点。 当语音开始时,麦克风信号被输入到语音识别器(305)。 从语音信号估计发生系数,以检测语音终点。 从估计的生成系数和基函数计算似然值。 根据语音信号的似然值和噪声信号的似然值计算判断信息II。 语音结束点判断单元(306)判断语音结束点。
-
-
公开(公告)号:KR101756287B1
公开(公告)日:2017-07-26
申请号:KR1020130077494
申请日:2013-07-03
Applicant: 한국전자통신연구원
IPC: G10L15/02
CPC classification number: G10L15/02
Abstract: 본발명에따른, 음성인식을위한특징추출장치는, 입력되는음성신호를소정사이즈의프레임단위로분리하는프레임형성부; 상기음성신호의각 프레임별로정적특징벡터를추출하는정적특징추출부; 기저함수또는기저벡터를이용하여, 상기추출된정적특징벡터의시간에따른변화를나타내는동적특징벡터를추출하는동적특징추출부; 및상기추출된정적특징벡터와동적특징벡터를결합하여특징벡터스트림을구성하는특징벡터결합부를포함한다.
Abstract translation: 根据本发明,提供了一种用于语音识别的特征提取装置,包括:帧形成单元,用于将输入语音信号分离成预定大小的帧; 静态特征提取单元,用于为语音信号的每帧提取静态特征向量; 动态特征提取单元,用于使用基函数或基矢量来提取指示所提取的静态特征向量随时间的变化的动态特征向量; 以及特征向量组合单元,其将提取的静态特征向量和动态特征向量组合以构建特征向量流。
-
公开(公告)号:KR101735313B1
公开(公告)日:2017-05-16
申请号:KR1020130092573
申请日:2013-08-05
Applicant: 한국전자통신연구원
IPC: G10L21/0272
Abstract: 실시예는, 음성신호및 잡음신호를포함하는음원신호에암묵디콘볼루션(blind deconvolution)을수행하여상기음원신호에서상기잡음신호를제거하여상기음성신호를출력하는잡음제거부; 상기잡음제거부로부터수신되는음성신호를기반으로상기잡음제거부의임펄스응답(impulse response)을획득하는임펄스응답획득부; 및상기임펄스응답을시간에대해역방향으로적용하여상기음성신호의위상왜곡을보상하는위상보상부를포함하는음원분리장치를제공한다.
-
公开(公告)号:KR1020160000218A
公开(公告)日:2016-01-04
申请号:KR1020140077326
申请日:2014-06-24
Applicant: 한국전자통신연구원
IPC: G10L15/183
CPC classification number: G10L15/183 , G10L15/14
Abstract: 언어모델군집화기반음성인식장치및 그방법이개시된다. 본발명의일 면에따른언어모델군집화기반음성인식방법은입력되는음성데이터에대하여제1 언어모델을이용하여음성인식을수행함으로써, 제1 엔베스트후보리스트를출력하는단계; 상기제1 엔베스트후보리스트중 어느하나의인식후보를이용하여각각의언어모델군집에대한믹스쳐웨이트값을결정하는단계; 상기믹스쳐웨이트값에기반하여각각의언어모델군집을인터폴레이션하는단계; 및각각의언어모델군집이인터폴레이션된결과를이용하여상기제1 엔베스트후보리스트를리스코어링하는단계를포함한다.
Abstract translation: 公开了一种基于语言模型聚类识别声音的装置和方法。 根据本发明的一个方面的用于识别基于语言模型聚类的声音的方法包括以下步骤:通过使用用于输入声音数据的第一语言模型执行声音识别来输出第一N最佳候选列表; 通过使用来自所述第一N最佳候选列表的任何一个识别候选来确定每个语言模型簇的混合权重值; 基于混合权重值内插每个语言模型集群; 并且通过使用其中插入每个语言模型簇的结果来重新获取第一N个最佳候选列表。
-
公开(公告)号:KR1020150016745A
公开(公告)日:2015-02-13
申请号:KR1020130092573
申请日:2013-08-05
Applicant: 한국전자통신연구원
IPC: G10L21/0272
CPC classification number: G10L21/0272 , G10L21/0208 , G10L2021/02087
Abstract: 실시 예는, 음성신호 및 잡음신호를 포함하는 음원신호 입력시, 상기 음원신호를 1초 간격으로 나누어 블록 처리하는 음성신호 블록화부, 상기 음원 신호를 기반으로 암묵 디콘볼루션(blind convolution)을 수행하여 상기 잡음신호가 제거된 상기 음성신호를 출력하는 잡음제거부, 상기 음성신호를 기반으로 상기 잡음제거부의 임펄스 응답(impulse response)을 확득하는 임펄스 응답 획득부 및 상기 임펄스 응답을 시간에 대한 역방향으로 적용하여 상기 음성신호의 위상왜곡을 보상하는 위상보상부;를 포함하는 음원분리장치를 제공한다.
Abstract translation: 一个实施例提供了一种声源分离装置,包括:语音信号阻挡单元,其在输入包括语音信号和噪声信号的声源信号时,将声源信号除以一秒间隔,并执行其处理; 噪声去除单元,其基于所述声源信号执行盲卷积处理,并输出除去所述噪声信号的所述语音信号; 脉冲响应获取单元,其基于所述语音信号获得所述噪声去除单元的脉冲响应; 以及相位补偿单元,通过在时间上以相反方向施加脉冲响应来补偿语音信号的相位失真。 声源分离装置可以在消除声源信号中的噪声信号并分离语音信号的过程中补偿语音信号的相位失真。
-
公开(公告)号:KR1020140147586A
公开(公告)日:2014-12-30
申请号:KR1020130071141
申请日:2013-06-20
Applicant: 한국전자통신연구원
IPC: H04B1/38
CPC classification number: H04M1/7253 , G04G21/04 , G06F1/163 , H04B1/385 , H04B2001/3861 , H04M1/57
Abstract: Provided is a smart watch which includes a first smart member which receives a voice signal transmitted from a mobile terminal in a call mode operation, changes an inputted user voice into a user voice signal, and transmits it to the mobile terminal, and a second smart member which inputs a control command for the call mode operation to the first smart member, and changes the voice signal inputted from the first smart member into a voice and outputs it.
Abstract translation: 提供了一种智能手表,其包括在呼叫模式操作中接收从移动终端发送的语音信号的第一智能构件,将输入的用户语音改变为用户语音信号,并将其发送到移动终端,并且将第二智能手机 向第一智能构件输入用于呼叫模式操作的控制命令的成员,并且将从第一智能构件输入的语音信号改变为语音并将其输出。
-
公开(公告)号:KR1020140135349A
公开(公告)日:2014-11-26
申请号:KR1020130055421
申请日:2013-05-16
Applicant: 한국전자통신연구원
Abstract: 배경의 잡음이 다양하게 변하는 원거리 음성인식 환경에서 여러 개의 마이크로폰을 분산시켜 사용자 음성에 반응하는 마이크로폰들을 선택하여 음성인식 성능을 개선하도록 하는 복수의 마이크로폰을 이용한 비동기 음성인식 장치 및 방법을 제시한다. 제시된 장치는 사용자의 주변에 분산된 복수의 마이크로폰중에서 사용자의 음성에 반응하는 두 개 이상의 마이크로폰을 선택하는 마이크로폰 선택부, 선택된 두 개 이상의 마이크로폰의 입력의 신호대 잡음비를 측정하는 신호대 잡음비 측정부, 선택된 두 개 이상의 마이크로폰중에서 신호대 잡음비가 가장 큰 마이크로폰의 입력으로 음성 인식을 수행하고, 나머지 마이크로폰의 입력으로 음성 인식에 대한 검증을 수행하는 음성 인식 및 검증부, 및 음성 인식 및 검증부의 결과를 근거로 사용자의 음성에 대한 최종 인식결과를 출력하는 최종 인식결과 출력부를 포함한다.
Abstract translation: 本发明提供了一种使用多个麦克风进行异步语音识别的装置和方法,其通过分布多个麦克风并且响应于用户的语音来选择麦克风来提高语音识别性能,该远程语音识别环境中的背景噪声在各种 方法。 本发明提供的装置包括:麦克风选择部,其选择响应用户周围的多个麦克风响应于用户的语音的两个或更多麦克风; 信噪比测量部分,其测量所选择的两个或更多麦克风的输入的信噪比; 语音识别和验证部分,通过使用所选择的两个或多个麦克风中具有最大信噪比的麦克风的输入来执行语音识别,并且通过使用其余麦克风的输入来验证语音识别; 以及最终识别结果输出部分,其基于语音识别和验证部分的结果输出用户的语音的最终识别结果。
-
-
-
-
-
-
-
-
-