음성 인식 장치 및 방법
    21.
    发明授权
    음성 인식 장치 및 방법 失效
    用于识别语音的装置和方法

    公开(公告)号:KR100664960B1

    公开(公告)日:2007-01-04

    申请号:KR1020050094068

    申请日:2005-10-06

    CPC classification number: G10L15/142

    Abstract: A voice recognition apparatus and a method thereof are provided to calculate a hidden Markov model state representing a characteristic parameter of a predetermined unit of a voice by using single waveform probability distribution to obtain a score and calculate a state having a high score using multi-waveform probability distribution to produce a score. A voice recognition apparatus includes a characteristic vector extractor(330), an expected node extractor(350), a single waveform similarity calculator(315), a multi-waveform similarity calculator(320), and an output unit(340). The characteristic vector extractor splits an input voice signal into unit regions and extracts characteristic vectors corresponding to the unit regions. The expected node extractor extracts a list of second nodes which are expected to move to first nodes corresponding to the characteristic vectors with reference to a predetermined network composed of at least one node. The single waveform similarity calculator substitutes the characteristic vectors for single waveform probability distribution constructing a voice signal corresponding to the second nodes to obtain single waveform similarities between the first nodes and the second nodes of the list. The multi-waveform similarity calculator substitutes the characteristic vectors for multi-waveform probability distribution constructing single waveform probability distribution which produces single waveform similarity included in a predetermined range among the single waveform similarities to produce multi-waveform similarities. The output unit outputs a function execution signal corresponding to multi-waveform probability distribution which produces the highest value among the multi-waveform similarities.

    Abstract translation: 提供一种语音识别装置及其方法,通过使用单波形概率分布来计算表示声音的预定单位的特征参数的隐马尔可夫模型状态,以获得分数并使用多波形计算具有高分数的状态 概率分布产生得分。 语音识别装置包括特征向量提取器(330),预期节点提取器(350),单个波形相似度计算器(315),多波形相似度计算器(320)和输出单元(340)。 特征向量提取器将输入的语音信号分离成单位区域,并提取与单位区域对应的特征向量。 参考由至少一个节点组成的预定网络,期望节点提取器提取期望移动到与特征向量对应的第一节点的第二节点的列表。 单波形相似度计算器代替构成与第二节点对应的语音信号的单波形概率分布的特征向量,以获得列表的第一节点和第二节点之间的单波形相似度。 多波形相似度计算器将构成单波形概率分布的多波形概率分布的特征向量代入单波形相似度中产生预定范围内的单一波形相似度,产生多波形相似度。 输出单元输出对应于在多波形相似度中产生最高值的多波形概率分布的功能执行信号。

    서브 렉시컬 노드 생성 장치, 이를 이용한 음성 인식 장치및 방법
    22.
    发明公开
    서브 렉시컬 노드 생성 장치, 이를 이용한 음성 인식 장치및 방법 有权
    SUB LEXICAL NODE GENERATOR,装置和方法利用SUB LEXICAL NODE发生器识别LEXICON

    公开(公告)号:KR1020060091076A

    公开(公告)日:2006-08-18

    申请号:KR1020050011700

    申请日:2005-02-11

    Abstract: 본 발명은 음성 인식에서의 탐색망 구축에 필요한 메모리를 감축시킬 수 있는 서브 렉시컬 노드 생성 장치, 이를 이용한 음성 인식 장치 및 방법에 관한 것이다.
    본 발명의 실시예에 따른 서브 렉시컬 노드 생성 장치를 이용한 음성 인식 장치는 인식 대상 어휘들에 적용되는 렉시컬 노드 중에서 각 어휘에게 중복 사용되는 렉시컬 노드들을 포함하는 서브 렉시컬 노드를 생성하고, 생성된 서브 렉시컬 노드를 이용하여 탐색망을 구축하는 서브 렉시컬 노드 생성 장치와, 구축된 탐색망을 이용하여 현재 입력된 음성 신호와 매칭되는 어휘를 탐색하는 서브 렉시컬 노드 생성 장치를 이용한 음성 인식 장치를 포함한다.
    음성 인식, 어휘, 탐색망 구축

    어휘 그룹 트리를 이용한 어휘 인식 방법 및 장치
    23.
    发明公开
    어휘 그룹 트리를 이용한 어휘 인식 방법 및 장치 有权
    使用LEXICON GROUP TREE识别LEXICON的方法和装置

    公开(公告)号:KR1020060088687A

    公开(公告)日:2006-08-07

    申请号:KR1020050009611

    申请日:2005-02-02

    CPC classification number: G06F17/2765 G10L15/197

    Abstract: 본 발명은 메모리에 저장된 어휘 중에서 입력된 음성에 가장 가까운 어휘를 선택하는 방법 및 장치에 관한 것이다.
    본 발명에 따른 어휘 그룹 트리 생성 방법은, 소정의 어휘 그룹에 속하는 어휘들을 대표하는 중심 어휘를 생성하는 제1 단계와, 상기 중심 어휘를 이용하여 어휘 그룹 내에서 어휘간의 거리가 가장 먼 두 개의 어휘를 선택하고 상기 선택된 두 개의 어휘를 기준으로 상기 어휘 그룹을 가리키는 노드를 분할하는 제2 단계와, 상기 분할된 노드를 포함하는 현재 단말 노드 중에서 그룹 유사도가 낮은 노드를 선택하고 상기 선택된 노드가 가리키는 어휘 그룹에 대하여 상기 제1 단계 및 상기 제2 단계를 반복하는 제3 단계로 이루어진다.
    음성 인식, 어휘 그룹(lexicon group), 중심 어휘(centroid lexicon), 노드, 어휘 그룹 트리

    엠.에이.피 화자 적응 조건에서 파라미터의 분별적 추정 방법 및 장치 및 이를 각각 포함한 음성 인식 방법 및 장치
    24.
    发明授权
    엠.에이.피 화자 적응 조건에서 파라미터의 분별적 추정 방법 및 장치 및 이를 각각 포함한 음성 인식 방법 및 장치 失效
    用于鉴别性地估计MAP说话者适应条件中的参数的方法和装置以及包括这些的语音识别方法和装置

    公开(公告)号:KR100307623B1

    公开(公告)日:2001-11-02

    申请号:KR1019990045856

    申请日:1999-10-21

    Inventor: 최인정 김상룡

    CPC classification number: G10L15/07

    Abstract: 본발명은엠.에이.피화자적응조건에서파라미터의분별적추정방법및 장치및 이를포함한음성인식방법및 장치를개시한다. 학습데이터베이스로부터복수의화자에대한학습데이터를가져와모델학습을수행한결과화자의음성을인식하는데기준이되는적어도화자독립모델파라미터및 이전밀도파라미터를얻는본 발명에의한일괄처리형태의 MAP 화자적응조건에서의파라미터의분별적추정방법은, (a) 각화자에대한학습데이타에서적응데이타를분류하는단계, (b) 파라미터들의초기값들을이용하여각 화자에대한적응데이타로부터적응된화자독립모델파라미터를구하는단계, (c) 적응된화자독립모델파라미터를이용하여학습데이타의각 학습문장에대한복수개의후보문장을탐색하고, 각후보문장에대한오류정도를측정하여적응된화자독립모델파라미터에대한미분치를계산하는단계및 (d) 모든화자의학습데이타에대해수행하였으면, 계산된미분치에근거하여초기에설정된파라미터들을조정하는단계를구비한다.

    정규화 상태 라이크리후드를 이용한 음성인식방법 및 그장치
    25.
    发明授权
    정규화 상태 라이크리후드를 이용한 음성인식방법 및 그장치 失效
    使用归一化状态似然的语音识别方法及其装置

    公开(公告)号:KR100883650B1

    公开(公告)日:2009-02-18

    申请号:KR1020020020916

    申请日:2002-04-17

    Inventor: 최인정

    Abstract: 본 발명은 정규화 상태 라이크리후드를 이용한 음성인식방법 및 그 장치에 관한 것으로, (a)음성신호를 입력받아 음성신호의 프래임들로부터 특징벡터를 추출하고 은닉 마르코프 모델의 각 상태들을 구성하는 단계;(b) 상태들에 대한 상태 로그 라이크리후드를 계산하는 단계;(c) 정규화요소를 결정하여 정규화 상태 로그 라이크리후드를 계산하는 단계;(d) 정규화 상태로그 라이크리후드에 해당하는 텍스트를 검색하여 출력하는 단계를 포함하므로, 음성신호의 프래임별 최대 로그 라이크리후드의 차이에 의한 인식에의 기여도 차이, 상태별 최대 라이크리후드에서의 차이에 의한 분별성 문제, 특징 스트림별 로그 라이크리후드 차이에 의한 분별력 상쇄 등을 보상하여 인식 성능을 보상한다.

    주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법
    26.
    发明公开
    주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 有权
    使用主题检测对话语音识别的装置和方法

    公开(公告)号:KR1020070047579A

    公开(公告)日:2007-05-07

    申请号:KR1020050104462

    申请日:2005-11-02

    Inventor: 이재원 최인정

    CPC classification number: G10L15/1822 G10L15/1815

    Abstract: 본 발명은 음성 인식 장치 및 방법에 관한 것으로서, 본 발명의 실시예에 따른 주제 영역 검출을 이용한 대화체 음성 인식 장치는, 사전 구축된 글로벌 언어 모델 데이터베이스와 발음 사전 데이터베이스 및 음향 모델 데이터베이스를 참조하여, 입력 음성 신호로부터 검출된 특징 벡터와 유사한 단어열을 생성하는 전방향 탐색(Forward Search)을 수행하는 전방향 탐색부; 상기 전방향 탐색의 결과 생성된 상기 단어열에 대한 정보를 이용하여 상기 단어열 내의 어휘들의 의미로부터 도출되는 주제 영역(Topic Domain)을 검출하는 주제 영역 검출부; 및 상기 검출된 주제 영역에 관하여 사전 구축된 특정 주제 영역 언어모델 데이터베이스를 참조하여 상기 입력 음성 신호에 대한 음성 인식 결과를 텍스트로 출력하는 역방향 디코딩(Backward Decoding)을 수행하는 역방향 디코딩부를 포함한다.
    본 발명의 실시예에 따르면, 대화체 문장의 인식률(Accuracy)과 효율성(Efficiency)을 향상시킬 수 있는 효과가 있다.
    전방향 탐색, 역방향 디코딩, 훈련 코퍼스, 언어 모델

    도메인 기반 대화 음성인식방법 및 장치
    27.
    发明授权
    도메인 기반 대화 음성인식방법 및 장치 有权
    基于域的对话语音识别的方法和装置

    公开(公告)号:KR100612839B1

    公开(公告)日:2006-08-18

    申请号:KR1020040010659

    申请日:2004-02-18

    Inventor: 최인정

    CPC classification number: G10L15/183 G10L15/08 G10L2015/088

    Abstract: 도메인 기반 대화 음성인식방법 및 장치가 개시된다. 이 방법은 (a) 제1 언어모델을 이용하여 음성인식을 수행하고, 복수개의 1차 인식문장과 단어격자를 생성하는 단계; (b) 각 1차 인식문장에 포함된 신뢰도가 소정 문턱치 이상의 단어를 도메인 핵심어로 사용하여 복수개의 후보도메인을 선정하는 단계; (c) 상기 후보도메인에 특화된 음향모델과 제2 언어모델을 이용하여 상기 단어격자에 대하여 음성인식을 수행하고, 복수개의 2차 인식문장을 생성하는 단계; 및 (d) 상기 1차 인식문장과 상기 2차 인식문장으로부터 적어도 하나 이상의 최종 인식문장을 선택하는 단계를 포함한다. 이에 따르면, 단어 오인식으로 인한 도메인 추출 오류가 최종 인식결과를 선정하는데 미치는 영향을 최소화시킬 수 있다.

    음성인식 방법 및 장치, 이를 이용한 네비게이션 시스템
    28.
    发明公开
    음성인식 방법 및 장치, 이를 이용한 네비게이션 시스템 失效
    用于语音识别的方法和装置,以及使用该识别装置的导航系统

    公开(公告)号:KR1020060037086A

    公开(公告)日:2006-05-03

    申请号:KR1020040086228

    申请日:2004-10-27

    CPC classification number: G01C21/3629 G01C21/3608 G01C21/3664 G10L15/22

    Abstract: 본 발명은 음성인식에 관한 것이다.
    음성 인식 방법은 사용자가 자연스럽게 발화한 음성을 취득하여 특징을 추출하는 단계와, 상기 특징으로부터 상기 어휘를 구성하는 서브워드들 중에서 첫번째 서브워드의 후보들을 선정하여 디스플레이하는 단계와, 상기 후보들 중에서 사용자가 선택한 서브워드를 기준으로 다음 서브워드의 후보들을 선정하여 디스플레이하는 단계, 및 상기 다음 서브워드로부터 사용자가 어휘를 결정하였는지를 판단하여, 결정되지 않은 경우에 이전까지 선택된 서브워드열을 기준으로 그 다음 서브워드 후보들을 선정하여 디스플레이하는 단계를 포함한다.
    음성 인식, 멀티 모드, 서브워드, 네비게이션 시스템

    모델 변이 기반의 화자 클러스터링 방법, 화자 적응 방법및 이들을 이용한 음성 인식 장치
    29.
    发明公开
    모델 변이 기반의 화자 클러스터링 방법, 화자 적응 방법및 이들을 이용한 음성 인식 장치 有权
    基于模型转换的扬声器聚合方法和扬声器适配方法及其使用方法

    公开(公告)号:KR1020050082253A

    公开(公告)日:2005-08-23

    申请号:KR1020040010663

    申请日:2004-02-18

    CPC classification number: G10L15/07 G10L15/142

    Abstract: 양적 변화량 및 방향적 변화량을 고려한, 화자별 평균적인 모델 변이 유사도 정보를 이용함으로써 화자 클러스터링 및 화자 적응 성능을 높인 음성 인식 방법 및 장치가 개시된다. 본 발명에 따른 화자 클러스터링 방법은, 화자 독립 모델과 훈련 화자의 ML 모델 사이의 모델 변이의 유사성을 바탕으로 화자 그룹 모델 변이를 생성한다. 또한, 본 발명에 따른 화자 적응 방법은, 시험 화자의 ML 모델과 그 시험 화자가 속한 화자 그룹의 ML 모델 사이의 모델 변이가 훈련 화자 그룹 모델 변이와 가장 유사한 것을 찾아 화자 적응을 수행한다. 이 때, 화자 클러스터링과 화자 적응시의 모델 변이 계산은 모델들의 양적 변화량 및 방향적 변화량을 모두 고려하여 수행된다. 본 발명은 MLLR 또는 MAP 어느 화자 적응 알고리즘에도 적용이 가능하다.

    도메인 기반 대화 음성인식방법 및 장치
    30.
    发明公开
    도메인 기반 대화 음성인식방법 및 장치 有权
    用于基于域的对话语音识别的方法和装置

    公开(公告)号:KR1020050082249A

    公开(公告)日:2005-08-23

    申请号:KR1020040010659

    申请日:2004-02-18

    Inventor: 최인정

    CPC classification number: G10L15/183 G10L15/08 G10L2015/088

    Abstract: 도메인 기반 대화 음성인식방법 및 장치가 개시된다. 이 방법은 (a) 제1 언어모델을 이용하여 음성인식을 수행하고, 복수개의 1차 인식문장과 단어격자를 생성하는 단계; (b) 각 1차 인식문장에 포함된 신뢰도가 소정 문턱치 이상의 단어를 도메인 핵심어로 사용하여 복수개의 후보도메인을 선정하는 단계; (c) 상기 후보도메인에 특화된 음향모델과 제2 언어모델을 이용하여 상기 단어격자에 대하여 음성인식을 수행하고, 복수개의 2차 인식문장을 생성하는 단계; 및 (d) 상기 1차 인식문장과 상기 2차 인식문장으로부터 적어도 하나 이상의 최종 인식문장을 선택하는 단계를 포함한다. 이에 따르면, 단어 오인식으로 인한 도메인 추출 오류가 최종 인식결과를 선정하는데 미치는 영향을 최소화시킬 수 있다.

Patent Agency Ranking