-
公开(公告)号:KR100246617B1
公开(公告)日:2000-03-15
申请号:KR1019970058578
申请日:1997-11-06
Applicant: 한국전자통신연구원
Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 연속 피치 정보를 이용한 음성 검출 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 외부로부터 입력된 신호에 대하여 에너지와 영교차율을 이용하여 음성인지 여부를 판단한 후에 음성 신호라고 판단되면 더 나아가서 연속적인 피치 정보 중 피치의 존재 범위 영역, 인접피치 사이의 주파수 변화량과 피치 발생수를 이용하여 음성을 검출하는 음성 검출 방법을 제공하고자 함.
3. 발명의 해결방법의 요지
본 발명은, 외부로부터 입력되는 음성 신호의 피치 정보를 검출하는 단계, 검출된 피치가 소정의 기준 피치 영역에 존재하는지를 확인하는 단계, 주파수 변화량을 계산한 후에 계산된 주파수 변화량이 소정의 제 1 기준값보다 작은지를 확인하는 단계 및 각 확인 결과에 따라 음성을 검출하는 단계를 포함한다.
4. 발명의 중요한 용도
본 발명은 음성 인식 시스템에 이용됨.-
公开(公告)号:KR1019990043759A
公开(公告)日:1999-06-15
申请号:KR1019970064801
申请日:1997-11-29
Applicant: 한국전자통신연구원
IPC: G10L15/20
Abstract: 본 발명은 골도 마이크를 이용한 음성 인식 방법에 관한 것이다. 신호 대 잡음비가 10dB 내지 -5dB인 고 잡음 환경에서의 음성 인식 시스템은 음성에 섞여 있는 잡음으로 인해 정확한 음성 구간의 검출이 불가능하고 음성 특징 벡터 추출 시에도 잡음으로 인하여 입력된 음성 자체의 고유한 특징을 추출해 내기가 어렵다. 따라서 주변이 조용한 환경에서 잘 동작하는 음성 인식기를 고 잡음 환경에서 사용하면 인식 성능이 급격히 저하된다. 종래에는 이러한 문제점을 해결하기 위하여 주변 환경의 잡음이 마이크에 입력되는 비율을 낮추기 위해 지향성 마이크를 사용하는 방법, 입력된 신호로부터 잡음을 제거하기 위하여 아날로그/디지털 변환된 디지털 신호를 적응 신호처리 하여 음질을 개선하는 방법, 잡음이 혼합된 음성 신호로부터 잡음에 강인한 특징 벡터를 추출하는 방법 등을 사용하였다. 그러나 이러한 방법들도 고 잡음 환경에서는 여전히 정확한 음성 구간 검출이나 음성 자체의 고유한 특징을 추출해 내는데 한계가 있어, 음성 인식의 성능이 크게 개선되지 못하는 문제점이 있다. 따라서 본 발명에서는 고 잡음 환경에서 골도(bone conduction) 마이크를 사용함으로써 음성 입력 단계에서 미리 잡음을 제거하여 음성 인식 성능을 향상시킬 수 있는 골도 마이크를 이용한 음성 인식 방법이 제시된다.
-
公开(公告)号:KR1019990038741A
公开(公告)日:1999-06-05
申请号:KR1019970058578
申请日:1997-11-06
Applicant: 한국전자통신연구원
Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 연속 피치 정보를 이용한 음성 검출 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 외부로부터 입력된 신호에 대하여 에너지와 영교차율을 이용하여 음성인지 여부를 판단한 후에 음성 신호라고 판단되면 더 나아가서 연속적인 피치 정보 중 피치의 존재 범위 영역, 인접피치 사이의 주파수 변화량과 피치 발생수를 이용하여 음성을 검출하는 음성 검출 방법을 제공하고자 함.
3. 발명의 해결방법의 요지
본 발명은, 외부로부터 입력되는 음성 신호의 피치 정보를 검출하는 단계, 검출된 피치가 소정의 기준 피치 영역에 존재하는지를 확인하는 단계, 주파수 변화량을 계산한 후에 계산된 주파수 변화량이 소정의 제 1 기준값보다 작은지를 확인하는 단계 및 각 확인 결과에 따라 음성을 검출하는 단계를 포함한다.
4. 발명의 중요한 용도
본 발명은 음성 인식 시스템에 이용됨.-
公开(公告)号:KR100169592B1
公开(公告)日:1999-03-20
申请号:KR1019960038319
申请日:1996-09-05
Applicant: 한국전자통신연구원
Inventor: 안영목
IPC: G10L15/02
Abstract: 본 발명은 음성 인식에 사용되는 음성 특징 벡터에 관한 것이다. 음성 특징 벡터는 음성 명령어 입력신호를 A/D 변환한 후에 음성 특징 추출기에서 추출되는 것으로써 기준 패턴 비교기의 압력으로 사용된다. 이 음성 특징 벡터는 동일한 단어를 발성한다고 해도 음성 인식기가 어디에서 사용되느냐에 따라서 달라지며, 또한 사용자의 발성 패턴의 변화 및 입력 수단의 변경에 의해서도 달라진다. 따라서 이러한 변화는 기준 패턴 비교기에서 사용되는 기준 모델 생성시 사용하였던 음성 특징 벡터와 차이를 발생시키고, 이 차이에 의해 음성 인식기의 성능은 저하된다. 따라서 음성 특징 벡터가 기준 패턴 비교기에 입력되기 전에 음성 특징 벡터를 기준 모델에 적합하도록 처리해 줌으로써 음성 인식기의 성능 저하를 막을 수 있다. 본 발명은 이러한 처리 단계에 필요한 적응 음성 특징 벡터의 생성 방법 및 그 구현 절차에 관한 것이다.
-
公开(公告)号:KR1019980034079A
公开(公告)日:1998-08-05
申请号:KR1019960052023
申请日:1996-11-05
Applicant: 한국전자통신연구원
Inventor: 안영목
IPC: G10L15/06 , G10L15/197
Abstract: 본 발명은 전체 시스템의 성능 저하없이 전체 시스템에서 필요로 하는 계산량과 기억 장치의 축소 방법에 관한 것으로서, 기존의 코드북을 이용한 벡터 양자화기를 본 발명으로 대치하여 코드북 저장에 필요한 기억 장치의 감축 및 벡터 양자화에 필요한 계산량을 줄임으로써 음성 인식 시스템의 속도 개선 및 기억 장치의 감축 효과를 획득하는 음성 인식기의 계산 성능 개선 방법에 관한 것이다.
-
-
公开(公告)号:KR1019970050114A
公开(公告)日:1997-07-29
申请号:KR1019950053945
申请日:1995-12-22
Applicant: 한국전자통신연구원
Inventor: 안영목
IPC: G10L15/04
Abstract: 본 발명은 핵심어 검출 음성 인식 시스템에서 핵심어간의 유사도를 이용하여 핵심어를 검출하는 핵심어 검출 방법에 관한 것으로, 핵심어 승인 판단부에서 등록 단어간의 유사도를 참고하여 현재 인식된단어를 출력할 것인지 혹은 거절할 것인지 판단하여 그 승인 여부를 인식 결과 출력부에 전달하는 핵심어 검출 방법을 제공하기 위하여, 핵심어 발생 확률값을 구하여 최고 발생 확률값을 갖는 핵심어를 검출한 후에 타 핵심어와의 유사도를 구하고, 핵심어간의 유사도 가능값을 입력받아 상기 두 유사도를 비교하여 검출된 핵심어간의 유사도가 발생 가능한가를 판단하는 제1단계(31 내지 35); 핵심어간의 유사도 발생이 가능하지 않으면 출력을 거절하는 제2단계(36); 및 핵심어간의 유사도 발생이 가능하면 상기 제1단계(31 내지 35)의 유사도 판단 과정(35)을 등록되어 잇는 모든 핵심어에 대해서 반복한 후에 출력을 승인하는 제3단계(37,38)를 포함하여 핵심어 검출 및 비핵심어에 대한 거절이 보다 유연성을 갖도록 하는 효과가 있다.
-
公开(公告)号:KR1019950034054A
公开(公告)日:1995-12-26
申请号:KR1019940010682
申请日:1994-05-16
IPC: G10L15/02
Abstract: 본 발명은 대어휘 음성인식을 위한 후보단어 추출장치 및 추출 방법에 관한 것으로, 후보단어 추출기의 효과는 대어휘 인식시에 인식단어일 확률이 희박한 단어를 미리 제외 시킴으로써 소요되는 계산 시간을 대폭 줄일수 있다. 따라서 음성 인식 시스템의 속도를 증진시킬 것이며 최종 인식단어 추출부의 담색 영역을 대폭 줄일수 있다.
-
公开(公告)号:KR1019980040752A
公开(公告)日:1998-08-17
申请号:KR1019960059979
申请日:1996-11-29
Applicant: 한국전자통신연구원
Inventor: 안영목
Abstract: 1. 청구 범위에 기재된 발명이 속한 기술분야
화자 인식 시스템에서 개선된 문턱값 설정 방법을 이용한 화자 인식 방법
2. 발명이 해결하려고 하는 기술적 과제
등록된 화자들의 기준 패턴끼리의 유사성을 계산하는 유사도 계산부를 통해서 각 화자들의 음성에 대한 상대적 거리를 측정한 후에 이를 바탕으로 승인 및 거절의 판단 단계에 사용되는 문턱값을 설정하는 화자 인식 방법을 제공하고자 함.
3. 발명의 해결방법의 요지
입력 음성의 기준 패턴을 작성하여 저장한 후에 기준 패턴을 이용하여 각 화자들의 음성에 대한 유사성을 나타내는 기준 유사도를 구하여 문턱값을 설정하여 저장하는 제 1 단계; 및 음성 입력의 음성 특징을 추출하여 상기 제 1 단계에서 저장된 기준 패턴과 비교하여 발생값을 계산하여 화자를 식별한 후에 화자 식별 결과와 기준 패턴 비교 과정에서 얻어진 각 화자들에 대한 발생값을 이용하여 각 화자들 사이의 유사도를 계산하여 상기 제 1 단계에서 저장된 문턱값과 비교하여 화자를 검증하는 제 2 단계를 포함한다.
4. 발명의 중요한 용도
화자 인식 시스템에 이용됨.-
公开(公告)号:KR100211067B1
公开(公告)日:1999-07-15
申请号:KR1019950053945
申请日:1995-12-22
Applicant: 한국전자통신연구원
Inventor: 안영목
IPC: G10L15/04
Abstract: 본 발명은 등록되어 있는 단어만을 검출하는 핵심어 검출 음성 인식 시스템에서 핵심어들간의 유사도를 이용하여 핵심어를 검출하는 핵심어 검출 방법에 관한 것으로, 핵심어 승인 판단부에서 등록 단어들간의 유사도를 이용하여 현재 인식된 단어를 출력할 것인지 또는 거절할것인지를 판단하여 그 승인 여부를 인식 결과 출력부에 전달하는 핵심어 검출 방법을 제공하기 위하여, 핵심어 발생 확률값을 구하여 최고 발생 확률값을 갖는 핵심어를 검출한 후에 타 핵심어와의 유사도를 구하고, 핵심어간의 유사도 가능값을 입력받는 제1단계; 상기 제1단계에서의 두 유사도를 비교하여 검출된 핵심어간의 유사도가 발생 가능한지를 판단하는 제2단계; 상기 제2단계의 판단 결과, 핵심어간의 유사도 발생이 가능하지 않으면 출력을 거절하는 제3단계; 및 상기 제2단계의 판단 결과, 핵심어간의 유사도 발생이 가능하면 상기 제2단계의 유사도 판단 과정을 등록되어 있는 모든 핵심어에 대해서 반복한 후에 출력을 승인하는 제4단계를 포함하여 핵심어 검출 및 비핵심어에 대한 거절이 보다 유연성을 갖도록 하는 효과가 있다.
-
-
-
-
-
-
-
-
-