-
-
公开(公告)号:KR100173204B1
公开(公告)日:1999-03-30
申请号:KR1019950055840
申请日:1995-12-23
Applicant: 한국전자통신연구원
IPC: G10L15/04
Abstract: 본 발명은 한국어 변이음집단화 수형도를 이용한 변이음 단위의 음성인식 방법에 관한 것으로, 삼음소열 또는이에 해당하는 코드열을 입력받아 중음소가 자음,모음,묵음중 어느것인가 판단하는 제1단계; 상기 중음소가 자음이면 좌음소와 우음소에 따라 우음소 모음군부류화 또는 좌음소 모음군 부류화를 수행하는 제2단계 ; 상기 중음소가 모음이면 좌음소와 우음소에 따라 우음소 초성,종성 자음군 부류화, 우음소 SIL(silence) 노드화, 좌음소 초성 자음군 부류화를 수행하는 제3단계; 및 상기 중음소가 묵음이면 SIL 노드화하는 제4단계를 포함하는 것을 특징으로 하여 음소단위나 트라이폰 단위를 기반으로 하는 음성인식, 음성합성에 보다 유용한 모델링 및 분석 단위로 사용할 수 있는 효과가 있다.
-
公开(公告)号:KR1019980037008A
公开(公告)日:1998-08-05
申请号:KR1019960055690
申请日:1996-11-20
Applicant: 한국전자통신연구원
IPC: G10L21/0208 , G10L15/28
Abstract: 본 발명은 컴퓨터를 이용한 음성인식시스템의 응용분야에서 마이크 어레이를 이용한 원격음성입력장치 및 그 원격음성입력 처리 방법에 관한 것으로서, 종래기술에서의 하나의 마이크로 음성을 입력하는 경우에 마이크의 위치에 항상 세심한 주의를 기울여야 하기 때문에 사용상에 많은 불편이 발생하였던 문제점을 해결하기 위해, 본 발명은 다채널의 마이크 어레이를 구비하고, 이 다채널의 마이크들로부터 시간지연 값들이 다른 음성신호를 동시에 입력받아 디지탈신호를 변환하는 마이크 어레이와, 마이크 어레이로부터 입력되는 다채널의 신호들로부터 음성신호를 검출하는 자동음성 검출부와, 그 검출된 각 채널간 음성신호들의 시간지연 정보를 추정하는 시간지연 추정부와; 및 추정된 시간지연 정보를 이용하여 신호대 잡음비가 향상된 음성을 생성해내기 위해 채널간의 음성신호에 존재하는 시간지연을 상쇄시킨 후 모든 채널의 음성신호를 가산하는 시간지연 및 신호가산부로 구성되어;
마이크와 화자가 약 40~80cm 정도의 거리를 두고, 마이크의 위치에 주의를 기울이지 않고 발성할 경우에도 허용된 수준(25dB) 이상의 신호대 잡음비를 갖는 음성을 자동으로 입력받는 기능을 갖도록 개발하여 이 음성을 음성인식시스템의 입력으로 사용할 경우, 우수한 성능을 나타낼 수 있도록 하였다.-
公开(公告)号:KR1019970049740A
公开(公告)日:1997-07-29
申请号:KR1019950053941
申请日:1995-12-22
Applicant: 한국전자통신연구원
IPC: G06F15/18
Abstract: 본 발명은 다층구조 신경망을 이용한 음소 분할 방법에 관한 것으로서, 음성 입력부(1), 전처리부(2) 다층 신경망(MLP : Multi Layer Perceptron) 음소 분할부(3), 및 음소 경계 출력부(4)를 구비한 음소 분할장치에 적용되는 다층구조 신경망을 이용한 음소 분할 방법에 있어서, 디지탈화된 음성 샘플로부터 음성을 연속적으로 세그먼트화하여 음성을 프레임화하고, 각 음성 프레임들에 대하여 프레임간 특징 벡터를 추출한 후 특징 벡터들의 최대치와 최소치를 정규화하고, 가중 함수를 초기화 한 후 다충 신경망(MLP)의 출력 목표 데이타를 지정하고, 특징 벡터를 입력하여 요류 역전파 알고리즘을 사용하여 학습시킨 후, 평균자승오차의 감소 비율이 허용 한계내로 수렴되면 학습을 통해 구한 가중 함수와 MLP의 규격에 대한 정보를 저장하고 종료하는 제1단계(10 내지 18); 및 상기 제1단계(10 내지 18) 수행 후, 음성을 프레임화 한 후, 특징 벡터를 추출하고, 이를 정규화한 후, 저장된 가중 함수를 읽고, 특정 벡터를 입력받아 음소 경계 판정을 위한 연산을 수행하여 출력값을 생성한 후, 출력값에 따라 음소 경계 부분을 판정하고, 현재의 분석 프레임이 입력된 음성의 최종 프레임의 2프레임 이전에 도달하였으면, 그해진 음소의 경계를 프레임 번호로 나타낸 값을 최종 결과로 출력하는 제2단계(10,11,12,19 내지 24)를 포함하여 음소 자체에 대한 부가적인 지식없이 음소와 음소의 경계에서 나타나는 음성 신호상의 변화만을 이용하여 음소의 경계가 되는 지점을 정확하고도 효율적으로 포착하여 자동 음소 분할이나 음소 레이블링이 필요한 응용 분야에 유익하게 활용될 수 있는 효과가 있다.
-
-
-
-