Abstract:
본 발명은 음성 언어 번역기의 한국어 출력을 한국어 어법에 맞도록 조정하는 후처리 방법에 관한 것으로, 모든 어휘를 등록하지 않고 조사나 활용 어미등을 별도로 처리하여 생성된 어색한 한국어 생성 문장을 한국어 어법에 맞게 후처리하여 자연스러운 문장이 구성되도록 하는 후처리 방법을 제공하기 위하여, 생성 문장을 입력받으면 순차적으로 한 어절씩을 추가하면서 입력 문장의 어절을 검사하는 제1단계(21 내지 24, 27, 28); 입력 문장의 어절이 한 어절이거나 검사한 어절중 널(NULL)이 있으면 문장의 구두점을 확정하는 제2단계(25, 26, 37 내지 39); 검사한 어절이 널(NULL)이 아니면 어휘를 수정한 후에 어절이 중복되는지를 판단하는 제3단계(29, 30); 어절이 중복되면 중복된 어절중 한 어절을 삭제한 후에 상기 제1단계(21 내지 24, 27, 28)의 검사 과정(28)부터 반복 수행하는 제4단계(31); 및 어절이 중복되지 않으면 추가된 어절이 조사인지를 판단하여 조사가 아니면 띄어쓰기를 하고, 조사이면 조사 유형을 결정하여 앞 음절에 붙여서 한 어절을 형성한 후에 상기 제1단계(21 내지 24, 27, 28)의 검사 과정(28)부터 반복 수행하는 제5단계(32 내지 36)를 포함하여 한국어의 어법에 맞는 문장을 출력할 수 있는 효과가 있다.
Abstract:
본 발명은 음성 언어 번역기에서 영어 문장의 후처리 방법에 관한 것으로, 구둣점 조정 단계, 문장의 첫자 및 고유명사의 대문자화 단계, 반복되는 영어 구절삭제 단계, 한글 표현의 로마자 변환 단계, 전치사의 중복 제거 단계, 그리고 기타 어휘 수정 단계 등을 구현하여 영어 생성의 출력 결과를 대하는데 기존의 출력보다는 정리된 모습을 보일 수 있는 영어 문장의 후처리 방법에 관하여 기술된다.
Abstract:
본 발명은 음성 언어 번역기에서 영어 문장의 후처리 방법에 관한 것으로, 구두점 조정 단계, 문장의 첫자 및 고유명사의 대문자화 단계, 반복되는 영어 구절 삭제 단계, 한글 표현의 로마자 변환 단계, 전치사의 중복 제거 단계, 그리고 기타 어휘 수정 단계를 등을 구현하여 영어 생성의 출력 결과를 대하는데 기존의 출력보다는 정리된 모습을 보일 수 있는 영어 문장 후처리 방법에 관하여 기술된다.
Abstract:
본 발명은 한국어 대화체 문장의 의미파싱과 생성을 위한 의미틀을 이용한 의미추출 장치 및 방법에 관한 것으로, 텍스트 입력수단(1); 저장수단(2); 의미 추출수단(3); 의미틀 출력수단(4); 및 의미 출력수단(5)을 구비하여, 텍스트 입력수단(1)을 통하여 들어오는 대화체 형태의 한 문장을 받아 들인 다음, 의미틀 정의사전 안의 각각의 의미틀과 입력 텍스트의 토큰(1개 이상의 어절) 단위별로 비교를 해서 일치하는 것이 존재하면 이를 저장 및 그 패스를 유지하고, 일치하는 것이 없으면 이 부분은 건너띄는 방법으로 분석을 수행하는 제1단계; 상기 제1단계 수행 후, 현재의 입력 문장의 모든 토큰이 처리가 되지 않았으면 모든 토큰이 일치하는 새로운 의미틀을 모두 선택하여 그 패스를 유지하고, 이렇게 모든 토큰이 처리되면 지금까지 저장 및 유지되었던 많은 패스 중에서 가장 많은 토큰과 일치된 패스가 유일하면 이것을 출력하는 제2단계; 상기 제2단계 수행 후, 유일하지 않으면 의미틀의 갯수를 가장 적게 가지는 패스가 유일하면 이것을 출력하고, 그렇지 않으면 최상위의 토큰의 수가 가장 적은 패스를 출력시키고, 모두다 유일한 것이 없으면 최 상위의 토큰의 수가 가장 적은 것 중에서 첫번째 것을 선택하여 출력하는 제3단계를 포함하여 이루어지는 것을 특징으로 한다.
Abstract:
본 발명은 한국어 대화체 문장의 의미파싱과 생성을 위한 의미틀을 이용한 의미추출 장치 및 방법에 관한 것으로, 텍스트 입력수단(1); 저장수단(2); 의미 추출수단(3); 의미틀 출력수단(4); 및 출력수단(5)을 구비하여, 텍스트 입력수단 (1)을 통하여 들어오는 대화체 형태의 한 문장을 받아 들인 다음, 의미를 정의사전 안의 각각의 의미틀과 입력 텍스트의 토큰(0개 이상의 어절) 단위별로 비교를 해서 일치하는 것이 존재하면 이를 저장 및 그 패스를 유지하고, 일치하는 것이 없으면 이 부분은 건너띄는 방법으로 분석을 수행하는 제1단계; 상기 제1단계 수행 후, 현재의 입력 문장의 모든 토큰이 처리가 되지 않았으면 모든 토큰이 일치하는 새로운 의미틀을 모두 선택하여 그 패스를 유지하고, 이렇게 모든 토큰이 처리되면 지금까지 저장 및 유지되었던 많은 패스 중에서 가장 많은 토큰과 일치된 패스가 유일하면 이것을 출력하는 제2단계; 상기 제2단계 수행 후, 유일하지 않으면 의미틀의 갯수를 가장 적게 가지는 패스가 유일하면 이것을 출력하고, 그렇지 않으면 최상위의 토큰의 수가 가장 적은 패스를 출력시키고, 모두다 유일한 것이 없으면 최상위의 토큰의 수가 가장 적은 것 중에서 첫번째 것을 선택하여 출력하는 제3단계를 포함하여 이루어지는 것을 특징으로 한다.
Abstract:
PURPOSE: A voice recognition unit determination method using a quasi-feature component is provided to maintain the number of candidate vocabulary for voice recognition to expand operation region of a voice recognition system. CONSTITUTION: The voice recognition unit determination method using the quasi-feature component includes following steps. At first, input syllable is divided by a feature component base classifier(101). Whether a sound value is maintained in the output of the feature component base classifier is checked(102). When the sound value is maintained, the feature component division result is output and whether a syllable to be processed exists is determined(103). When more syllable exists, input syllable is divided by the feature component classifier or process is terminated otherwise. When the sound value is not maintained, whether the input syllable is registered in a division rule is determined. When the input syllable is registered in the division rule, the syllable is divided using the rule, the result is output and whether more syllable to be processed exists is determined(105). When more syllable exists, input syllable is divided by the feature component classifier or process is terminated otherwise. When the input syllable is not registered in the division rule, whether an automatic mode is to be performed is determined(106). When yes, the syllable is registered in a non-divided word files, the input syllable is output as it is and whether more syllable to be processed exists is determined. When more syllable exists(107), input syllable is divided by the feature component classifier or process is terminated otherwise. When the mode in not automatic, the input syllable is divided manually and the rule for the division is registered(108). The result is output and whether more syllable to be processed exists is determined(110). When more syllable exists, input syllable is divided by the feature component classifier or process is terminated otherwise.
Abstract:
본 발명은 의사형태소를 이용한 음성 인식 단위의 설정 방법에 관한 것이다. 음성 인식에서는 사전에 등록되는 어휘가 음성 인식의 기본 작업 단위가 되며 인식 대상 어휘의 수가 음성 인식 작업의 난이도와 인식 성능을 결정하는 요소가 된다. 종래에는 어절, 음절 또는 음소 단위로 인식 단위를 설정하여 입력되는 음성을 인식하고 처리하였다. 그러나 어절을 인식 단위로 하여 음성을 인식할 경우 인식 대상이 되는 어휘의 수가 증가하여 확장성이 저하되고 음절이나 음소를 인식 단위로 할 경우에는 언어학적 특성이 사라져 후처리시에 언어 지식을 적용하기가 어려워지는 문제점이 있다. 또한 형태소를 인식 단위로 하는 방법이 있는데, 이 경우에도 어절을 형태로소 분리할 때 생략되거나 축약된 형태소가 재생되어 원래 어절의 소리값과 형태소로 분리된 소리값이 일치하지 않게 되는 문제점이 있다. 이러한 문제점을 해결하기 위하여 본 발명에서는 인식 단위 각각이 언어학적 특성과 주어진 어절의 소리값을 유지하면서 전체 인식 대상 어휘의 수를 감소시킬 수 있는 의사형태소를 도입하고 입력된 어절을 내용어와 기능어로 분리하여 음성을 인식하므로써 음성 인식 대상 어휘의 수를 적절한 수로 유지하게 되어 음성 인식 시스템의 작업 영역을 확장할 수 있는 의사형태소를 이용한 음성 인식 단위 설정 방법이 제시된다.
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은 부분 파서를 이용한 개념기반 번역 장치 및 방법에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은, 개념위주의 번역에서 실패할 경우에 중간 개념 등만이라도 번역을 하고, 발화자의 최소한의 의도만이라도 번역을 하여, 성능이 향상된 개념기반 번역 장치 및 방법을 제공하고자 함. 3. 발명의 해결방법의 요지 본 발명은, 소정 언어 문장 및 텍스트가 입력되면 토큰으로 분리하는 토큰 분리 수단과, 토큰 리스트들을 입력받아 개념 구조로 변환하는 개념기반 해석 수단과, 의미 전달에 핵심이 되는 개념들을 저장하고 있는 핵심 개념 리스트 저장 수단과, 핵심개념 리스트 저장 수단의 핵심개념 리스트에 포함된 개념을 이용하여 해석을 수행하는 부분파싱 수단, 및 번역된 목적언어 번역문을 생성하여 출력하는 개념기반 생성 수단을 포함한다. 4. 발명의 중요한 용도 본 발명은 음성 번역 시스템에 이용됨.