Abstract:
본 발명은 템플릿에 기반한 기록정보(Record) 색인 및 검색 방법과 이를 이용한 질의응답 시스템에 관한 것으로서, 기록정보와 관련된 부사적 중심어휘를 정의하고, 부사적 중심어휘를 기반으로 기록정보를 추출할 수 있는 정답색인 템플릿을 정의 및 생성하며, 정답색인 템플릿을 이용해서 일반텍스트의 문장들로부터 기록정보를 색인하고, 질문분석을 위한 질문색인 템플릿을 정의 및 생성하며, 질문색인 결과와 기록정보색인 결과를 이용해서 정답을 제시하는 과정을 진행함으로써, 기록정보에 대한 질문에 대해 템플릿을 이용해서 보다 정확한 답을 찾을 수 있으므로 질의응답 시스템의 성능을 개선할 수 있다. 질의응답, 기록정보, 레코드, 템플릿
Abstract:
본 발명은 템플릿에 기반한 기록정보(Record) 색인 및 검색 방법과 이를 이용한 질의응답 시스템에 관한 것으로서, 기록정보와 관련된 부사적 중심어휘를 정의하고, 부사적 중심어휘를 기반으로 기록정보를 추출할 수 있는 정답색인 템플릿을 정의 및 생성하며, 정답색인 템플릿을 이용해서 일반텍스트의 문장들로부터 기록정보를 색인하고, 질문분석을 위한 질문색인 템플릿을 정의 및 생성하며, 질문색인 결과와 기록정보색인 결과를 이용해서 정답을 제시하는 과정을 진행함으로써, 기록정보에 대한 질문에 대해 템플릿을 이용해서 보다 정확한 답을 찾을 수 있으므로 질의응답 시스템의 성능을 개선할 수 있다. 질의응답, 기록정보, 레코드, 템플릿
Abstract:
본 발명은 지식베이스의 구조를 설계함에 있어 백과사전의 내용을 기반으로 개념 중심의 체계적인 템플릿을 설계하고, 백과사전의 개요 정보 및 본문으로부터 표제어와 관련된 중요한 사실 정보를 자동으로 추출하여 질의응답시스템의 지식베이스를 반자동으로 구축하는 방법에 관한 것이다. 본 발명은, 각 표제어에 대해 다수의 템플릿들과 관련 속성들로 지식베이스 구조를 설계하는 단계와, 백과사전의 개요정보로부터 표제어와 그 속성이름 및 속성값들을 추출하는 단계와, 문장분석을 통해 얻어지는 어절단위 토큰열의 의존관계를 기반으로 백과사전의 본문으로부터 그 표제어에 대한 속성이름 및 속성값들을 추출하는 단계와, 각 표제어별로 상기 추출된 구조정보 및 비 구조정보를 지식베이스의 해당 템플릿 및 해당 속성에 저장하여 지식베이스를 구축하는 단계로 이루어진다.
Abstract:
본 발명은 지식베이스의 구조를 설계함에 있어 백과사전의 내용을 기반으로 개념 중심의 체계적인 템플릿을 설계하고, 백과사전의 개요 정보 및 본문으로부터 표제어와 관련된 중요한 사실 정보를 자동으로 추출하여 질의응답시스템의 지식베이스를 반자동으로 구축하는 방법에 관한 것이다. 본 발명은, 각 표제어에 대해 다수의 템플릿들과 관련 속성들로 지식베이스 구조를 설계하는 단계와, 백과사전의 개요정보로부터 표제어와 그 속성이름 및 속성값들을 추출하는 단계와, 문장분석을 통해 얻어지는 어절단위 토큰열의 의존관계를 기반으로 백과사전의 본문으로부터 그 표제어에 대한 속성이름 및 속성값들을 추출하는 단계와, 각 표제어별로 상기 추출된 구조정보 및 비 구조정보를 지식베이스의 해당 템플릿 및 해당 속성에 저장하여 지식베이스를 구축하는 단계로 이루어진다.
Abstract:
In an apparatus for providing an one-stop service in a mobile web application server system a mobile terminal receives the OSS from the mobile web application server in order to use the OSS. A screen-processing module includes a java server page and a java sublet for an OSS generated in the form of a mobile web application server page. A service processing means generates an OSS log to process the OSS and represents a corresponding specialized site in the form of a service bean. An external service generates the mobile web application server system and performs a connection to OSS contents. An external system provides contents in accordance with certain information provided from the external service. A site providing system provides a corresponding specialized site to the service bean in the service processing means.
Abstract:
PURPOSE: A device for extracting information requested by a user in an unstructured document and a method thereof are provided to extract only specific information using an event template including information of "who", "when", "where", "what", and "how" on condition that a user collects an unstructured document for extracting information. CONSTITUTION: An extraction information specification unit(10) designates and inputs information to be extracted by a user. If a document for an information extraction(21) is inputted, an event template extraction unit(20) checks whether designated information is included in the extraction information specification unit(10) and extracts an event template of a sentence unit of a specific semantic argument structure. An event template integrating unit(30) integrates event templates created in the event template extraction unit(20) interactively in accordance with an agreement of a semantic argument and contents thereof. A template extracting unit(40) extracts a template including only information to be extracted by a user out of event templates integrated in the event template integrating unit(30) and stores the template in a database(41).
Abstract:
통상적인 유사문장 검색 기술은, 입력부, 유사도 계산부, 출력부 등으로 구성되며, 유사도 계산부의 결과인 문장 유사도 확률값이 동일하게 발생될 수 있다. 유사도 계산 결과가 입력문장과 완전히 일치하는 경우에는 1순위로 순위를 조정하면 되지만, 완전히 일치하지 않을 경우에는 동일한 확률값을 가진 문장들 중에서 어느 것을 상위로 결정하느냐에 대한 문제가 발생한다. 이를 위해 다양한 확률값을 활용한 유사문장 검색의 순위 재조정 기법이 있으나, 번역된 제2 언어에 대한 순위 재조정 기법은 전무한 실정이다. 이에 본 발명의 실시예에서는, 문장간 유사도 측정시 검색된 문장들의 순위를 재조정하여 입력문장과 유사가 높은 최적의 문장을 제공함으로써 유사 문장검색 기술 성능을 향상시킬 수 있는 유사문장 검색 기술을 제안하고자 한다.
Abstract:
본 발명은 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 기술에 관한 것으로, 신규 고유명사와 분류어를 수집하고, 수집된 단어들을 이용하여 텍스트 코퍼스로부터 후보 문장을 선정하며, 후보 문장으로부터 후보 문틀을 추출하고, 후보 문틀의 엔그램을 생성한 후, 각 후보 문틀을 통계적인 계산식을 이용하여 점수화 및 순위화를 수행하고, 상위의 문틀을 고유명사에 적용한 후 엔그램을 확장하여 언어모델에 반영하는 것을 특징으로 한다. 본 발명에 의하면, 음성인식을 위한 언어모델에 없는 신규 고유명사를 문장의 다양한 표현을 반영한 엔그램 형태로 추가할 수 있기 때문에 단순히 고유명사 만으로 추가하는 방법보다 고유 명사의 높은 음성인식 성능을 얻을 수 있다.
Abstract:
본 발명은 엔베스트(N-best) 인식 단어 계산량 감소를 위한 2단계 발화검증 구조 및 방법에 관한 것으로, 메모리, CPU 성능 등 리소스 제한을 받는 임베디드 시스템에 발화검증 기능을 갖는 음성인식 시스템을 위한 것이다. 발화검증은 사용자가 음성으로 발성한 음성 입력에 대해 음성인식을 수행한 후, 인식된 결과에 대한 신뢰도를 계산하여 인식 결과를 수락 또는 거절을 결정하는 것이다. 이를 위해 임베디드용 발화검증은 성능 요구사항뿐만 아니라, 빠른 응답시간을 제공해 주어야 하므로, 새로운 구조와 계산량 감소를 위한 기법을 사용해야 한다. 따라서, 본 발명에서는 임베디드 음성인식 시스템에서 엔베스트 인식결과가 출력될 때 계산량 감소를 위한 2단계 발화검증 구조 및 방법을 제안하고자 한다.