Abstract:
본 발명은 실시간 시맨틱 어노테이션 장치 및 이를 이용하여 사용자가 입력한 자연어 문자열을 실시간으로 의미 가독형 지식 구조로 변환하는 방법에 관한 것으로, 본 발명에 따른 실시간 시맨틱 어노테이션 장치는, 사용자로 하여금 자연어 문자열을 입력하게 하는 입력 장치부; 정규 표현식으로 표현된 자연어 문자열과 그에 대응되는 트리플(triplet)이 기술된 문자열 패턴-트리플 매핑 테이블; 패턴-트리플 매핑 테이블을 활용해서 상기 입력된 자연어 문자열을 해석 처리하여 트리플 형태로 변환 시키는 트리플 추출장치; 사용자가 입력하고자 하는 내용의 정확한 의미 파악을 위해 대체 단어를 추천하는 대체 단어 추천장치; 및 의미 가독형 지식 구조를 활용하여 상기 추출된 트리플들을 기계 가독형 문서로 변환하는 기계 가독형 문서 생성부를 포함한다. 시맨틱, 실시간 어노테이션, 온톨로지, 위키
Abstract:
본 발명은 기계 가독형 지식 구조 기반 전자 메모 시스템 및 방법에 관한 것으로, 본 발명에 따른 시스템은, 쉽게 휴대할 수 있고 접었다 펼 수 있으며 임의의 물체 표면에 반영구적으로 반복적으로 탈부착하여 사용할 수 있는 전자 메모지; 상기 전자 메모지의 글이나 그림을 포함하는 내용을 입력할 수 있는 전자 메모 입력 장치; 상기 입력된 전자 메모를 유선 또는 무선 네트워크를 통해 전송하는 전자 메모 전송 장치; 상기 전자 메모를 보관 및 관리하는 전자 메모 서비스 장치; 상기 전자 메모의 내용을 분석해서 기계 가독형 지식 구조로 변환하는 전자 메모 해석 처리부; 상기 전자 메모 서비스 센터에 보관된 전자 메모 내용 및 그들 내용 사이의 연관 관계를 사람이 보기 쉽도록 디스플레이에 출력하는 전자 메모 네트워크 브라우저 장치; 상기 전자 메모 내용들 사이의 연관 관계를 분석하고 새로운 지식을 추론하고 그것을 바탕으로 전자 메모 네트워크를 생성하는 전자 메모 추론부; 상기 전자 메모 네트워크의 내용을 자연언어로 바꾸고 음성으로 출력하는 전자 메모 음성 출력 장치; 및 상기 전자 메모 네트워크에 대한 사용자의 평가를 상기 기계 가독형 지식구조에 반영하는 지식 구조 갱신부를 포함한다. 전자 메모지, 전자 메모, 기계 가독형 지식 구조, 온톨로지, 의사 결정 지원 시스템
Abstract:
PURPOSE: A document group rank system is provided to improve the annotation work efficiency by listing the detailed documents in an influence order. CONSTITUTION: A document database(10) offers a link relation among documents, a document content, and category information of the document. An offline unit(100) calculates the significance of the documents. An online unit(200) ranks the document group. The online unit arranges the document group by the importance level, and outputs the arranged result. A web annotation tool(30) amends the result of the text annotation and exchanges information with the online unit.
Abstract:
PURPOSE: A method of is-a relation inference, a computer readable record medium on which a program for executing the method is recorded are provided to find previous explicit relation by adopting an IS-A relation inference procedure. CONSTITUTION: Terminologies included in an IS-A relation list is displayed as a basic concept of a description logic(302). The terminologies included in the IS-A relation list is split into central terminologies and modification terminologies. The composite concept of a basic concept is expressed in logic multiply(303). The terminology concept and the constitutional word is expressed as equivalence relation(304). The inclusion relation among concepts corresponding to the upper and lower words of the IS-A relation is expressed(305).
Abstract:
PURPOSE: An automatic relation triplets extraction method through a search of a dependency grammar sentence tree is provided to reduce time and cost highly by automating a suitable part of an ontology construction from a general sentence. CONSTITUTION: A sentence structure of a target sentence is analyzed. A dependency grammar sentence tree is created using the analysis. A pre-processing of the dependency grammar sentence tree is operated. The dependency grammar sentence tree is transformed to a form for relation extraction. The converted dependency grammar sentence tree is searched in a post order method. A relation triplets are automatically extracted using the search.
Abstract:
본 발명은, 온톨로지 구축시 클래스간 관계 설정을 위하여, 온톨로지 클래스를 나타내는 전문용어들이 포함된 문장의 구문분석 결과를 보여 주어, 온톨로지 구축자들이 관련된 클래스간 관계 설정시 편리하게 참조할 수 있게 한다. 많은 전문용어가 복합어인 것을 감안하여, 복합어 인식과 클래스간 관계 설정을 위하여 기능성 동사 처리 등의 기능을 기존 일반 구문분석에 결합하였다. 온톨로지 구축자는 본 도구가 제안해주는 클래스간 관계를 그대로 사용할 수도 있고, 또한 본 도구가 발견해 내지 못한 관계를 추가할 수도 있다. 또한 온톨로지 구축자에게 필요한 정보를 제공하거나 구축자로부터 제시된 개선사항을 반영하여 클래스간 관계를 수정할 수도 있다. 본 발명은 코퍼스를 이용한 온톨로지 구축에 이용된다. 온톨로지, 전문용어, 구문분석, 코퍼스, 기능성 동사
Abstract:
PURPOSE: An automatic construction method and an automatic construction system of relations between ontology classes of technical terms using general domain corpus clustering are provided to overcome limitation of a technical term corpus with few corpora and automatically extract the relations between concepts. CONSTITUTION: A syntax analyzing device(11) extracts a specific technical term and a verb pair related to the specific technical term from a technical term domain to construct relations of a technical term ontology. A corpus extractor(13) extracts a general corpus consisting of syntaxes in which a verb is included based on the extracted word from a generic domain. A clustering device(15) clusters verbs related to the technical term through the syntax relation of the syntaxes in the extracted general corpus. An automatic class relation setup device(17) sets relations between classes configuring the technical term ontology.
Abstract:
A method of sentence compression using lexical information, principal grammar element, and title information is provided to improve readability and summarization efficiency for abstracting a document. A title of a document and sentences are inputted(S10). A syntactic analysis tree is generated by a Top-Down mode(S20). A primary grammar element is extracted and indicated(S30). A decision tree is used to determine whether an initial word of a current sentence is included in a summarized sentence(S40). Lexical information is used to indicate the initial word in the syntactic analysis tree as a main part(S50). In case words do not exist in a current sentence, the current sentence is summarized(S60,S70).
Abstract:
PURPOSE: A phonetic distance calculation method is provided to perform a phonetic distance among different spellings on an adopted word so that it can enhance an efficiency of an information retrieval system. CONSTITUTION: The method comprises steps of a system manager defining consonant and vowel change patterns which can occur among the different phonetic spellings on an adopted word(S1), the system generating the different phonetic spellings based on the defined consonant and vowel change patterns and granting a penalty on each different phonetic spelling(S2), the system calculating a minimum phonetic distance between the two different phonetic spellings by applying a minimum edition distance calculation method(S3), and the system determining the different phonetic spelling with the shortest phonetic distance(S4). The consonant and vowel change patterns is classified into a transposition of the consonants and vowels, an insertion/deletion of the consonants and vowels, and an extension/compression of the consonants and vowels.
Abstract:
PURPOSE: A method for comparing a similarity of foreign language transcription is provided to search a Korean language expression for English word in a document based on an algorithm comparing the English language pronunciation similarity. CONSTITUTION: All initial sounds "ieung" are removed except "ieung" located at the first character initial sound after writing the inputted characters by phonemes(S101). If the same consonants are repeated, the prior consonant is removed(S102). The remained initial sound is converted into the pre-set representative consonant(S103). The remained consonants are substituted by the pre-set consonant code(S104). Successively repeated codes are removed(S105). If repeated codes are removed, the characters are compared with coded data with respect to a standard foreign language transcription.(S106). If the compared data are identified, the foreign language transcription is correct(S107). If the compared data are not identified, the foreign language transcription is incorrect(S108).