-
公开(公告)号:KR1019990039091A
公开(公告)日:1999-06-05
申请号:KR1019970059052
申请日:1997-11-10
Applicant: 한국과학기술원
IPC: G06F17/30
Abstract: 본 발명은 텍스트 사전 관리시스템(TDMS)에서의 사전 및 텍스트 코퍼스 구조 정의 방법에 관한 것으로서, 상세하게는 SDML를 이용하여 다양한 형태의 전자사전 논리구조를 가능한 한 효과적으로 기술할 수 있도록 사전의 규칙적인 구조(일정한 형식부분)는 SGML DTD 형태로 정의해 두고 반드시 그 형식을 따르도록 하며, 나머지 내용에 관련된 부분(형식이 바뀔 수 있는 부분)은 SGML에서 정의하는 방식을 이용하여 자유롭게, 그러나 SDML의 제한 규칙에 의해 정의할 수 있도록 하며, 텍스트 코퍼스를 단순한 텍스트처럼 저장할 수 있도록 하여 텍스트 코퍼스 관리가 가능하도록 사전 및 텍스트 코퍼스 구조를 정의함으로써 외국 문서는 물론이고 한글 문서의 표준으로 이용 가능하며, 사전을 새로 구축하고, 관리하며 이를 변형하여 새로운 정보로 변형하는데 적합 한 사전 및 텍스트 코퍼스 구조 정의 방법이다.
-
公开(公告)号:KR1019990025846A
公开(公告)日:1999-04-06
申请号:KR1019970047649
申请日:1997-09-19
Applicant: 한국과학기술원
IPC: G06F17/30
Abstract: 본 발명은 문서에 포함된 모든 단어에 대하여 색인 작업을 수행하고 색인에 의해 저장된 문서 하부 구조로부터 사용자의 요구에 대하여 자료를 검색하는 전문 정보 검색 시스템에 관한 것으로 특히, 특정 문서를 입력받아 해당 문서에 존재하는 어절을 추출하는 어절 추출 모듈과, 상기 어절 추출 모듈에서 추출된 어절들에 대하여 각 어절들이 문서내에 존재하는 위치 정보를 추출하는 위치정보 추출모듈과, 상기 위치정보 추출모듈에서 추출된 각 어절들에 대한 위치정보와 각 어절에 의한 색인어를 역색인 구조로 변환 구축시키는 색인구조 구축 모듈, 및 상기 색인구조 구축모듈에서 구축된 역색인 구조를 압축하여 상기 문서 하부구조를 생성시키는 압축모듈을 포함하는 것을 특징으로 하는 한국어의 전문 정보 검색을 위한 색인 시스템과 그에 대응 하는 검색 시스템을 적용하면, 문서를 색인하고 압축하는 과정에서 전문을 색인하여 정보의 손실을 최소화하며, 이러한 색인구조 구축시에 색인구조 압축알고리즘을 사용하여 저장공간을 극소화하고, 색인시에 빠른 검색기능을 제공할 수 있다.
-
公开(公告)号:KR100283023B1
公开(公告)日:2001-03-02
申请号:KR1019970059052
申请日:1997-11-10
Applicant: 한국과학기술원
IPC: G06F17/30
Abstract: 본 발명은 텍스트 사전 관리시스템(TDMS)에서의 사전 및 텍스트 코퍼스 구조 정의 방법에 관한 것으로서, 상세하게는 SDML를 이용하여 다양한 형태의 전자사전 논리구조를 가능한 한 효과적으로 기술할 수 있도록 사전의 규칙적인 구조(일정한 형식부분)는 SGML DTD 형태로 정의해 두고 반드시 그 형식을 따르도록 하며, 나머지 내용에 관련된 부분(형식이 바뀔 수 있는 부분)은 SGML에서 정의하는 방식을 이용하여 자유롭게, 그러나 SDML의 제한 규칙에 의해 정의할 수 있도록 하며, 텍스트 코퍼스를 단순한 텍스트처럼 저장할 수 있도록 하여 텍스트 코퍼스 관리가 가능하도록 사전 및 텍스트 코퍼스 구조를 정의함으로써 외국 문서는 물론이고 한글 문서의 표준으로 이용 가능하며, 사전을 새로 구축하고, 관리하며 이를 변형하여 새로운 정보로 변형하는데 적합 한 사전 및 텍스트 코퍼스 구조 정의 방법이다.
-
公开(公告)号:KR100278095B1
公开(公告)日:2001-01-15
申请号:KR1019970040207
申请日:1997-08-22
Applicant: 한국과학기술원
IPC: G06F17/28
Abstract: 본 발명은 원문으로부터 다른 언어로의 번역문을 생성시키는 기계번역(machine translation) 시스템에 관한 것으로서, 보다 상세하게는 기계 번역의 과정에 있어서 원문 문서의 복잡도에 따라 그 원문이 요구하는 분석 수준에 따라서 다양한 번역 방식 즉, 형태소 분석, 구문 분석, 의미소 분석 등을 융통성 있게 실행하기 위하여, 다양한 수준의 분석 변환을 하는 분석(analysis) 모듈(10,20,30)과, 상기 분석 모듈들이 출력하는 변환 문서를 평가하는 평가자(evaluator)와, 상기 분석 모듈에 대응하며 상기 평가자를 포함하는 생성(generator) 모듈(50,60,70) 그리고 상기 평가자가 변환 문서를 받아들일 수 없을 때에 상기 분석 모듈로 피드백 되는 정보를 저장하는 번역 메모리(40)로 이루어지는 기계번역 시스템에 관한 것이다.
-
公开(公告)号:KR100254803B1
公开(公告)日:2000-05-01
申请号:KR1019970047649
申请日:1997-09-19
Applicant: 한국과학기술원
IPC: G06F17/30
Abstract: PURPOSE: A system for searching a Korean full text information in a computer system is provided to increase the efficiency of a run-length encoding in position information of each paragraph by using a relative position value in case that the position information is stored. CONSTITUTION: A professional index sets the unit of an index word as the unit of a paragraph unit. In case of the English-speaking world, a paragraph equals to the unit of a word. A prototype is restored by Stemizing method. In case that it isn't easy to change a word as the English, an index is compiled by a prototype according to a fixed rule. Therefore, the whole number of index words is reduced. In case of an inflected language as the Korean, a prototype is restored by a morpheme analysis. Various results are extracted. Therefore, one is selected among the results by a tagger or a fixed rule.
Abstract translation: 目的:提供一种用于在计算机系统中搜索韩文全文信息的系统,以便在存储位置信息的情况下,通过使用相对位置值来提高每段的位置信息中的游程长度编码的效率。 规定:专业指标将索引字的单位设置为段落单位的单位。 在英语世界的情况下,一段等于单词的单位。 通过Stemizing方法恢复原型。 如果将英文改为不容易,则根据固定规则,由原型编制索引。 因此,索引词的整数减少。 如果是韩文翻译的语言,则通过语素分析恢复原型。 提取各种结果。 因此,通过标签器或固定规则在结果中选择一个。
-
公开(公告)号:KR1019990017309A
公开(公告)日:1999-03-15
申请号:KR1019970040207
申请日:1997-08-22
Applicant: 한국과학기술원
IPC: G06F17/28
Abstract: 본 발명은 원문으로부터 다른 언어로의 번역문을 생성시키는 기계번역(machine translation) 시스템에 관한 것으로서, 보다 상세하게는 기계 번역의 과정에 있어서 원문 문서의 복잡도에 따라 그 원문이 요구하는 분석 수준에 따라서 다양한 번역 방식 즉, 형태소 분석, 구문 분석, 의미소 분석 등을 융통성 있게 실행하기 위하여, 다양한 수준의 분석 변환을 하는 분석(analysis) 모듈(10,20,30)과, 상기 분석 모듈들이 출력하는 변환 문서를 평가하는 평가자(evaluator)와, 상기 분석 모듈에 대응하며 상기 평가자를 포함하는 생성(generator) 모듈(50,60,70) 그리고 상기 평가자가 변환 문서를 받아들일 수 없을 때에 상기 분석 모듈로 피드백 되는 정보를 저장하는 번역 메모리(40)로 이루어지는 기계번역 시스템에 관한 것이다.
-
-
-
-
-