-
公开(公告)号:KR100248387B1
公开(公告)日:2000-03-15
申请号:KR1019970066398
申请日:1997-12-05
Applicant: 한국전자통신연구원
IPC: G06F17/28
Abstract: 본 발명은 외국어 작문지원 시스템에 관한 것으로서, 사용자가 시스템의 작문서비스 자동개입시점을 선택하고 상대국어로 작성하고자 하는 문장을 자국어의 어절단위(예:한국어) 또는 연속된 문자열(예: 일본어)로 작성해 나가면, 시스템의 자동개입에 의해 자국어 분석기술과 상대국어로의 변환/생성기술을 적용하여 상대국어의 문자열을 생성해 주므로서, 자국어 작성능력 만으로 상대국어를 작문할 수 있도록 한다. 특히, 작성중인 자국어의 문자열에 분석의 중의성이나 상대국어로의 변환시에 대응어 선택의 중의성 문제가 있을 경우 또는 미등록어 문제가 있을 때는 시스템이 제공하는 자국어 도움말정보로 구성된 대화창에서 사용자가 선택함으로서 사용자의 자국어 언어지식만으로 문제점을 해결할 수 있다. 따라서 시스템의 자동개입을 요구한 단위별로 언어처리의 문제점인 중의성과 미등록어 문제점이 해결되어 가므로 실제 의사교환에 쓰일 수 있는 정확한 작문이 가능하다.
-
公开(公告)号:KR1019990047118A
公开(公告)日:1999-07-05
申请号:KR1019970065368
申请日:1997-12-02
Applicant: 한국전자통신연구원
IPC: G09B7/00
Abstract: 본 발명은 외국인을 포함하여 한국어를 모르는 사람에게 한국어를 교육시키기 위한 장치로서, 일방적인 교육 시스템이 아니라 학습자와의 상호 작용에 의한 학습 방법으로 학습자의 한국어에 대한 언어 수준을 장치가 자동으로 판단함으로써 학습자의 한국어 실력에 맞도록 학습 내용을 선정하여 한국어를 가르칠 수 있도록 구성되어 있으며, 학습자의 편의성을 위해 그래픽 기능, 문자 인식 기능, 음성 인식, 출력 기능, 철자 검사, 문법 검사 기능을 보유한 한국어 교육 시스템 및 제어방법에 관한 것이다.
-
公开(公告)号:KR100327114B1
公开(公告)日:2002-03-13
申请号:KR1019990061182
申请日:1999-12-23
Applicant: 한국전자통신연구원
IPC: G06F17/28
Abstract: 본발명은문장골격을기반으로한 자동번역시스템및 그방법과상기방법을실현시키기위한프로그램을기록한컴퓨터로읽을수 있는기록매체에관한것으로, 문장의골격을표현하고있는문틀에기반하여, 구조적인모호성을해소한자연스러운번역문장을생성할수 있는문장골격을기반으로한 자동번역시스템및 그방법과상기방법을실현시키기위한프로그램을기록한컴퓨터로읽을수 있는기록매체를제공하기위하여, 입력문장에대해원시언어형태소분석기및 구단위구문분석기를거쳐생성된구 단위구문분석결과가올바른결과인가를확인하여, 상기구 단위구문분석결과를이용하여원문틀탐색키를생성하는제 1 단계; 상기원문틀탐색키를이용하여상기원문틀데이터베이스를탐색하여, 상기원문틀데이터베이스에서탐색한제약조건을입력문장에매칭시키는제 2 단계; 상기제약조건이매칭된구문에슬롯단위의어순변환및 슬롯내부의품사단위의어순변환을수행하는제 3 단계; 및상기슬롯단위및 슬롯내부의품사단위로어순변환된원시문장을정규화된자질값을갖는목적언어형태소로구성하는제 4 단계를포함하며, 자동번역시스템등에이용됨.
-
公开(公告)号:KR1020010075848A
公开(公告)日:2001-08-11
申请号:KR1020000002721
申请日:2000-01-20
Applicant: 한국전자통신연구원
IPC: G06F17/27
Abstract: PURPOSE: An apparatus and a method for recognizing a sentence range using regular expression and probabilistic context information are provided to recognize a sentence range using regular expression and probabilistic context information in process of morphological analysis and part-of-speech tagging, without executing sentence separation for an input string in advance. CONSTITUTION: The apparatus is composed of a token splitter(11), a morphological analyzer(12), a part-of-speech tagger(13), a sentence separation rule(14), a rule interpreter(15), a sentence splitter(16), and a probability dictionary(17). The token splitter(11) separates an input document into the sequence of tokens for tagging. The morphological analyzer(12) executes morphological analysis for input words using the probability dictionary(17) and generates an input structure of a probabilistic part-of-speech tagger. The part-of-speech tagger(13) eliminates the part-of-speech ambiguity of the current word using the probabilistic information of the current word and the probabilistic information of neighboring words. The rule interpreter(15), recognizing a context from the sentence separation rule(14), converts the sentence separation rule(14) into finite state automata in order to apply a sentence range recognition rule rapidly. The sentence splitter(16) splits a sentence using the probabilistic context information of the morphological analyzer(12) and the regular expression of the rule interpreter(15).
Abstract translation: 目的:提供使用正则表达式和概率上下文信息来识别句子范围的装置和方法,以在形态分析和部分语音标记过程中使用正则表达式和概率上下文信息来识别句子范围,而不执行句子分离 提前输入字符串。 构成:该设备由令牌分离器(11),形态分析器(12),词性标签器(13),句子分离规则(14),规则解释器(15),句子分离器 (16)和概率辞典(17)。 令牌分离器(11)将输入文档分成用于标记的令牌序列。 形态分析器(12)使用概率字典(17)对输入字执行形态分析,并且生成概率词性标签器的输入结构。 词性标记器(13)利用当前单词的概率信息和相邻单词的概率信息,消除了当前单词的词性模糊。 从句子分离规则(14)识别语境的规则解释器(15)将句子分离规则(14)转换为有限状态自动机,以便迅速应用句子范围识别规则。 句子分割器(16)使用形态分析器(12)的概率上下文信息和规则解释器(15)的正则表达式分割句子。
-
公开(公告)号:KR1020010057781A
公开(公告)日:2001-07-05
申请号:KR1019990061188
申请日:1999-12-23
Applicant: 한국전자통신연구원
IPC: G06F17/27
Abstract: PURPOSE: An apparatus and method for analyzing a multi-word morpheme is provided to increase the efficiency of the machine translation by registering the multi-word morpheme in a dictionary by combining a plurality of paragraphs. CONSTITUTION: An analysis control unit(101) refers a connection dictionary(102), which stores information for determining paragraphs to be analyzed. In addition, the analysis control unit(101) connects and transmits the paragraphs. A vocabulary dictionary(103) stores information needed to analyze and translate a morpheme. A connection rule(104) classifies a connection form of the morpheme, and sets a connection category. A morpheme analyzer(110) analyzes a multi-word morpheme. The morpheme analyzer(110) includes a morpheme analysis unit(111) which performs a morpheme analysis, a form analysis unit(112), an error processing unit(113) which processes an error of spacing words, a form restoration unit(114) and a code conversion unit(115) which mutually converts 2-byte completion code into 3-byte combination code.
Abstract translation: 目的:提供一种用于分析多字词素的装置和方法,用于通过组合多个段落来将多字词素注册在字典中来提高机器翻译的效率。 构成:分析控制单元(101)参考存储用于确定要分析的段落的信息的连接字典(102)。 此外,分析控制单元(101)连接并传送段落。 词汇词典(103)存储分析和翻译语素所需的信息。 连接规则(104)对语素的连接形式进行分类,并设置连接类别。 语素分析器(110)分析多字词素。 语素分析器(110)包括执行语素分析的语素分析单元(111),形式分析单元(112),处理间隔字的错误的错误处理单元(113),窗体恢复单元(114) 以及将2字节完成代码相互转换为3字节组合代码的代码转换单元(115)。
-
26.
公开(公告)号:KR1020010018214A
公开(公告)日:2001-03-05
申请号:KR1019990034077
申请日:1999-08-18
Applicant: 한국전자통신연구원
IPC: G06F17/27
Abstract: PURPOSE: The apparatus and the method of processing a HTML/SGML tag for a natural language are provided to enable an original document to be recognized by a sentence unit, and to generate a corrected document without the loss of the tag in the original document, by distinguishing a sentence unit tag from a word unit tag, and by using a user definition tag for a script and notes. CONSTITUTION: A memory load device(2) loads the data in a disk to a memory in response to an inputted HTML document(1). A HTML document(2) is loaded to the memory by the device(2). A device(3) separates the tag from the HTML document in the memory. A HTML tag database(3a) is referred in the separation of the tag. A memory(3b) stores the separated tag. A sentence recognition part(4) recognizes a sentence from which the tag is separated. A part(4a) stores the result of the sentence recognition. A device(5) processes the result thereof to form a translation and a summary. A memory(5a) stores the contents of the processed result. A tag recovery part(6) couples the tag with the contents referring to the data in the memory(5a) and the memory(3b). A memory(6a) stores the recovered tag.
Abstract translation: 目的:提供用于处理自然语言的HTML / SGML标签的装置和方法,以使原始文档能够由句子单元识别,并且生成经校正的文档而不损失原始文档中的标签, 通过将句子单位标签与单词标签区分开来,并通过使用用户定义标签进行脚本和笔记。 构成:存储器加载设备(2)响应输入的HTML文档(1)将磁盘中的数据加载到存储器。 HTML文档(2)由设备(2)加载到存储器。 设备(3)将标签与内存中的HTML文档分开。 在标签的分离中引用HTML标签数据库(3a)。 存储器(3b)存储分离的标签。 句子识别部分(4)识别标签被分离的句子。 部分(4a)存储句子识别的结果。 设备(5)处理其结果以形成翻译和摘要。 存储器(5a)存储处理结果的内容。 标签恢复部分(6)根据存储器(5a)和存储器(3b)中的数据将标签与内容耦合。 存储器(6a)存储恢复的标签。
-
27.
公开(公告)号:KR1020000038078A
公开(公告)日:2000-07-05
申请号:KR1019980052940
申请日:1998-12-03
Applicant: 한국전자통신연구원
IPC: G06F19/00
Abstract: PURPOSE: An apparatus and method for acquiring gradual language automated using extended variance rule for a large amount language batch are provided so that a whole field of a natural language process can be used and a language having low frequency can obtain gradually. CONSTITUTION: An apparatus for acquiring gradual language automated using extended variance rule for a large amount language batch includes an extractor for extracting an example of using. A repeat context extractor extracts among inputted languages. When extracting language by the extractors, a non-use filter detects whether the languages includes non-use language from a non-use dictionary.
Abstract translation: 目的:提供一种用于为大量语言批次采用扩展方差规则获取渐进语言自动化的装置和方法,使得可以使用自然语言处理的整个领域,并且可以逐渐获得具有低频率的语言。 构成:用于采用用于大量语言批量的扩展方差规则获取渐进语言自动化的装置包括用于提取使用示例的提取器。 重复上下文提取器在输入语言之间提取。 当提取器提取语言时,不使用的过滤器检测语言是否包含来自非使用字典的不使用语言。
-
公开(公告)号:KR100238451B1
公开(公告)日:2000-01-15
申请号:KR1019970065368
申请日:1997-12-02
Applicant: 한국전자통신연구원
IPC: G09B7/00
Abstract: 본 발명은 외국인을 포함하여 한국어를 모르는 사람에게 한국어를 교육시키기 위한 장치로서, 일방적인 교육 시스템이 아니라 학습자와의 상호 작용에 의한 학습 방법으로 학습자의 한국어에 대한 언어 수준을 장치가 자동으로 판단함으로써 학습자의 한국어 실력에 맞도록 학습 내용을 선정하여 한국어를 가르칠 수 있도록 구성되어 있으며, 학습자의 편의성을 위해 그래픽 기능, 문자 인식 기능, 음성 인식, 출력 기능, 철자 검사, 문법 검사 기능을 보유한 한국어 교육 시스템 및 제어방법에 관한 것이다.
-
公开(公告)号:KR1019990047859A
公开(公告)日:1999-07-05
申请号:KR1019970066400
申请日:1997-12-05
Applicant: 한국전자통신연구원
IPC: G06F17/30
Abstract: 본 발명은 도서 문헌 데이터베이스 검색을 위한 자연언어 대화 시스템에 관한 것으로, 종래에는 사용자가 원하는 정보를 얻고자 할 때 대상 데이터베이스의 구조를 파악하여, 단일 문장으로 완전한 질의문을 만들어야 하는 어려움이 따른다.
이에 본 발명은 사람과 기계간의 비교적 자연스러운 대화를 통한 자연언어 인터페이스를 가능하게 함으로써 전반적인 자연언어 시스템의 효율성과 실용화에 기여하며, 본 발명의 결과로 도출될 수 있는 언어 해석 방식 및 문맥처리 방식은 대화체 기계번역 시스템, 기타 대화 시스템이나 전화 사서함 등의 데이터베이스 인터페이스 분야에도 활용할 수 있게 하며, 호텔 예약, 항공 예약, 관광 예약 등에도 응용될 수 있다. -
-
-
-
-
-
-
-
-