-
公开(公告)号:KR100911620B1
公开(公告)日:2009-08-12
申请号:KR1020070128556
申请日:2007-12-11
Applicant: 한국전자통신연구원
IPC: G06F17/21
Abstract: 본 발명은 HTML(Hyper Text Mark-up Language) 웹 문서의 특징인 구조화된 문서로부터 정보를 추출하는 방법에 관한 것으로, 영역 적응성을 높이기 위한 구조정보 반자동 추출 기술에 관한 것이다. 본 발명은 사용자 간섭을 최소화하기 위해 기계학습을 기반으로 하고 있으며, 영역 내 사이트간의 적응성을 높이기 위해 학습모델을 영역과 사이트 별로 나누어 학습하는 2단계의 자질학습 방법을 포함한다. 본 발명에 의하면, 웹 사이트의 일부 소량의 데이터만 수작업으로 태깅(tagging)하여 학습하더라도 해당 웹 사이트의 속성들을 자동으로 대량 추출이 가능하며, 2단계의 학습모델을 사용함으로 인해, 한 사이트에서 학습한 정보를 같은 영역의 타 사이트에도 적용이 될 수 있기 때문에 사이트가 바뀔 때마다 매번 새로운 추출패턴 등의 리소스(resource)를 구축해야하는 부담을 덜어줌으로써 동 영역내 사이트 간의 적응성을 높이는 장점이 있다.
구조정보, 랩퍼(Wrapper), XHTML(eXtensible Hyper Text Mark-up Language), DOM(Document Object Model)-
公开(公告)号:KR100881334B1
公开(公告)日:2009-02-02
申请号:KR1020070119262
申请日:2007-11-21
Applicant: 한국전자통신연구원
IPC: H04N21/45
Abstract: 본 발명은 사용자 요구에 따라 정보를 제공하기 위한 장치 및 방법에 관한 것으로서, 보다 상세하게는 사용자로부터 수신한 대화형 입력에 기반하여 사용자의 요구를 분석하고 이에 대응하는 정보를 제공하는 대화형 정보 제공 서비스 장치 및 방법에 관한 것이다. 본 발명에 따른 대화형 정보 제공 서비스 장치는 사용자로부터 수신된 입력문을 분석하는 대화문 분석부; 상기 대화문분석부의 분석결과를 이용하여 상기 사용자의 요구를 분석하는 대화 관리부; 상기 대화관리부로부터 실시간 정보 갱신요청이 있는 경우, 웹상에 갱신되는 일상생활 정보를 실시간으로 추출하여 일상정보 데이터베이스에 저장하는 실시간 자동 지식 구축부; 상기 대화관리부에서 분석된 상기 사용자의 요구에 대한 응답을 생성하고 사용자에게 응답을 제공하는 응답 생성부; 및 상기 사용자의 요구에 응답이 불가능한 경우 또는 상기 사용자의 요구에 대한 응답에 오류가 있는 경우, 상기 사용자로 하여금 상기 사용자의 요구를 취소할 수 있도록 하고 시스템을 복원하는 예외 처리부로 구성된다. 본 발명은 대화형 입력에 기반하여 사용자의 요구를 분석하고 이에 대응하는 정보를 제공함으로써, 사용자가 편리하게 필요한 정보를 획득하도록 할 수 있다.
음성대화 시스템, 대화관리, 실시간 지식 구축, 예외처리, 오류복원-
公开(公告)号:KR1020070060862A
公开(公告)日:2007-06-13
申请号:KR1020050120977
申请日:2005-12-09
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2818
Abstract: A device and a method for constructing learning data are provided to reduce expense/time required for constructing the learning data by generating candidate learning data through machine learning, calculating a reliability store of each candidate learning data, and selecting the learning data from the candidate learning data. An incremental learning part(10) generates a learning model from initial learning data(11) by using the machine learning. An automatic tag attaching part(20) generates the candidate learning data by automatically attaching a tag to a raw corpus(21) based on the generated learning model. A candidate learning data selector(30) selects the candidate learning data by calculating the reliability score of the generated candidate learning data. A manual error corrector(40) provides an interface for displaying the selected candidate learning data(41) to a user and enabling the user to correct an error.
Abstract translation: 提供一种用于构建学习数据的装置和方法,以通过机器学习产生候选学习数据来计算构建学习数据所需的费用/时间,计算每个候选学习数据的可靠性存储,以及从候选学习中选择学习数据 数据。 增量学习部分(10)通过使用机器学习从初始学习数据(11)生成学习模型。 基于生成的学习模型,自动标签附加部件(20)通过自动地将标签附加到原始语料库(21)来生成候选学习数据。 候选学习数据选择器(30)通过计算所生成的候选学习数据的可靠性分数来选择候选学习数据。 手动错误校正器(40)提供用于将选择的候选学习数据(41)显示给用户并使用户能够校正错误的接口。
-
公开(公告)号:KR100599450B1
公开(公告)日:2006-07-12
申请号:KR1020040109134
申请日:2004-12-21
Applicant: 한국전자통신연구원
IPC: G06F17/26
Abstract: 본 발명은 질의응답시스템에서의 정답색인 시스템 및 방법에 관한 것으로서, 입력문을 LF(Logical Form) 단위와 문장 단위로 각 어휘들을 정답대상어와 단서어로 나누고, 각 단서어와 정답대상어 쌍을 색인 할 수 있는 방법을 제시하여 정답 제시에서의 속도를 개선함으로써, 질의응답에서 사용자의 질문에 대한 검색 결과인 방대한 문서로부터 사용자가 원하는 정답만을 초점으로 할 수 있으므로 정보검색 및 질의응답 시스템의 성능을 개선할 수 있다.
질의응답, 정답 색인Abstract translation: 涉及在电话系统中的正确索引系统和方法的本发明的查询,以便将输入门语言答案daesangeo并导致每个词汇为LF(逻辑形式)单元和一个句子单元,索引每个线索鳗鱼答案daesangeo对 通过提高通过介绍,在问题和答案给出答案的速度,方式可以是你的问题的搜索结果提供给用户的大量文件,以提高信息检索的性能和问答系统,这样你就可以只专注于所期望的答案 有。
-
公开(公告)号:KR100504632B1
公开(公告)日:2005-08-03
申请号:KR1020020008514
申请日:2002-02-18
Applicant: 한국전자통신연구원
IPC: G06F17/30
Abstract: 본 발명은 비구조 문서에서 사용자가 요구하는 정보를 추출하는 장치 및 그 방법에 관한 것이다.
본 발명은 사용자가 추출정보 명세부(10)에 추출하고자 하는 정보를 지정하여 입력하면, 이벤트 템플릿 추출부(20)가 입력된 정보추출용 문서(21)에 추출정보 명세부(10)에 지정된 정보가 포함되어 있는가를 판별하여 특정한 논항구조로 된 문장단위의 이벤트 템플릿을 추출하고, 이벤트 템플릿 통합부(30)가 이벤트 템플릿들을 논항구조와 그 내용의 일치 여부에 따라서 서로 통합한 후, 템플릿 추출부(40)가 통합된 이벤트 템플릿들 중에서 사용자가 추출하고자 하는 정보만을 보유한 템플릿을 추출하여 데이터 베이스(41)에 저장하도록 되어 있으며,
이에 따라서, 인터넷이나 회사에서 보유하고 있는 문서의 구조를 알 수 없는 일반 한국어 문서에서 특정 영역의 정보 구축을 최소화하면서 원하는 정보를 용이하게 추출할 수 있으며, 특히 사용자가 접근할 수 있는 정보의 양을 넓히면서 원하는 정보에 접근하는 시간을 줄 일 수 있다.-
公开(公告)号:KR100413966B1
公开(公告)日:2004-01-07
申请号:KR1020000077945
申请日:2000-12-18
Applicant: 한국전자통신연구원
IPC: G06F17/27
Abstract: PURPOSE: A system and a method for guiding a standard sentence pattern are provided to guide a user in a standard sentence pattern in real time by consulting the standard Korean sentence pattern. CONSTITUTION: The system includes an input unit(110) through which a user inputs a sentence, a morpheme analyzing unit(120) to divide the inputted sentence into the syllables and to analyze the morphemes composing the syllables, a vocabulary information extracting unit(130) to extract the vocabulary information of the analyzed sentence, a standard sentence pattern rule determining unit(140) to determine standard sentence pattern rules and apply the rules, and an output unit(170) to output a standardized sentence pattern of the inputted sentence depending on the applied standard sentence pattern rules. The standard sentence pattern rule determining unit applies the most proper one among the Korean standard sentence pattern rules loaded and pre-stored in the system. A standard sentence pattern is verified and deducted by using the abbreviation deduction patterns sought by an abbreviation deduction pattern search unit(150).
Abstract translation: 目的:提供一种指导标准句型的系统和方法,通过查阅标准的韩语句型,实时引导用户使用标准句型。 该系统包括用户通过其输入句子的输入单元(110),将输入的句子划分成音节并分析组成音节的语素的词素分析单元(120),词汇信息提取单元(130 )提取所分析的句子的词汇信息;标准句型规则确定单元(140),用于确定标准句型规则并应用规则;以及输出单元(170),用于输出所输入句子的标准化句型, 对应用的标准句型规则。 标准句型规则确定单元应用加载并预先存储在系统中的韩语标准句型规则中最适当的一个。 通过使用由缩写推断模式搜索单元(150)搜索的缩写推断模式来验证并且扣除标准句型。
-
公开(公告)号:KR1020030054297A
公开(公告)日:2003-07-02
申请号:KR1020010084438
申请日:2001-12-24
Applicant: 한국전자통신연구원
CPC classification number: H04L67/22 , H04L29/06 , H04L67/04 , H04L67/18 , H04L67/306 , H04L69/329
Abstract: PURPOSE: A device for servicing custom-made one-stop information of a mobile user and a method therefor are provided to share various services by using a user-demand technology, and to supply one integrated service, thereby dynamically generating various complex services and contents according to user taste. CONSTITUTION: A mobile terminal(100) receives an OSS(One-Stop Service) by accessing a mobile web application server. A screen processing module(210) consists of java server page and java servlet for the OSS generated in mobile web application server page type. A service processor(220) generates an OSS log, and displays a corresponding expert site in service bean type. An external service(230) generates a mobile web application server system, and performs an OSS contents connection. An external system(300) supplies study and contents services according to various information supplied from the external service(230). A site supplying system(500) supplies the corresponding expert site.
Abstract translation: 目的:提供用于维护移动用户定制一站式信息的设备及其方法,以通过使用用户需求技术来共享各种服务,并提供一个集成服务,从而动态生成各种复杂服务和内容 根据用户的口味。 规定:移动终端(100)通过访问移动Web应用服务器来接收OSS(一站式服务)。 屏幕处理模块(210)由java服务器页面和用于在移动Web应用程序服务器页面类型中生成的OSS的java servlet组成。 服务处理器(220)生成OSS日志,并在服务bean类型中显示相应的专家站点。 外部服务(230)生成移动Web应用服务器系统,并执行OSS内容连接。 外部系统(300)根据从外部服务提供的各种信息(230)提供学习和内容服务。 现场供应系统(500)提供相应的专家站点。
-
公开(公告)号:KR1020020058639A
公开(公告)日:2002-07-12
申请号:KR1020000086754
申请日:2000-12-30
Applicant: 한국전자통신연구원
IPC: G06F17/30
CPC classification number: G06F17/30616 , G06F17/30663 , G06F17/3069 , G06F17/30911
Abstract: PURPOSE: A system for searching an XML document and a method thereof are provided to search contents and a structure with respect to a user's query integrally from indexed information by integrally indexing contents and a structure with respect to an XML document. CONSTITUTION: A DTD(Document Type Definition) reduction unit(200) is provided for reducing a complicated DTD to a simple DTD for being used in an index and a search and making an index config file. An index unit(210) is provided for receiving the config file and an XML document made at the DTD reduction unit(200) for an index. An index information storing unit(230) is provided for receiving and storing index information from the index unit(210). A search unit is provided for receiving and searching a general query and a structure query from a user. An index document converting unit(211) receives the XML document and the config file, performs a parsing of the XML document, and makes a file for an index. A morpheme interpreting unit(212) is provided for interpreting a morpheme with respect to an index file made by the index document converting unit(211). An index language extracting unit(213) for extracting an index language in a result of the morpheme interpreting unit(212). An element and position information extracting unit(214) is provided for extracting element information and position information of the index language extracted in the index language extracting unit(213).
Abstract translation: 目的:提供一种用于搜索XML文档的系统及其方法,用于通过对内容和关于XML文档的结构进行整体索引来从索引信息中整体地搜索关于用户查询的内容和结构。 规定:提供DTD(文件类型定义)缩小单元(200),用于将复杂的DTD减少到简单的DTD,用于索引和搜索以及制作索引配置文件。 提供索引单元(210),用于接收用于索引的配置文件和在DTD缩减单元(200)处制作的XML文档。 索引信息存储单元(230)用于从索引单元(210)接收和存储索引信息。 提供搜索单元用于从用户接收和搜索一般查询和结构查询。 索引文档转换单元(211)接收XML文档和配置文件,执行XML文档的解析,并创建索引文件。 语素解释单元(212)被提供用于相对于由索引文档转换单元(211)制作的索引文件来解释语素。 一种用于提取语素解释单元(212)的结果中的索引语言的索引语言提取单元(213)。 提供元素和位置信息提取单元(214),用于提取在索引语言提取单元(213)中提取的索引语言的元素信息和位置信息。
-
-
-
-
-
-
-