Abstract:
본 발명은 비정형 텍스트 추출 성능 향상을 위한 시스템 및 방법에 관한 것으로서, 수집된 비정형 텍스트를 언어 분석하여, 이벤트 키워드, 이벤트가 발생한 시간정보 또는 공간정보를 추출하고, 상기 이벤트 키워드에 시간정보 또는 공간정보를 매핑시켜 추출 지식 후보들을 생성하는 비정형 데이터 처리부, 시공간 연계 정형 데이터를 이용하여 상기 비정형 데이터 처리부에서 생성된 추출 지식 후보들의 유효성을 판단하는 필터부를 포함한다.
Abstract:
다양한 스키마 및 데이터 형태/값을 가지는 서지 메타데이터를 효율적으로 관리할 수 있도록 이형의 스키마로 정의되는 서지 메타데이터로 변환하는 데 적합한 방법 및 장치가 개시된다. 메타데이터 변환 방법은 원시 메타데이터를 파싱하여 원시 스키마 및 원시 데이터 형태/값을 가지는 제1임시 메타 데이터를 생성하는 파싱 과정; 상기 제1임시 메타데이터의 원시 스키마를 목적 스키마로 변환하여 목적 스키마 및 원시 데이터 형태/값을 가지는 제2임시 메타데이터를 생성하는 스키마 변환 과정; 및 상기 제2임시 메타데이터의 원시 데이터 형태/값을 목적 메타데이터의 목적 데이터 형태/값으로 변환하여 목적 스키마 및 목적 데이터 형태/값을 가지는 목적 메타데이터를 생성하는 데이터 변환 과정을 포함한다.
Abstract:
PURPOSE: A multipurpose device for web resource archiving and a method thereof are provided to perform archiving for a dynamic webpage with a script and a plug-in as well as a static web page without the omission of web resources. CONSTITUTION: A web collection crawler(2010) accesses a URL(Uniform Resource Locator) to collect web document data and link file data. A web snap shot robot(2030) accesses the URL accessed by the web collection crawler to capture a web page screen as snap shot data. A database(2040) stores the web document data, the link file data, and the snap shot data. A web archiving mapper(2060) maps data corresponding to the same URL among the web document data, the link file data, and the snap shot data in order to output the same to the database. A web archiving managing unit(2050) hierarchically connects the mapped data to provide the connected web data. [Reference numerals] (2010) Web collection crawler; (2020) URL manager; (2030) Web snap shot robot; (2040) Database; (2050) Web archiving managing unit; (2060) Web archiving mapper; (2070) Web archiving browser; (2080) Web archiving update unit
Abstract:
본 발명은 통합 데이터베이스 구축을 위한 데이터 정제 시스템 및 방법과 이를 위한 기록매체에 관한 것으로서, 통신망을 통해 통신을 수행하기 위한 통신 인터페이스부; 복수의 기관 시스템으로부터 데이터를 수집하는 데이터 수집부; 데이터 수집부에 의해서 수집된 데이터를 기 설정된 검출 규칙과 비교하여 표준에 해당하지 않는 오류를 검출하는 데이터 오류 검출부; 데이터 오류 검출부에 의해서 검출된 데이터에 대해 기 설정된 정제 규칙에 따라 데이터를 정제하는 데이터 정제부; 데이터 정제 시스템과 관련된 정보를 저장하는 데이터베이스; 및 데이터 정제 시스템과 관련된 정보를 사용자가 확인할 수 있도록 제공하기 위한 사용자 인터페이스부;를 포함하여, 통합 데이터베이스 구축을 위해 분산되어 있는 데이터베이스의 데이터를 수집하여 오류를 검출하고, 검출된 오류를 정제하는 기술을 하나의 시스템 상에서 구현하기 때문에, 복수의 데이터베이스 각각에 저장되어 있는 데이터를 보다 체계적으로 관리할 수 있도록 하는 효과를 기대할 수 있다.
Abstract:
PURPOSE: A device for providing an organization name authority service and a method thereof are provided to enable a user to receive accurate results by setting a relationship between a representative organization name and a heterogeneous organization name. CONSTITUTION: A transceiver(310) receives an organization name search keyword from a terminal. An organization name extractor(320) extracts one or more organization names using a representative organization name table and another organization name table. A database(340) stores the representative organization name table and the another organization name table.
Abstract:
PURPOSE: A data cleansing system and a method for developing integrated database, and a recording medium therefor are provided to collect data of scattered databases and detect data error and refine detected error. CONSTITUTION: A data collecting unit(220) collects data from a plurality of agency systems. A data error detector(230) detects an error which does not correspond to a standard through a comparison between the collected data and preset detection rules. According to the preset purification rules, a data purifying unit(240) refines the detected data. A user interface unit(280) provides information related to a data purification system(200) to user.
Abstract:
기관명칭 전거 서비스를 제공하는 장치 및 그 방법이 개시된다. 본 발명에 따르면, 네트워크를 통해 하나 이상의 단말기와 연결되어 있고, 단말기의 요청에 따라 검색 서비스를 제공하는 장치에 있어서, 단말기로부터 기관명칭 검색키워드를 수신하는 송수신부; 복수 개의 대표 기관명칭을 포함하는 대표 기관명칭 테이블과 복수 개의 이형 기관명칭을 포함하는 이형 기관명칭 테이블을 이용하여 상기 기관명칭 검색키워드에 상응하는 적어도 하나의 이형기관명칭을 추출하는 기관명칭 추출부; 및 상기 대표 기관명칭 테이블과 상기 이형 기관명칭 테이블이 저장되어 있는 데이터베이스를 포함하되, 상기 대표 기관명칭 테이블은 기관의 대표 기관명칭, 국적, 기관유형, 대표 기관명칭코드가 기재되고, 상기 이형 기관명칭 테이블은 이형 기관명칭, 대표 기관명칭, 대표 기관명칭 코드, 이형 기관명칭 코드가 기재되고, 상기 대표 기관명칭은 상기 대표 기관명칭을 구성하는 명칭들 간의 상하위 레벨 구분에 따라 띄어쓰기가 결정되고 국적에 따라 표시되는 언어의 우선 순위가 결정되며, 상기 대표 기관명칭과 상기 이형 기관명칭 간의 연관관계를 이용하여 기관명칭 전거 서비스를 제공하는 것을 특징으로 하는 기관명칭 전거 서비스 장치가 제공된다. 기관명칭 검색, 전거 서비스, 시소러스.