Abstract:
과학기술핵심개체 간 의미적 연관관계 자동 추출을 위한 시맨틱 구문 트리 커널 기반 처리 시스템 및 방법이 개시된다. 본 발명은 입력된 문장에 대한 구문, 품사 정보 및 기저구 정보를 분석하고, 분석한 구문, 품사 정보 및 기저구 정보를 바탕으로 가지치기를 수행하여 입력된 문장의 구문의 관계를 추출하고, 추출한 문장의 구문의 관계에 의해 입력된 문장의 구문의 구문적 유사도, 어휘 의미적 유사도 및 시맨틱 구문 트리 커널을 계산하여 입력된 문장의 구문의 유사도를 추출함으로써, 두 문장의 유사도를 정확하게 계산할 수 있다.
Abstract:
본 발명은 기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 프레임워크에 관한 것으로서, 문헌에 존재하는 기술용어와 이들 간의 연관관계를 언어 자원을 기반으로 시스템적으로 처리하여, 제한된 문헌과 개체들을 기반으로 소규모의 테스트 컬렉션을 구축하는 기존의 접근법에서 벗어나 대규모의 학술 데이터 베이스와 다양한 분야의 전문용어 사전, 그리고 최신의 기계학습 알고리즘을 활용하여 실용적인 테스트 컬렉션을 구축하는 기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 프레임워크를 제공하여, 정형화되고 시간이 많이 소요되는 작업을 자동화시킴으로써, 구축자의 노력을 최소화할 수 있고, 구축자의 성향에 따라 발생하는 결과의 편차를 줄일 수 있는 효과가 있다.
Abstract:
다양한 스키마 및 데이터 형태/값을 가지는 서지 메타데이터를 효율적으로 관리할 수 있도록 이형의 스키마로 정의되는 서지 메타데이터로 변환하는 데 적합한 방법 및 장치가 개시된다. 메타데이터 변환 방법은 원시 메타데이터를 파싱하여 원시 스키마 및 원시 데이터 형태/값을 가지는 제1임시 메타 데이터를 생성하는 파싱 과정; 상기 제1임시 메타데이터의 원시 스키마를 목적 스키마로 변환하여 목적 스키마 및 원시 데이터 형태/값을 가지는 제2임시 메타데이터를 생성하는 스키마 변환 과정; 및 상기 제2임시 메타데이터의 원시 데이터 형태/값을 목적 메타데이터의 목적 데이터 형태/값으로 변환하여 목적 스키마 및 목적 데이터 형태/값을 가지는 목적 메타데이터를 생성하는 데이터 변환 과정을 포함한다.
Abstract:
PURPOSE: A multipurpose device for web resource archiving and a method thereof are provided to perform archiving for a dynamic webpage with a script and a plug-in as well as a static web page without the omission of web resources. CONSTITUTION: A web collection crawler(2010) accesses a URL(Uniform Resource Locator) to collect web document data and link file data. A web snap shot robot(2030) accesses the URL accessed by the web collection crawler to capture a web page screen as snap shot data. A database(2040) stores the web document data, the link file data, and the snap shot data. A web archiving mapper(2060) maps data corresponding to the same URL among the web document data, the link file data, and the snap shot data in order to output the same to the database. A web archiving managing unit(2050) hierarchically connects the mapped data to provide the connected web data. [Reference numerals] (2010) Web collection crawler; (2020) URL manager; (2030) Web snap shot robot; (2040) Database; (2050) Web archiving managing unit; (2060) Web archiving mapper; (2070) Web archiving browser; (2080) Web archiving update unit
Abstract:
동사기반패턴을 이용한 대용량 문헌정보 내에서의 기술용어간 관계추출 시스템이 개시된다. 본 발명은 과학기술분야 학술문헌 데이터베이스를 대상으로 텍스트에 포함된 기술용어와 그들 간의 연관관계를 인식할 수 있는 타마 수단을 이용하여 과학기술 전 분야에 걸쳐 있는 초록 및 서지 데이터베이스로부터 동사기반 패턴 중심의 관계추출을 할 수 있는 장치로서, 대규모의 학술 데이터베이스를 활용한 실용적인 관계추출 시스템 구조를 제공하는 효과가 있다. STM, 타마, TAMA, 데이터베이스, 연관관계, 티알디, 아트
Abstract:
문맥의 의미적 연관관계 추출 방법 및 그 장치와 그 프로그램 소스를 저장한 기록 매체가 개시된다. 본 발명은 소정의 어휘단어와 인과관계로 연결된 제1 개념과, 제1 개념과 인과 관계로 연결된 제2 개념을 탐색하고 그들의 연관관계를 판단하여 연구주제로 추천하는 방법으로 문서 전문을 구문 분석하여 기술용어들을 인식하고 이들간의 연관관계를 이용하여 연구주제를 추천하기 위한 것으로, 대용량 데이터베이스의 전체적인 검색 효율성과 활용성을 높이는 산업적 이용효과와 검색된 기술용어들의 관계를 분석 및 축적하여 기술정보들의 연관 관계, 시계열 분석, 분류 등을 실시간으로 신속하게 검색하고 추적하여 기술검토 및 개발을 용이하게 하는 사용상 편리한 효과가 있다. 연관관계, UPK, 어휘단어, STM, 연관규칙, TAMA, TLA
Abstract:
본 발명은 사용자 맞춤형 연구 정보를 제공하는 방법에 있어서, 연구 지원 포탈 서버에서 관심 분야 선택 정보가 수신되면, 구비된 지식베이스를 검색하여 상기 관심 분야에 대한 세부 분야 정보를 추출하고, 상기 추출된 세부 분야 정보를 포함하는 사용자 프로파일 정보 입력 화면을 생성하여 클라이언트에게 제공하고, 상기 클라이언트에서 상기 사용자 프로파일 정보 입력 화면을 통해 각 세부 분야에 대한 전문성 정도 및 최종 목표를 포함하는 사용자 프로파일 정보를 입력받아 상기 연구 지원 포탈 서버에 전송하고, 상기 연구 지원 포탈 서버에서 상기 세부 분야 정보에 대한 상기 사용자 프로파일 정보내 전문성 정도와 최종 목표 수준을 비교하여 상기 사용자 프로파일 정보내 전문성 정도가 최종 목표 수준보다 낮으면 최종 목표 수준 이하에 대응되는 세부 분야별 정보를 추출하고, 상기 전문성 정도가 최종 목표 수준보다 높으면 세부 분야별 정보를 추출하지 않고, 상기 전문성 정도가 최종 목표 수준과 같으면 상기 최종 목표 수준에 대응되는 세부 분야별 연구 정보를 추출하고, 상기 추출된 세부 분야별 연구 정보의 난이도에 따라 세부 분야에 대한 연구 순서를 정하여 상기 클라이언트에게 제공함으로써 클라이언트로 하여금 현재 지식베이스에 대한 구조적인 접근을 가능하게 하고, 사용자가 인과 관계에 있는 세부 분야에 대한 절차적인 접근을 할 수 있도록 한다. 연구정보, 지식베이스, RDF
Abstract:
본 발명은 대용량 데이터베이스의 의미기반 기술용어 발굴 장치에 관한 것으로, 특히 관리 데이터베이스로부터 특정 기술 분야의 정보를 검색할 신규 및 시드의 기술용어와 문맥정보에 기반한 질의어를 검색하여 출력하는 에이알엠(ARM) 수단; 에이알엠 수단으로부터 입력되는 기술용어와 문맥정보에 기반한 질의어가 포함되는 문서집합과 해당 포스팅 정보를 과학정보 데이터베이스로부터 추출하는 티알에스(TRS) 수단; 티알에스 수단이 제공하는 문서집합과 포스팅 정보로부터 기술용어와 문맥정보를 추출하고, 기술용어 들의 연관관계를 분석하는 분석수단; 분석수단으로부터 기술용어, 문맥정보, 연관관계 정보와 문서집합을 제공받고 기술용어의 발생시간, 발생위치, 저자를 포함하여 발생빈도, 연관, 확장의 관계에 의한 기술지식을 추적하여 추출하는 추적수단; 분석수단이 추출한 기술용어, 문맥정보, 연관관계 정보를 제공받고 신규 기술용어와 문맥정보를 추출하여 관리 데이터베이스에 기록하는 에이알이에스(ARES) 수단; 및 에이알이에스 수단에 접속하고 외부 자원으로부터 기술용어, 문맥정보, 연관관계와 기술문서를 추출하여 제공하는 이알에이(ERA) 수단; 을 포함하는 구성을 특징으로 하여, 대용량 데이터베이스의 전체 검색 효율성과 활용성을 높이고, 검색된 기술용어 들의 관계를 분석 및 축적하여 기술정보들의 연관 관계, 시계열 분석, 분류 등을 실시간으로 신속하게 검색 및 추적하여 기술검토, 개발 및 의사결정을 신속하게 하는 효과가 있다. 특허, 논문, 데이터베이스, 검색, 질의어, 기술용어, 문맥정보, 추출
Abstract:
PURPOSE: An extracting device for a semantic technological term of a high-capacity database is provided to enhance the effectiveness of a search by repetitively extracting technological term and complex-technological term and managing the extracted terms as technological intelligence. CONSTITUTION: An ARM(Acquisition Rule Manager) unit(100) searches a query language and outputs the searched query language. A TRS(Tech Retrieval System) unit(110) extracts the document group in which the query language is included and posting information. An ERA(External Resource Aggregator) unit(170) extracts the technological term, contextual information, associative relation, and technical report. The ERA unit provides the extracted information.
Abstract:
PURPOSE: A web search based word recognition method and a device thereof are provided to use a web search result for a word candidate extracted from a document group as statistical information for assigning a weighted value for the word candidate, thereby reflecting the weighted value and recognizing a new word. CONSTITUTION: A word candidate extraction unit obtains part of speech information and original word information by analyzing sentences of an input document. The word candidate extraction unit extracts word candidates by using the part of speech information, the original word information, and a stored word candidate pattern. A quality extraction unit obtains basic quality for the word candidates and web quality of a web search result(S306). A word recognition unit assigns a weighted value by applying machine learning to the basic quality and the web quality and recognizes a word candidate which the weighted value is the highest as a word(S308). [Reference numerals] (AA) Start; (BB) End; (S302) Extracting word candidates by analyzing an input document; (S304) Obtaining basic quality for the extracted word candidates and web quality of a web search result; (S306) Obtaining basic quality of each word candidate and web quality of the web search result; (S308) Recognizing a word candidate which the weighted value is the highest as a word