-
公开(公告)号:WO2012169708A1
公开(公告)日:2012-12-13
申请号:PCT/KR2011/007802
申请日:2011-10-19
CPC classification number: G06F17/30297
Abstract: 다양한 스키마 및 데이터 형태/값을 가지는 서지 메타데이터를 효율적으로 관리할 수 있도록 이형의 스키마로 정의되는 서지 메타데이터로 변환하는 데 적합한 방법 및 장치가 개시된다. 메타데이터 변환 방법은 원시 메타데이터를 파싱하여 원시 스키마 및 원시 데이터 형태/값을 가지는 제1임시 메타 데이터를 생성하는 파싱 과정; 상기 제1임시 메타데이터의 원시 스키마를 목적 스키마로 변환하여 목적 스키마 및 원시 데이터 형태/값을 가지는 제2임시 메타데이터를 생성하는 스키마 변환 과정; 및 상기 제2임시 메타데이터의 원시 데이터 형태/값을 목적 메타데이터의 목적 데이터 형태/값으로 변환하여 목적 스키마 및 목적 데이터 형태/값을 가지는 목적 메타데이터를 생성하는 데이터 변환 과정을 포함한다.
Abstract translation: 公开了一种用于转换为浪涌元数据的方法和装置,其被定义为异构模式,其能够有效地管理具有各种方案和数据类型/值的浪涌元数据。 用于转换元数据的方法包括:解析步骤,通过解析原始元数据来生成具有原始模式和原始数据类型/值的第一瞬态元数据; 模式转换步骤,通过将第一瞬态元数据的原始模式转换为目标模式来生成具有目标模式的第二瞬态元数据和原始数据类型/值; 以及数据转换步骤,通过将第二瞬时元数据的原始数据类型/值转换为目标元数据的目标数据类型/值来生成具有目标模式的目标元数据和目标数据类型/值。
-
公开(公告)号:KR101226163B1
公开(公告)日:2013-01-24
申请号:KR1020120077381
申请日:2012-07-16
Applicant: 한국과학기술정보연구원
CPC classification number: G06F17/30297 , G06F17/2795 , G06F17/30303
Abstract: PURPOSE: A scheme matching device and a method thereof are provided to accurately determine a response relation between terminal nodes in a scheme by measuring similarity through location and matching relations between nodes. CONSTITUTION: A scheme parser(110) generates a hierarchical structure by parsing a target scheme. A language similarity measuring unit(120) measures a language similarity value between terminal nodes in the hierarchical structure. A terminal node matching unit(130) selects a matched terminal node and determines a response relation of the terminal nodes by using the language similarity value. If two or more terminal nodes are selected, a structure similarity measuring unit(140) obtains a neighboring node similarity value and a path similarity value of the terminal nodes. The terminal node matching unit selects a matching terminal node having the biggest similarity value and determines the response relation. [Reference numerals] (100) Scheme matching device; (110) Scheme parser; (120) Language similarity measuring unit; (130) Terminal node matching unit; (140) Structure similarity measuring unit; (160) Matching node information DB
Abstract translation: 目的:提供一种方案匹配装置及其方法,通过测量位置和节点间匹配关系的相似度来准确地确定方案中终端节点之间的响应关系。 构成:方案解析器(110)通过解析目标方案来生成层次结构。 语言相似度测量单元(120)在层次结构中测量终端节点之间的语言相似度值。 终端节点匹配单元(130)选择匹配的终端节点,并通过使用语言相似度值来确定终端节点的响应关系。 如果选择了两个以上的终端节点,则结构相似度测量单元(140)获得终端节点的相邻节点相似度值和路径相似度值。 终端节点匹配单元选择具有最大相似度值的匹配终端节点并确定响应关系。 (附图标记)(100)方案匹配装置; (110)方案解析器; (120)语言相似性测量单元; (130)终端节点匹配单元; (140)结构相似度测量单元; (160)匹配节点信息DB
-
公开(公告)号:KR101374195B1
公开(公告)日:2014-03-13
申请号:KR1020110123596
申请日:2011-11-24
Applicant: 한국과학기술정보연구원
Abstract: 다차원 지식을 자동으로 추출하고 활용 및 공유할 수 있는 대규모 학술적 과학 지식 메모리 기반의 심층 지식 제공을 위한 방법 및 장치가 개시된다.
학술적 과학 지식 메모리 기반의 심층 지식 제공 장치는 문서에 대한 관계형 지식(Relational Knowledge), 구조적 지식(Structural Knowledge), 절차적 지식(Procedural Knowledge)을 저장하는 지식 메모리; 및
질의어를 입력하고, 상기 지식 메모리로부터 입력된 질의어를 포함하는 트리플 및 트리플에 관련된 문서들을 검색하여 제시하는 심층 지식 제공부;를 포함한다.-
公开(公告)号:KR101244357B1
公开(公告)日:2013-03-18
申请号:KR1020110080176
申请日:2011-08-11
Applicant: 한국과학기술정보연구원
Abstract: 본 발명은 웹 자원을 아카이빙하기 위한 방법 및 장치에 관한 것이다.
본 발명의 일 실시예에 따른 웹 자원 아카이빙 장치는 URL(Uniform Resource Locator)에 접속하여 웹 문서 자료 및 링크 파일 자료를 수집하는 웹 수집 크롤러, 웹 수집 크롤러가 접속했던 URL에 접속하여 웹페이지 화면을 스냅샷 자료로 캡쳐하는 웹 스냅샷 로봇, 상기 웹 문서 자료, 링크 파일 자료 및 스냅샷 자료들을 저장하는 데이터 베이스, 데이터 베이스에 저장된 상기 웹 문서 자료, 링크 파일 자료 및 스냅샷 자료 중 동일 URL에 해당하는 자료들을 상호 맵핑하여 데이터 베이스로 출력하는 웹 아카이빙 맵퍼, 웹 아카이빙 맵퍼에 맵핑을 지시하고, 맵핑된 자료들을 계층적으로 연결(link)시켜 연결된 웹 자료를 제공하는 웹 아카이빙 관리부를 포함한다.-
公开(公告)号:KR1020120135782A
公开(公告)日:2012-12-17
申请号:KR1020110054690
申请日:2011-06-07
Applicant: 한국과학기술정보연구원
CPC classification number: G06F17/30297
Abstract: PURPOSE: A metadata converting method and a suitable device therefor are provided to easily convert bibliographic metadata into another format by simplifying a schema conversion process resolving schema heterogeneity and a data conversion process resolving data heterogeneity. CONSTITUTION: A parser(902) parses raw metadata to generate first temporarily metadata having a raw data type/value and a raw schema. An item converter(906) converts the raw schema of the first temporarily metadata into a target schema to generate second temporarily metadata having the target schema and the raw data type/value. A data converter(910) converts the raw data type/value of the second temporarily metadata into a target data type/value of target metadata to generate the target metadata having the target data type/value and the target schema. [Reference numerals] (902) Parser; (904) Parsing information; (906) Item converter; (908) Mapping information; (910) Data converter; (912) Code table; (914) Conversion rule; (916) Script source; (918) Temporary DB 1; (920) Temporary DB 2; (922) Target DB; (AA) Item conversion; (BB) Value conversion; (CC) Various types of acquired data
Abstract translation: 目的:提供一种元数据转换方法及其适合的设备,通过简化模式转换过程来解决模式异质性和解决数据异质性的数据转换过程,轻松地将书目元数据转换成另一种格式。 构成:解析器(902)解析原始元数据以生成具有原始数据类型/值和原始模式的第一个临时元数据。 项目转换器(906)将第一临时元数据的原始模式转换为目标模式以生成具有目标模式和原始数据类型/值的第二临时元数据。 数据转换器(910)将第二临时元数据的原始数据类型/值转换为目标元数据的目标数据类型/值,以生成具有目标数据类型/值和目标模式的目标元数据。 (附图标记)(902)解析器; (904)解析信息; (906)项目转换器; (908)映射信息; (910)数据转换器; (912)代码表; (914)转换规则; (916)脚本源 (918)临时DB 1; (920)临时DB 2; (922)目标数据库; (AA)项目转换; (BB)价值转换; (CC)各种类型的采集数据
-
公开(公告)号:KR101243054B1
公开(公告)日:2013-03-13
申请号:KR1020120074060
申请日:2012-07-06
Applicant: 한국과학기술정보연구원
CPC classification number: G06F17/21 , G06F17/2705 , G06F17/30663 , G06F17/30864
Abstract: PURPOSE: A web search based word recognition method and a device thereof are provided to use a web search result for a word candidate extracted from a document group as statistical information for assigning a weighted value for the word candidate, thereby reflecting the weighted value and recognizing a new word. CONSTITUTION: A word candidate extraction unit obtains part of speech information and original word information by analyzing sentences of an input document. The word candidate extraction unit extracts word candidates by using the part of speech information, the original word information, and a stored word candidate pattern. A quality extraction unit obtains basic quality for the word candidates and web quality of a web search result(S306). A word recognition unit assigns a weighted value by applying machine learning to the basic quality and the web quality and recognizes a word candidate which the weighted value is the highest as a word(S308). [Reference numerals] (AA) Start; (BB) End; (S302) Extracting word candidates by analyzing an input document; (S304) Obtaining basic quality for the extracted word candidates and web quality of a web search result; (S306) Obtaining basic quality of each word candidate and web quality of the web search result; (S308) Recognizing a word candidate which the weighted value is the highest as a word
Abstract translation: 目的:提供一种基于网络搜索的词识别方法及其装置,用于将从文档组提取的词候选的网页搜索结果用作用于分配词候选的加权值的统计信息,从而反映加权值并识别 一个新词 构成:单词候选提取单元通过分析输入文档的句子来获得语音信息和原始单词信息。 词候选提取单元通过使用部分语音信息,原始词信息和存储的词候选模式来提取词候选。 质量提取单元获得网页搜索结果的候选词和网页质量的基本质量(S306)。 字识别单元通过将机器学习应用于基本质量和网页质量来分配加权值,并将加权值最高的词候选码识别为字(S308)。 (附图标记)(AA)开始; (BB)结束; (S302)通过分析输入文档来提取词候选; (S304)获取提取的词候选的基本质量和网页搜索结果的网页质量; (S306)获取每个单词候选人的基本素质和网页搜索结果的网页质量; (S308)识别作为单词的加权值最高的单词候选
-
公开(公告)号:KR1020150119749A
公开(公告)日:2015-10-26
申请号:KR1020140045568
申请日:2014-04-16
Applicant: 한국과학기술정보연구원
IPC: G06F17/30
CPC classification number: G06F17/30144
Abstract: 본발명은데이터베이스의데이터변경이력관리를위한시스템및 방법에관한것으로, 데이터베이스, 요청내용, 요청자, 요청출처중 적어도하나를포함하는데이터변경요청정보가접수된경우, 상기데이터변경요청정보를상기데이터베이스에반영하고, 상기데이터베이스의변경로그를이용하여데이터변경요청정보의정합성을점검하는업무관리시스템을포함한다.
Abstract translation: 本发明涉及一种用于管理数据库的数据的变更历史的系统和方法。 用于管理数据变更历史的系统包括工作管理系统,如果接收到包括数据库,请求内容,请求者和请求源中的至少一个的数据变更请求信息,则将数据变更请求信息应用于数据库 ,并通过使用数据库的更改日志检查数据更改请求信息的完整性。
-
公开(公告)号:KR1020130057715A
公开(公告)日:2013-06-03
申请号:KR1020110123596
申请日:2011-11-24
Applicant: 한국과학기술정보연구원
CPC classification number: G06F17/3064 , G06F17/30672
Abstract: PURPOSE: A deep knowledge providing method based on a scientific knowledge memory and a device thereof are provided to analyze literature of a specific science field and copy a complex process which learns knowledge by using natural language processing and mining technology, thereby automatically extracting and accumulating specialized knowledge. CONSTITUTION: A knowledge memory(304) stores relational knowledge, structural knowledge, and procedural knowledge for a document. A deep knowledge providing unit(306) inputs a query language. The deep knowledge providing unit searches and provides a triple which includes the query language and documents related to the triple. The deep knowledge providing unit uses a GCL(Generalized Concordance Lists) query which searches a specific word or a relation between word sets or between words. [Reference numerals] (302) Multidimensional knowledge generating technology; (304a) Relational knowledge memory; (304b) Structural knowledge memory; (304c) Procedural knowledge memory; (306) Deep knowledge providing technology; (AA) Large scholarly information; (BB) Deep knowledge delivery by field
Abstract translation: 目的:提供基于科学知识记忆及其设备的深度知识提供方法,分析具体科学领域的文献,并复制使用自然语言处理和挖掘技术学习知识的复杂过程,从而自动提取和累积专门的 知识。 规定:知识记忆(304)存储文档的关系知识,结构知识和程序知识。 深度知识提供单元(306)输入查询语言。 深入的知识提供部门搜索并提供了一个三元组,其中包括与三元组相关的查询语言和文档。 深度的知识提供单元使用搜索特定词或词组之间或词之间的关系的GCL(广义一致列表)查询。 (附图标记)(302)多维知识生成技术; (304a)关系知识记忆; (304b)结构知识记忆; (304c)程序知识记忆; (306)深入的知识提供技术; (AA)大学术信息; (BB)深入知识交付领域
-
公开(公告)号:KR1020130017620A
公开(公告)日:2013-02-20
申请号:KR1020110080176
申请日:2011-08-11
Applicant: 한국과학기술정보연구원
CPC classification number: G06F17/30864
Abstract: PURPOSE: A multipurpose device for web resource archiving and a method thereof are provided to perform archiving for a dynamic webpage with a script and a plug-in as well as a static web page without the omission of web resources. CONSTITUTION: A web collection crawler(2010) accesses a URL(Uniform Resource Locator) to collect web document data and link file data. A web snap shot robot(2030) accesses the URL accessed by the web collection crawler to capture a web page screen as snap shot data. A database(2040) stores the web document data, the link file data, and the snap shot data. A web archiving mapper(2060) maps data corresponding to the same URL among the web document data, the link file data, and the snap shot data in order to output the same to the database. A web archiving managing unit(2050) hierarchically connects the mapped data to provide the connected web data. [Reference numerals] (2010) Web collection crawler; (2020) URL manager; (2030) Web snap shot robot; (2040) Database; (2050) Web archiving managing unit; (2060) Web archiving mapper; (2070) Web archiving browser; (2080) Web archiving update unit
Abstract translation: 目的:提供一种用于Web资源归档的多用途设备及其方法,以便通过脚本和插件以及静态网页对动态网页进行归档,而不会遗漏Web资源。 规定:Web集合搜寻器(2010)访问URL(统一资源定位器)以收集Web文档数据和链接文件数据。 网络快照机器人(2030)访问网络收集爬行器访问的URL,以捕获网页屏幕作为快照数据。 数据库(2040)存储web文档数据,链接文件数据和快照数据。 网页归档映射器(2060)在web文档数据,链接文件数据和快照数据之间映射与相同URL相对应的数据,以将其输出到数据库。 网络存档管理单元(2050)分层地连接映射的数据以提供所连接的网络数据。 [参考数字](2010)Web collection crawler; (2020)网址管理员; (2030)网络快照机器人; (2040)数据库; (2050)网络归档管理单元; (2060)网络存档映射器; (2070)网络归档浏览器; (2080)Web归档更新单元
-
-
-
-
-
-
-
-