과학기술핵심개체 간 의미적 연관관계 자동 추출을 위한 시맨틱 구문 트리 커널 기반 처리 시스템 및 방법
    1.
    发明申请
    과학기술핵심개체 간 의미적 연관관계 자동 추출을 위한 시맨틱 구문 트리 커널 기반 처리 시스템 및 방법 审中-公开
    基于语义语料库的基于KERNEL的处理系统及其自动提取科学与技术核心实体之间的语义关系的方法

    公开(公告)号:WO2011065617A1

    公开(公告)日:2011-06-03

    申请号:PCT/KR2009/007119

    申请日:2009-12-01

    CPC classification number: G06F17/30684 G06F17/2785 G06F19/12

    Abstract: 과학기술핵심개체 간 의미적 연관관계 자동 추출을 위한 시맨틱 구문 트리 커널 기반 처리 시스템 및 방법이 개시된다. 본 발명은 입력된 문장에 대한 구문, 품사 정보 및 기저구 정보를 분석하고, 분석한 구문, 품사 정보 및 기저구 정보를 바탕으로 가지치기를 수행하여 입력된 문장의 구문의 관계를 추출하고, 추출한 문장의 구문의 관계에 의해 입력된 문장의 구문의 구문적 유사도, 어휘 의미적 유사도 및 시맨틱 구문 트리 커널을 계산하여 입력된 문장의 구문의 유사도를 추출함으로써, 두 문장의 유사도를 정확하게 계산할 수 있다.

    Abstract translation: 公开了一种语义语法树内核处理系统和方法,用于自动提取科技核心实体之间的语义相关性。 根据本发明,分析语法,词性信息和输入句子的基础名词短语信息; 基于分析的语法,词性信息和基础名词短语信息进行分支,以提取输入句子之间的语法关系; 并且使用提取的句子语法关系来计算输入句子的语法相似度,词法语义相似度和语义语法树核心,以从输入句子中提取句法相似性,以便准确地计算两者的相似性 句子。

    기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 프레임워크
    2.
    发明申请
    기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 프레임워크 审中-公开
    用于提取技术条件之间关系的测试集合的半自动构建框架

    公开(公告)号:WO2011062311A1

    公开(公告)日:2011-05-26

    申请号:PCT/KR2009/006828

    申请日:2009-11-19

    CPC classification number: G06F17/30731

    Abstract: 본 발명은 기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 프레임워크에 관한 것으로서, 문헌에 존재하는 기술용어와 이들 간의 연관관계를 언어 자원을 기반으로 시스템적으로 처리하여, 제한된 문헌과 개체들을 기반으로 소규모의 테스트 컬렉션을 구축하는 기존의 접근법에서 벗어나 대규모의 학술 데이터 베이스와 다양한 분야의 전문용어 사전, 그리고 최신의 기계학습 알고리즘을 활용하여 실용적인 테스트 컬렉션을 구축하는 기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 프레임워크를 제공하여, 정형화되고 시간이 많이 소요되는 작업을 자동화시킴으로써, 구축자의 노력을 최소화할 수 있고, 구축자의 성향에 따라 발생하는 결과의 편차를 줄일 수 있는 효과가 있다.

    Abstract translation: 本发明涉及用于提取技术术语之间关系的半自动构建测试集合的框架,并提供了用于提取技术术语之间关系的测试集合的半自动构建的框架,其中实际测试集合 是通过系统地处理文本中存在的技术术语和基于语言资源的关联关系,并超越现有的基于有限文本和对象构建小规模测试集合的方法,而是有效地利用 大型学术数据库,各种专业词典和最新的机器学习算法。 本发明提供了优点,即可以最小化构造器部分的努力,并且可以通过自动执行标准化和耗时的任务来减少由于构造器的布置而发生的结果的变化。

    메타 데이터 변환 방법 및 이에 적합한 장치
    3.
    发明申请
    메타 데이터 변환 방법 및 이에 적합한 장치 审中-公开
    用于转换元数据的方法和装置

    公开(公告)号:WO2012169708A1

    公开(公告)日:2012-12-13

    申请号:PCT/KR2011/007802

    申请日:2011-10-19

    CPC classification number: G06F17/30297

    Abstract: 다양한 스키마 및 데이터 형태/값을 가지는 서지 메타데이터를 효율적으로 관리할 수 있도록 이형의 스키마로 정의되는 서지 메타데이터로 변환하는 데 적합한 방법 및 장치가 개시된다. 메타데이터 변환 방법은 원시 메타데이터를 파싱하여 원시 스키마 및 원시 데이터 형태/값을 가지는 제1임시 메타 데이터를 생성하는 파싱 과정; 상기 제1임시 메타데이터의 원시 스키마를 목적 스키마로 변환하여 목적 스키마 및 원시 데이터 형태/값을 가지는 제2임시 메타데이터를 생성하는 스키마 변환 과정; 및 상기 제2임시 메타데이터의 원시 데이터 형태/값을 목적 메타데이터의 목적 데이터 형태/값으로 변환하여 목적 스키마 및 목적 데이터 형태/값을 가지는 목적 메타데이터를 생성하는 데이터 변환 과정을 포함한다.

    Abstract translation: 公开了一种用于转换为浪涌元数据的方法和装置,其被定义为异构模式,其能够有效地管理具有各种方案和数据类型/值的浪涌元数据。 用于转换元数据的方法包括:解析步骤,通过解析原始元数据来生成具有原始模式和原始数据类型/值的第一瞬态元数据; 模式转换步骤,通过将第一瞬态元数据的原始模式转换为目标模式来生成具有目标模式的第二瞬态元数据和原始数据类型/值; 以及数据转换步骤,通过将第二瞬时元数据的原始数据类型/值转换为目标元数据的目标数据类型/值来生成具有目标模式的目标元数据和目标数据类型/值。

    웹 자원 아카이빙을 위한 장치 및 방법
    4.
    发明公开
    웹 자원 아카이빙을 위한 장치 및 방법 有权
    WEB资源存档的设备和方法

    公开(公告)号:KR1020130017620A

    公开(公告)日:2013-02-20

    申请号:KR1020110080176

    申请日:2011-08-11

    CPC classification number: G06F17/30864

    Abstract: PURPOSE: A multipurpose device for web resource archiving and a method thereof are provided to perform archiving for a dynamic webpage with a script and a plug-in as well as a static web page without the omission of web resources. CONSTITUTION: A web collection crawler(2010) accesses a URL(Uniform Resource Locator) to collect web document data and link file data. A web snap shot robot(2030) accesses the URL accessed by the web collection crawler to capture a web page screen as snap shot data. A database(2040) stores the web document data, the link file data, and the snap shot data. A web archiving mapper(2060) maps data corresponding to the same URL among the web document data, the link file data, and the snap shot data in order to output the same to the database. A web archiving managing unit(2050) hierarchically connects the mapped data to provide the connected web data. [Reference numerals] (2010) Web collection crawler; (2020) URL manager; (2030) Web snap shot robot; (2040) Database; (2050) Web archiving managing unit; (2060) Web archiving mapper; (2070) Web archiving browser; (2080) Web archiving update unit

    Abstract translation: 目的:提供一种用于Web资源归档的多用途设备及其方法,以便通过脚本和插件以及静态网页对动态网页进行归档,而不会遗漏Web资源。 规定:Web集合搜寻器(2010)访问URL(统一资源定位器)以收集Web文档数据和链接文件数据。 网络快照机器人(2030)访问网络收集爬行器访问的URL,以捕获网页屏幕作为快照数据。 数据库(2040)存储web文档数据,链接文件数据和快照数据。 网页归档映射器(2060)在web文档数据,链接文件数据和快照数据之间映射与相同URL相对应的数据,以将其输出到数据库。 网络存档管理单元(2050)分层地连接映射的数据以提供所连接的网络数据。 [参考数字](2010)Web collection crawler; (2020)网址管理员; (2030)网络快照机器人; (2040)数据库; (2050)网络归档管理单元; (2060)网络存档映射器; (2070)网络归档浏览器; (2080)Web归档更新单元

    동사기반패턴을 이용한 대용량 문헌정보 내에서의 기술용어간 관계추출 시스템
    5.
    发明授权
    동사기반패턴을 이용한 대용량 문헌정보 내에서의 기술용어간 관계추출 시스템 有权
    基于动词模式的大量信息中技术术语关系提取系统

    公开(公告)号:KR101061391B1

    公开(公告)日:2011-09-01

    申请号:KR1020080113564

    申请日:2008-11-14

    CPC classification number: G06F17/30731 G06F17/30684

    Abstract: 동사기반패턴을 이용한 대용량 문헌정보 내에서의 기술용어간 관계추출 시스템이 개시된다. 본 발명은 과학기술분야 학술문헌 데이터베이스를 대상으로 텍스트에 포함된 기술용어와 그들 간의 연관관계를 인식할 수 있는 타마 수단을 이용하여 과학기술 전 분야에 걸쳐 있는 초록 및 서지 데이터베이스로부터 동사기반 패턴 중심의 관계추출을 할 수 있는 장치로서, 대규모의 학술 데이터베이스를 활용한 실용적인 관계추출 시스템 구조를 제공하는 효과가 있다.
    STM, 타마, TAMA, 데이터베이스, 연관관계, 티알디, 아트

    Abstract translation: 公开了一种用于使用基于动词的模式提取大容量文档信息中的技术术语之间的关系的系统。 本发明涉及一种用于基于抽象和书目数据库来验证基于动词的模式的方法和系统,其通过使用能够识别文本中包括的技术术语及其之间的关系的多巴手段涵盖所有科学和技术领域, 作为能够提取关系的设备,具有提供利用大规模学术数据库的实际关系提取系统结构的效果。

    문맥의 의미적 연관관계 추출 방법 및 그 장치와 그 프로그램 소스를 저장한 기록 매체
    6.
    发明授权
    문맥의 의미적 연관관계 추출 방법 및 그 장치와 그 프로그램 소스를 저장한 기록 매체 有权
    提取上下文和装置的语义关系的方法以及存储程序源的记录介质

    公开(公告)号:KR101045955B1

    公开(公告)日:2011-07-04

    申请号:KR1020080113565

    申请日:2008-11-14

    CPC classification number: G06F17/2785

    Abstract: 문맥의 의미적 연관관계 추출 방법 및 그 장치와 그 프로그램 소스를 저장한 기록 매체가 개시된다. 본 발명은 소정의 어휘단어와 인과관계로 연결된 제1 개념과, 제1 개념과 인과 관계로 연결된 제2 개념을 탐색하고 그들의 연관관계를 판단하여 연구주제로 추천하는 방법으로 문서 전문을 구문 분석하여 기술용어들을 인식하고 이들간의 연관관계를 이용하여 연구주제를 추천하기 위한 것으로, 대용량 데이터베이스의 전체적인 검색 효율성과 활용성을 높이는 산업적 이용효과와 검색된 기술용어들의 관계를 분석 및 축적하여 기술정보들의 연관 관계, 시계열 분석, 분류 등을 실시간으로 신속하게 검색하고 추적하여 기술검토 및 개발을 용이하게 하는 사용상 편리한 효과가 있다.
    연관관계, UPK, 어휘단어, STM, 연관규칙, TAMA, TLA

    Abstract translation: 语义关系提取方法和装置和存储的上下文的节目源的记录介质被启动。 本发明分析专业如何导航与某些词汇和因果关系相关联的第一概念相关联的所述第二概念的文档,和因果关系的第一个概念,通过参照其关联语法的研究课题确定 打算利用它们之间的关系,认识到技术术语和建议的研究课题,工业用效果之间的关系的关系找到专业术语,提高整体搜索效率和大型数据库的分析利用和积累技术资料 ,它是在时间序列分析,分类检索,包括实时跟踪,以快速,轻松地查看和技术开发的使用效果方便。

    사용자 맞춤형 연구 정보 제공 방법 및 시스템
    7.
    发明授权
    사용자 맞춤형 연구 정보 제공 방법 및 시스템 失效
    提供有序研究信息的方法和系统

    公开(公告)号:KR100976722B1

    公开(公告)日:2010-08-18

    申请号:KR1020070133017

    申请日:2007-12-18

    CPC classification number: G06N5/04 G06F17/30699 G06N5/00

    Abstract: 본 발명은 사용자 맞춤형 연구 정보를 제공하는 방법에 있어서, 연구 지원 포탈 서버에서 관심 분야 선택 정보가 수신되면, 구비된 지식베이스를 검색하여 상기 관심 분야에 대한 세부 분야 정보를 추출하고, 상기 추출된 세부 분야 정보를 포함하는 사용자 프로파일 정보 입력 화면을 생성하여 클라이언트에게 제공하고, 상기 클라이언트에서 상기 사용자 프로파일 정보 입력 화면을 통해 각 세부 분야에 대한 전문성 정도 및 최종 목표를 포함하는 사용자 프로파일 정보를 입력받아 상기 연구 지원 포탈 서버에 전송하고, 상기 연구 지원 포탈 서버에서 상기 세부 분야 정보에 대한 상기 사용자 프로파일 정보내 전문성 정도와 최종 목표 수준을 비교하여 상기 사용자 프로파일 정보내 전문성 정도가 최종 목표 수준보다 낮으면 최종 목표 수준 이하에 대응되는 세부 분야별 정보를 추출하고, 상기 전문성 정도가 최종 목표 수준보다 높으면 세부 분야별 정보를 추출하지 않고, 상기 전문성 정도가 최종 목표 수준과 같으면 상기 최종 목표 수준에 대응되는 세부 분야별 연구 정보를 추출하고, 상기 추출된 세부 분야별 연구 정보의 난이도에 따라 세부 분야에 대한 연구 순서를 정하여 상기 클라이언트에게 제공함으로써 클라이언트로 하여금 현재 지식베이스에 대한 구조적인 접근을 가능하게 하고, 사용자가 인과 관계에 있는 세부 분야에 대한 절차적인 접근을 할 수 있도록 한다.
    연구정보, 지식베이스, RDF

    대용량 데이터베이스의 의미기반 기술용어 발굴 장치
    8.
    发明授权
    대용량 데이터베이스의 의미기반 기술용어 발굴 장치 有权
    用于大型数据库的语言技术智能语言挖掘系统的设备

    公开(公告)号:KR100963667B1

    公开(公告)日:2010-06-15

    申请号:KR1020080040595

    申请日:2008-04-30

    Abstract: 본 발명은 대용량 데이터베이스의 의미기반 기술용어 발굴 장치에 관한 것으로, 특히 관리 데이터베이스로부터 특정 기술 분야의 정보를 검색할 신규 및 시드의 기술용어와 문맥정보에 기반한 질의어를 검색하여 출력하는 에이알엠(ARM) 수단; 에이알엠 수단으로부터 입력되는 기술용어와 문맥정보에 기반한 질의어가 포함되는 문서집합과 해당 포스팅 정보를 과학정보 데이터베이스로부터 추출하는 티알에스(TRS) 수단; 티알에스 수단이 제공하는 문서집합과 포스팅 정보로부터 기술용어와 문맥정보를 추출하고, 기술용어 들의 연관관계를 분석하는 분석수단; 분석수단으로부터 기술용어, 문맥정보, 연관관계 정보와 문서집합을 제공받고 기술용어의 발생시간, 발생위치, 저자를 포함하여 발생빈도, 연관, 확장의 관계에 의한 기술지식을 추적하여 추출하는 추적수단; 분석수단이 추출한 기술용어, 문맥정보, 연관관계 정보를 제공받고 신규 기술용어와 문맥정보를 추출하여 관리 데이터베이스에 기록하는 에이알이에스(ARES) 수단; 및 에이알이에스 수단에 접속하고 외부 자원으로부터 기술용어, 문맥정보, 연관관계와 기술문서를 추출하여 제공하는 이알에이(ERA) 수단; 을 포함하는 구성을 특징으로 하여, 대용량 데이터베이스의 전체 검색 효율성과 활용성을 높이고, 검색된 기술용어 들의 관계를 분석 및 축적하여 기술정보들의 연관 관계, 시계열 분석, 분류 등을 실시간으로 신속하게 검색 및 추적하여 기술검토, 개발 및 의사결정을 신속하게 하는 효과가 있다.
    특허, 논문, 데이터베이스, 검색, 질의어, 기술용어, 문맥정보, 추출

    대용량 데이터베이스의 의미기반 기술용어 발굴 장치
    9.
    发明公开
    대용량 데이터베이스의 의미기반 기술용어 발굴 장치 有权
    用于大型数据库的语言技术智能语言挖掘系统的设备

    公开(公告)号:KR1020090114778A

    公开(公告)日:2009-11-04

    申请号:KR1020080040595

    申请日:2008-04-30

    Abstract: PURPOSE: An extracting device for a semantic technological term of a high-capacity database is provided to enhance the effectiveness of a search by repetitively extracting technological term and complex-technological term and managing the extracted terms as technological intelligence. CONSTITUTION: An ARM(Acquisition Rule Manager) unit(100) searches a query language and outputs the searched query language. A TRS(Tech Retrieval System) unit(110) extracts the document group in which the query language is included and posting information. An ERA(External Resource Aggregator) unit(170) extracts the technological term, contextual information, associative relation, and technical report. The ERA unit provides the extracted information.

    Abstract translation: 目的:提供大容量数据库语义技术术语的提取装置,通过重复提取技术术语和复杂技术术语,将提取的术语作为技术智能来提高搜索的有效性。 构成:ARM(采集规则管理器)单元(100)搜索查询语言并输出搜索到的查询语言。 TRS(技术检索系统)单元(110)提取包含查询语言的文档组和发布信息。 ERA(外部资源聚合器)单元(170)提取技术术语,情境信息,关联关系和技术报告。 ERA单元提供提取的信息。

    웹 검색 기반 용어 인식 방법 및 장치
    10.
    发明授权
    웹 검색 기반 용어 인식 방법 및 장치 有权
    基于WEB搜索的术语识别的方法和装置

    公开(公告)号:KR101243054B1

    公开(公告)日:2013-03-13

    申请号:KR1020120074060

    申请日:2012-07-06

    CPC classification number: G06F17/21 G06F17/2705 G06F17/30663 G06F17/30864

    Abstract: PURPOSE: A web search based word recognition method and a device thereof are provided to use a web search result for a word candidate extracted from a document group as statistical information for assigning a weighted value for the word candidate, thereby reflecting the weighted value and recognizing a new word. CONSTITUTION: A word candidate extraction unit obtains part of speech information and original word information by analyzing sentences of an input document. The word candidate extraction unit extracts word candidates by using the part of speech information, the original word information, and a stored word candidate pattern. A quality extraction unit obtains basic quality for the word candidates and web quality of a web search result(S306). A word recognition unit assigns a weighted value by applying machine learning to the basic quality and the web quality and recognizes a word candidate which the weighted value is the highest as a word(S308). [Reference numerals] (AA) Start; (BB) End; (S302) Extracting word candidates by analyzing an input document; (S304) Obtaining basic quality for the extracted word candidates and web quality of a web search result; (S306) Obtaining basic quality of each word candidate and web quality of the web search result; (S308) Recognizing a word candidate which the weighted value is the highest as a word

    Abstract translation: 目的:提供一种基于网络搜索的词识别方法及其装置,用于将从文档组提取的词候选的网页搜索结果用作用于分配词候选的加权值的统计信息,从而反映加权值并识别 一个新词 构成:单词候选提取单元通过分析输入文档的句子来获得语音信息和原始单词信息。 词候选提取单元通过使用部分语音信息,原始词信息和存储的词候选模式来提取词候选。 质量提取单元获得网页搜索结果的候选词和网页质量的基本质量(S306)。 字识别单元通过将机器学习应用于基本质量和网页质量来分配加权值,并将加权值最高的词候选码识别为字(S308)。 (附图标记)(AA)开始; (BB)结束; (S302)通过分析输入文档来提取词候选; (S304)获取提取的词候选的基本质量和网页搜索结果的网页质量; (S306)获取每个单词候选人的基本素质和网页搜索结果的网页质量; (S308)识别作为单词的加权值最高的单词候选

Patent Agency Ranking