기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 프레임워크
    1.
    发明申请
    기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 프레임워크 审中-公开
    用于提取技术条件之间关系的测试集合的半自动构建框架

    公开(公告)号:WO2011062311A1

    公开(公告)日:2011-05-26

    申请号:PCT/KR2009/006828

    申请日:2009-11-19

    CPC classification number: G06F17/30731

    Abstract: 본 발명은 기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 프레임워크에 관한 것으로서, 문헌에 존재하는 기술용어와 이들 간의 연관관계를 언어 자원을 기반으로 시스템적으로 처리하여, 제한된 문헌과 개체들을 기반으로 소규모의 테스트 컬렉션을 구축하는 기존의 접근법에서 벗어나 대규모의 학술 데이터 베이스와 다양한 분야의 전문용어 사전, 그리고 최신의 기계학습 알고리즘을 활용하여 실용적인 테스트 컬렉션을 구축하는 기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 프레임워크를 제공하여, 정형화되고 시간이 많이 소요되는 작업을 자동화시킴으로써, 구축자의 노력을 최소화할 수 있고, 구축자의 성향에 따라 발생하는 결과의 편차를 줄일 수 있는 효과가 있다.

    Abstract translation: 本发明涉及用于提取技术术语之间关系的半自动构建测试集合的框架,并提供了用于提取技术术语之间关系的测试集合的半自动构建的框架,其中实际测试集合 是通过系统地处理文本中存在的技术术语和基于语言资源的关联关系,并超越现有的基于有限文本和对象构建小规模测试集合的方法,而是有效地利用 大型学术数据库,各种专业词典和最新的机器学习算法。 本发明提供了优点,即可以最小化构造器部分的努力,并且可以通过自动执行标准化和耗时的任务来减少由于构造器的布置而发生的结果的变化。

    문헌에서 용어에 대한 서술적 개념 표현을 추출하기 위한 장치 및 그 방법
    2.
    发明申请
    문헌에서 용어에 대한 서술적 개념 표현을 추출하기 위한 장치 및 그 방법 审中-公开
    提取文件中预期概念表达的装置和方法

    公开(公告)号:WO2013172499A1

    公开(公告)日:2013-11-21

    申请号:PCT/KR2012/003996

    申请日:2012-05-21

    CPC classification number: G06F17/27

    Abstract: 본 발명은 문헌에서 용어에 대한 서술적 개념 표현을 추출하기 위한 장치 및 그 동작 방법을 개시한다. 즉, 문장을 구성하는 단어 간의 문법적 관계를 기초로 상기 문장에 포함된 하나 이상의 단어를 술어(Predicate)로서 지정하며, 상기 술어로 지정된 각각의 단어와 관계되는 하나 이상의 단어를 논항(Argument)으로 지정하여 상기 문장에 대응하는 술어-논항 튜플(Predicate Argument Tuple)을 추출하는 변환처리부; 상기 변환처리부로부터 추출되어 전달되는 순어-논항 튜플을 각각의 문장에 대응하여 저장하는 정보저장부; 및 질의어에 해당하는 문장으로부터 추출되는 하나 이상의 술어-논항 튜플을 상기 변환처리부로부터 수신하고, 상기 수신된 각각의 술어-논항 튜플 중 적어도 하나를 포함하는 문장을 상기 정보저장부로부터 추출하는 정보검색부를 포함함으로써, 단편적으로 진행되었던 문헌에 대한 개념적 접근이 실질적으로 가능하도록 하며, 사용자 측면에서 자신이 원하는 용어 개념이 포함된 보다 광범위한 정보 접근이 가능하다.

    Abstract translation: 本发明公开了一种用于提取文档中的术语的谓词概念表达的装置及其操作方法。 本发明包括:转换处理单元,用于基于包括句子的单词之间的语法关系指定句子中包含的一个或多个词作为谓词,并且将作为参数的一个或多个词指定为指定为 谓词,以便提取与句子相对应的谓词参数元组; 信息存储单元,用于将从转换处理单元提取并传送的谓词参数元组与每个句子进行匹配并保存; 以及信息搜索单元,用于从所述转换处理单元接收从与查询词相对应的句子中提取的一个或多个谓词参数元组,以及从所述信息保存单元提取包括接收到的谓词参数元组中的至少一个的句子 ,从而基本上实现了对迄今为止分散的文档的概念方法,并且实现了包括用户期望的术语概念的更广泛的信息方法。

    과학기술핵심개체 간 의미적 연관관계 자동 추출을 위한 시맨틱 구문 트리 커널 기반 처리 시스템 및 방법
    3.
    发明申请
    과학기술핵심개체 간 의미적 연관관계 자동 추출을 위한 시맨틱 구문 트리 커널 기반 처리 시스템 및 방법 审中-公开
    基于语义语料库的基于KERNEL的处理系统及其自动提取科学与技术核心实体之间的语义关系的方法

    公开(公告)号:WO2011065617A1

    公开(公告)日:2011-06-03

    申请号:PCT/KR2009/007119

    申请日:2009-12-01

    CPC classification number: G06F17/30684 G06F17/2785 G06F19/12

    Abstract: 과학기술핵심개체 간 의미적 연관관계 자동 추출을 위한 시맨틱 구문 트리 커널 기반 처리 시스템 및 방법이 개시된다. 본 발명은 입력된 문장에 대한 구문, 품사 정보 및 기저구 정보를 분석하고, 분석한 구문, 품사 정보 및 기저구 정보를 바탕으로 가지치기를 수행하여 입력된 문장의 구문의 관계를 추출하고, 추출한 문장의 구문의 관계에 의해 입력된 문장의 구문의 구문적 유사도, 어휘 의미적 유사도 및 시맨틱 구문 트리 커널을 계산하여 입력된 문장의 구문의 유사도를 추출함으로써, 두 문장의 유사도를 정확하게 계산할 수 있다.

    Abstract translation: 公开了一种语义语法树内核处理系统和方法,用于自动提取科技核心实体之间的语义相关性。 根据本发明,分析语法,词性信息和输入句子的基础名词短语信息; 基于分析的语法,词性信息和基础名词短语信息进行分支,以提取输入句子之间的语法关系; 并且使用提取的句子语法关系来计算输入句子的语法相似度,词法语义相似度和语义语法树核心,以从输入句子中提取句法相似性,以便准确地计算两者的相似性 句子。

    패스웨이 구축 시스템 및 방법
    4.
    发明申请
    패스웨이 구축 시스템 및 방법 审中-公开
    道路施工系统与方法

    公开(公告)号:WO2014021656A1

    公开(公告)日:2014-02-06

    申请号:PCT/KR2013/006941

    申请日:2013-08-01

    CPC classification number: G06F17/30696 G06F17/30864 G06F19/12 G06F19/24

    Abstract: 본 발명은 패스웨이 구축 시스템 및 방법에 관한 것으로, 단백질, 질병, 합성물, 징후, 효소, 의약폼, 질병, 장소, 패스웨이 중 적어도 하나에 대한 개체명이 저장된 사전 정보 데이터베이스, 상기 사전 정보 데이터베이스를 이용하여 입력 문서에서 개체들을 인식하는 개체 인식부, 기 저장된 문맥 패턴 정보를 근거로 상기 인식된 개체 사이의 문맥을 추출하고, 상기 추출된 문맥을 정규화하는 방식으로 개체간의 관계를 인식하는 관계 인식부, 상기 인식된 개체들을 대상으로 웹 검색을 수행하여, 상기 개체들이 출현하는 문서 및 각 개체들의 세포 내 장소 정보를 수집하고, 상기 수집된 정보에 의한 관계 이벤트를 생성하는 관계 이벤트 생성부, 상기 인식된 관계 이벤트를 근거로 세포내 해당 장소에 해당 개체들을 표시하여 패스웨이를 생성하는 패스웨이 생성부를 포함한다.

    Abstract translation: 本发明涉及一种用于途径构建的系统和方法,包括用于存储蛋白质的实体名称的预先信息数据库,疾病,化合物,症状,酶,药物,疾病,位置和/或途径; 实体识别单元,用于使用所述预先信息数据库从输入文档识别实体; 关系识别单元,用于基于所述预先存储的上下文模式信息来提取所识别的实体之间的上下文,并通过归一化所提取的上下文来识别所述实体之间的关系; 关系事件发生单元,用于对所识别的实体进行网络搜索以收集包括所述实体的文档和关于所述实体的单元中的点的信息,以及基于所收集的信息生成关系事件; 以及路径产生单元,用于基于所识别的关系事件在单元格中的相关点处显示相关实体以生成路径。

    패러프레이즈 식별 기반 문장 유사도 판단 장치 및 그 방법
    5.
    发明申请
    패러프레이즈 식별 기반 문장 유사도 판단 장치 및 그 방법 审中-公开
    用于确定基于分辨率识别的SENTENCES之间的相似性的装置和方法

    公开(公告)号:WO2013172500A1

    公开(公告)日:2013-11-21

    申请号:PCT/KR2012/003998

    申请日:2012-05-21

    CPC classification number: G06F17/27

    Abstract: 본 발명은 패러프레이즈 식별 기반 문장 유사도 판단 장치 및 그 동작 방법을 개시한다. 즉, 문장을 구성하는 단어 간의 문법적 관계를 기초로, 상기 문장의 각 구절에 포함된 2 이상의 단어에 대한 상관 관계 지정을 통해 제1문장 및 제2문장 각각에 대응하는 술어-논항 튜플(Predicate Argument Tuple)을 추출하는 구문분석단계; 상기 제1문장으로부터 추출된 하나 이상의 술어-논항 튜플과 상기 제2문장으로부터 추출된 하나 이상의 술어-논항 튜플 간의 유사도를 측정하는 유사도측정단계; 및 상기 측정된 술어-논항 튜플 간의 유사도를 기초로 상기 제1문장 및 상기 제2문장 간의 유사도를 측정하기 위한 근사 정렬을 수행하는 근사정렬수행단계를 포함함으로써, 패러프레이즈 식별 문제를 지도 학습(supervised learning) 기반의 자동 분류 모델로 접근할 수 있다.

    Abstract translation: 本发明公开了一种用于确定基于释义识别的句子之间的相似性的装置及其操作方法。 本发明包括:短语分析步骤,通过基于语法关系指定句子中每个短语中包括的两个或多个单词之间的相关性,分别提取与第一句子和第二句子相对应的谓词参数元组 包含句子的词之间; 相似度测量步骤,用于测量从第一句子提取的一个或多个谓词参数元组与从第二句子提取的一个或多个谓词参数元组之间的相似度; 以及基于所测量的谓词参数元组的相似度,执行用于测量第一句和第二句之间的相似度的近似对准的近似对准步骤,由此使得能够接受解释性识别问题 监督学习型自动分类模型。

    그래프 데이터 기반 인스턴스 경로 탐색 시스템 및 방법
    6.
    发明授权
    그래프 데이터 기반 인스턴스 경로 탐색 시스템 및 방법 有权
    装置和方法基于图形数据搜索实时路径

    公开(公告)号:KR101270476B1

    公开(公告)日:2013-06-03

    申请号:KR1020120083211

    申请日:2012-07-30

    CPC classification number: G06F17/30445

    Abstract: PURPOSE: A graph data-based instance route search system and a method thereof are provided to efficiently search for correlations by applying instance information and relation information between classes to a parallel graph database. CONSTITUTION: A peer server information database(160) stores information about a class route managed by peer servers. A graph database(110) stores class information about keywords and relation information. If two or more keywords are inputted by a user, a master server(100) extracts a class about the keywords from the graph database and confirms the peer servers from the peer server information database in order to transmit a route search command including the class to the peer servers. [Reference numerals] (100) Master server; (110) Graph DB; (120) Communication unit; (130) User interface unit; (140) Class route generating unit; (150) Route search request processing unit; (160) Peer server information DB

    Abstract translation: 目的:提供一种基于图形数据的实例路由搜索系统及其方法,通过将实例信息和类之间的关系信息应用于并行图形数据库来有效地搜索相关性。 构成:对等服务器信息数据库(160)存储由对等服务器管理的类路由的信息。 图形数据库(110)存储关于关键词和关系信息的类信息。 如果用户输入两个或多个关键字,则主服务器(100)从图表数据库中提取关于关键字的类,并从对等服务器信息数据库确认对等服务器,以便将包括该类的路由搜索命令发送到 对等服务器。 (附图标记)(100)主服务器; (110)图DB; (120)通讯单元; (130)用户界面单元; (140)类路由生成单元; (150)路由搜索请求处理单元; (160)对等服务器信息DB

    데이터 분배 시스템 및 방법
    7.
    发明授权
    데이터 분배 시스템 및 방법 有权
    用于数据分配的系统和方法

    公开(公告)号:KR101269428B1

    公开(公告)日:2013-05-30

    申请号:KR1020120083209

    申请日:2012-07-30

    Abstract: PURPOSE: A data distribution system and a method thereof are provided to minimize network IO time and join operations between nodes in a distribution parallel system, thereby shortening response time of the whole system. CONSTITUTION: Data nodes(200a-200c) store data. A management node(100) confirms a type pattern by analyzing the data. The management node determines a data node which stores the data based on state information of data nodes which the type pattern is set and distributes the data to the data node. When the data includes a plurality of type patterns, the management node is assigned to one data node. [Reference numerals] (100) Management node; (200a) Data node 1; (200b) Data node 2; (200c) Data node n; (AA) Data

    Abstract translation: 目的:提供一种数据分发系统及其方法,以最小化分布并行系统中节点之间的网络IO时间和加入操作,从而缩短整个系统的响应时间。 规定:数据节点(200a-200c)存储数据。 管理节点(100)通过分析数据来确认类型模式。 管理节点基于数据节点的状态信息来确定存储数据的数据节点,该节点的类型模式被设置并将数据分发到数据节点。 当数据包括多个类型模式时,管理节点被分配给一个数据节点。 (附图标记)(100)管理节点; (200a)数据节点1; (200b)数据节点2; (200c)数据节点n; (AA)数据

    그리드 컴퓨팅을 이용한 과학기술지식발견 프레임워크
    8.
    发明公开
    그리드 컴퓨팅을 이용한 과학기술지식발견 프레임워크 有权
    使用网格计算的科学知识发现框架

    公开(公告)号:KR1020110051886A

    公开(公告)日:2011-05-18

    申请号:KR1020090108696

    申请日:2009-11-11

    Abstract: PURPOSE: A framework for scientific knowledge discovery is provided to create an advanced scientific knowledge using a grid computing technology. CONSTITUTION: A globus toolkit(300) constitutes a grid environment and a database about a large capacity resources and integrally manages the computing resources. A SINDI(Scientific INtelligence DIscovery) core(200) automatically recognizes and classifies scientific technique document from the database, extracts a core technique, and reports interactions among the techniques. A SINDI workflow unit(500) creates a work flow in order to extract knowledge which a user wants to find using the database and the core techniques.

    Abstract translation: 目的:提供科学知识发现框架,通过网格计算技术创造先进的科学知识。 构成:一个globus工具包(300)构成了一个网格环境和一个关于大容量资源的数据库,并整合了计算资源。 SINDI(科学智能DIscovery)核心(200)自动识别和分类数据库中的科学技术文档,提取核心技术,并报告技术之间的相互作用。 SINDI工作流单元(500)创建工作流程,以便提取使用数据库和核心技术的用户想要查找的知识。

    기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 시스템
    9.
    发明公开
    기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 시스템 失效
    用于测试收集的半自动构造框架专门用于评估技术术语之间的关系提取

    公开(公告)号:KR1020110051885A

    公开(公告)日:2011-05-18

    申请号:KR1020090108695

    申请日:2009-11-11

    CPC classification number: G06F17/30731

    Abstract: PURPOSE: A semi-automatic construction framework for a test collection is provided to reduce the load for constructing work and the deviation of the result by automating some standardized construction processes. CONSTITUTION: An automatic process unit(200) systematically processes a syntactic and a semantic characteristic of a document and creates triple. The triple is composed of specialized terms and relation candidate groups. A manual process unit(300) offers the triple to a constructor terminal and receives a triple which is selected by the constructor. A test collection builder(400) receives the selected triple, construct a test collection, and stores the test collection to a database unit(500).

    Abstract translation: 目的:通过自动化一些标准化施工过程,提供了一个用于测试收集的半自动施工框架,以减少施工工作的负担和结果的偏差。 构成:自动处理单元(200)系统地处理文档的句法和语义特征,并创建三元组。 三人组合由专业术语和关系候选人组成。 手动处理单元(300)向构造函数终端提供三元组,并接收由构造函数选择的三元组。 测试集合构建器(400)接收所选择的三元组,构建测试集合,并将测试集合存储到数据库单元(500)。

    문맥의 의미적 연관관계 추출 방법 및 그 장치와 그 프로그램 소스를 저장한 기록 매체
    10.
    发明公开
    문맥의 의미적 연관관계 추출 방법 및 그 장치와 그 프로그램 소스를 저장한 기록 매체 有权
    基于语义关系的语言技术方法和方法及其程序源的存储介质

    公开(公告)号:KR1020100054588A

    公开(公告)日:2010-05-25

    申请号:KR1020080113565

    申请日:2008-11-14

    CPC classification number: G06F17/2785

    Abstract: PURPOSE: A method for extracting a semantic associative relation of context based on syntax analysis of whole document, a device thereof and a recording medium storing a program source are provided to extract the semantic associative relation of context based on syntax analysis of whole document, thereby enabling to connect to UPK(Undiscovered Public Knowledge). CONSTITUTION: A TRS(Tech Retrieval System)(110) manages whole data which recognition of the technical terms are completed and provides searching service in different modules. A TAS(Tech Acquisition System)(150) searches the technical terms based on a dictionary from data of the TRS and extracts new terms. A TLA(Tech Language Analyzer)(180) does chunking and tagging the source document to conveniently extract the relation between technical terms recognition and relation. A TAMA(Tech Association Mining Appliance)(170) analyzes the document by construction through the TLA and extracts a semantic associative relation of context and performs conceptualizing based on word net. A SATT(Semi-Automatic Tech-Tracking Engine)(160) has semantic associative relation and provides many services.

    Abstract translation: 目的:提供基于整个文档的语法分析,其设备和存储程序源的记录介质的上下文语义关联关系的方法,以基于整个文档的语法分析提取上下文的语义关联关系,由此 能够连接到UPK(未被发现的公共知识)。 规定:TRS(技术检索系统)(110)管理完整的技术术语识别数据,并提供不同模块的搜索服务。 TAS(技术采购系统)(150)根据TRS数据的字典搜索技术术语,并提取新术语。 TLA(技术语言分析器)(180)对源文档进行分块和标记,方便地提取技术术语识别与关系之间的关系。 TAMA(技术协会采矿设备)(170)通过TLA构建分析文档,并提取语境的语义关联关系,并基于字网进行概念化。 SATT(半自动技术跟踪引擎)(160)具有语义关联关系,提供许多服务。

Patent Agency Ranking