-
公开(公告)号:WO2016117920A1
公开(公告)日:2016-07-28
申请号:PCT/KR2016/000579
申请日:2016-01-20
Applicant: 한국과학기술원
Abstract: 지식표현 확장 장치로서, 의미표현언어를 이용하여 텍스트에서 술어와 적어도 하나의 논항을 추출하는 술어-논항 구조 해석부, 컴퓨터가 이해할 수 있는 구조화된 포맷인 지식표현언어를 이용하여 지식을 표현하는 온톨로지부, 그리고 상기 온톨로지부에서 상기 술어-논항 구조 해석부에서 추출된 제1술어에 대응하는 제2술어를 추출하고, 상기 제1술어와 상기 제2술어의 유사도가 기준값 이하인 경우, 상기 제1술어를 이용하여 상기 텍스트로부터 추출된 지식을 표현하는 지식 표현부를 포함한다.
Abstract translation: 知识表示扩展装置包括:谓词参数结构分析单元,用于使用意义表示语言从文本中提取谓词和至少一个参数; 用于使用知识表示语言表示知识的本体单元,所述知识表示语言是由计算机可理解的结构化格式,并且用于从所述谓词参数结构分析单元提取从所述第一谓词对应的第二谓词; 以及当第一谓词和第二谓词的相似度等于或小于阈值时,使用第一谓词表示从文本中提取的知识的知识表示单元。
-
公开(公告)号:WO2014104502A1
公开(公告)日:2014-07-03
申请号:PCT/KR2013/005378
申请日:2013-06-19
Applicant: 한국과학기술원
IPC: G06Q50/30
CPC classification number: G06Q50/01 , G06Q10/1095
Abstract: 본 발명은 SNS에서 제공하는 정보 및 메시지로부터 이벤트를 발견하고, 해당 이벤트를 개인의 일정관리 시스템에 기록하는 SNS 기반 자동 일정관리 서비스 시스템에 관한 것이다.
Abstract translation: 本发明涉及一种基于SNS的自动日程管理服务系统,其从SNS提供的信息和消息中发现事件,并将相应的事件记录在个人日程管理系统中。
-
公开(公告)号:WO2017122904A1
公开(公告)日:2017-07-20
申请号:PCT/KR2016/010902
申请日:2016-09-29
Applicant: 한국과학기술원
IPC: G06F17/27 , G06F17/20 , G06N5/02 , G06F17/30 , G10L15/183
CPC classification number: G06F17/20 , G06F17/27 , G06F17/30 , G06N5/02 , G10L15/183
Abstract: 구체화된 삼항 관계 추출을 위한 개방형 정보 추출 방법 및 시스템이 개시된다. 컴퓨터로 구현되는 방법은, 정보 추출 대상으로 텍스트를 입력 받는 단계; 상기 텍스트에 포함된 논항(argument)과 술어(predicate)를 추출하는 단계; 및 상기 논항과 상기 술어를 RDF(Resource Description Framework)의 삼항 관계(Ternary Relationship)로 표현하는 단계를 포함한다.
Abstract translation: 公开了一种用于有形三元关系提取的公开信息提取方法和系统。 一种计算机实现的方法包括:接收文本作为信息提取目标; 提取文本中包含的论点和谓词; 并在资源描述框架(RDF)的三元关系中表达参数和谓词。 P>
-
公开(公告)号:WO2022139047A1
公开(公告)日:2022-06-30
申请号:PCT/KR2020/019254
申请日:2020-12-29
Applicant: 한국과학기술원
IPC: G06F40/35 , G06F16/36 , G06F16/332
Abstract: 본 발명은 대화문에서의 프레임 자동 분석 방법 및 장치에 관한 것으로, 대화문에서 프레임을 분석해내는 대화문수준 프레임 분석기를 제안하고, 대화문 내의 텍스트에서 프레임을 식별하며, 식별된 프레임의 요소를 대화문 내의 모든 화자 및 문장에서 식별할 수 있다.
-
公开(公告)号:WO2017094967A1
公开(公告)日:2017-06-08
申请号:PCT/KR2016/000868
申请日:2016-01-27
Applicant: 한국과학기술원
IPC: G06F17/30
CPC classification number: G06F17/30
Abstract: 텍스트에 포함된 단어들을 식별하고, 식별된 단어들 각각에 대해, 각 단어와 관련된 위치 정보를 포함하는 식별 정보를 연관시키고, 텍스트에 포함된 단어들 관의 의존 관계를 나타내는 관계 정보를 식별하여, 상기 식별 정보 및 상기 관계 정보에 기반하여 텍스트에 대한 자연 언어 처리 스키마를 구축하는 방법 및 시스템이 제공된다.
Abstract translation: 识别包括在文本中的词,将包括与每个词相关联的位置信息的识别信息与每个识别的词相关联, 并且基于识别信息和关系信息为文本构建自然语言处理模式。
-
公开(公告)号:KR101831058B1
公开(公告)日:2018-02-21
申请号:KR1020160070465
申请日:2016-06-07
Applicant: 한국과학기술원
Abstract: 구체화된삼항관계추출을위한개방형정보추출방법및 시스템이개시된다. 컴퓨터로구현되는방법은, 정보추출대상으로텍스트를입력받는단계; 상기텍스트에포함된논항(argument)과술어(predicate)를추출하는단계; 및상기논항과상기술어를 RDF(Resource Description Framework)의삼항관계(Ternary Relationship)로표현하는단계를포함한다.
Abstract translation: 公开了一种用于有形三元关系提取的公开信息提取方法和系统。 一种计算机实现的方法包括:接收文本作为信息提取目标; 提取文本中包含的论点和谓词; 并在资源描述框架(RDF)的三元关系中表达参数和谓词。
-
7.개체의 표면형 문자열 용례학습기반에 의한 텍스트에서의 개체 범위 인식 장치 및 그 방법 有权
Title translation: 实体边界检测装置通过使用学习实体表面上的角色候选人及其主题公开(公告)号:KR1020160086255A
公开(公告)日:2016-07-19
申请号:KR1020150141864
申请日:2015-10-08
Applicant: 한국과학기술원
Abstract: 개체의표면형문자열용례학습기반에의한텍스트에서의개체범위인식장치및 그방법이개시된다. 여기서, 개체범위인식장치는텍스트내 문자열및 상기문자열의주변단어들로구성된하나이상의단어기반자질들을이용한용례학습기반알고리즘을통해학습모델을생성하는학습부, 그리고상기학습모델을이용하여사용자입력텍스트내에서개체범위를인식하고, 상기개체범위로인식된개체목록을출력하는적용부를포함한다.
Abstract translation: 公开了一种用于通过在实体的表面字符串上的使用学习来识别文本中的实体边界的装置和方法。 用于识别实体边界的装置包括:学习单元,其通过使用学习算法生成学习模型,所述使用学习算法使用由文本中的字符串和所述字符串周围的单词组成的一个或多个基于字的天赋; 以及使用学习模型来识别用户输入文本中的实体边界并输出被识别为实体边界的实体列表的应用单元。
-
公开(公告)号:KR1020150111587A
公开(公告)日:2015-10-06
申请号:KR1020140035047
申请日:2014-03-26
Applicant: 한국과학기술원
IPC: G06F17/20
CPC classification number: G06F17/20 , G06F17/2705 , G06F17/2755 , G06F17/30604
Abstract: 본발명은자연어문장을분석하여문장에서사용된디비피디아를리소스를찾아자동으로추출하는시스템이다. 시스템에서명하는 URI spotting은자연어문장으로부터연관된링크드데이터의리소스를찾는것을말한다. 본시스템의목표는한국어문장을대상으로 URI spotting을하는도구를개발하는것이다. 대상이되는문장은한국어텍스트, 한국어질의어의두 종류이다. URI spotting은크게 2가지세부과정으로나눌수 있다. 첫단계는 spotting 단계로문장으로부터추출할단어의추출규칙을정하여결과적으로여러개의후보들을생성하는단계이다. 이과정은대부분형태소분석기, 개체명인식기등의자연어처리도구로부터추출할단어를선정한다. URI spotting을위한두 번째단계로리소스매핑단계가있다. Spotting 단계로부터추출된후보들로부터최적의디비피디아 URI와매핑하는단계로유사도측정알고리즘, 단어의의미의모호성문제해결이필요하다. 최종적으로앞 두단계로부터추출된 URI는디비피디아 SPARQL을이용한트리플데이터검증을통해추출된최적의후보데이터와디비피디아데이터가유효한가검사하는과정을거쳐최종 URI들을선택하고해당문장과관련된 SPARQL질의를추천한다.
Abstract translation: 本发明涉及一种用于分析自然语言句子的系统,找到该句子中使用的数据库媒体的资源,并自动提取数据库媒体。 在系统中描述的URI发现指示找到与自然语言句相关的链接数据的资源。 本发明的目的是开发一种用于韩语句子的URI识别工具。 目标句子有韩文和韩文查询两种。 URI查找大致可分为两个详细过程。 URI识别包括:确定从句子中提取的单词的提取规则并相应地生成多个候选的点检步骤,其中要提取的单词主要从诸如语素的自然语言处理工具中选择 分析器,命名实体识别器等; 以及资源映射步骤,用于将从点样步骤提取的候选对应于最佳DB pedia URI映射,其中需要解决相似度测量算法的问题和单词含义的歧义。 最终的URI是通过检查DB pedia数据和通过使用DB pedia SPARQL的三重数据验证提取的最佳候选数据是否有效的过程进行选择,并且推荐与相应句子相关的SPARQL查询。
-
公开(公告)号:KR1020150111232A
公开(公告)日:2015-10-05
申请号:KR1020140034918
申请日:2014-03-25
Applicant: 한국과학기술원
IPC: G06F17/20
CPC classification number: G06F17/3071 , G06F17/30014 , G06F17/30864
Abstract: 본발명은하이퍼텍스트로구성된웹 문서의하이퍼링크정보를사용하여, 하이퍼링크에대한분류를기반으로해당웹 문서의자연어단어에대한유형을분류할수 있는시스템이다. 하이퍼링크란특정단어에대하여동영상, URL, 글, 태그, 음악, 그림, 프로그램, 파일등의정보를나타내는참조고리이며, HTML을비롯한웹 문서의마크업언어에서구현되어있다. 이러한정보들은고도의자연언어처리모델을사용하지않고서도하이퍼링크가된 단어들에대한개체명유형을분류하는것을가능하게할 수있다. 사람들의협업에의해구축되는웹 데이터의특성상, 하이퍼링크의메타데이터정보를활용하는것은자연어처리를통한분석에서얻을수 있는것보다방대한정보를쉽게사용할수 있다는데그 이득이있다.
Abstract translation: 本发明涉及使用由超文本组成的网络文档的超链接信息来基于超链接分类对web文档中的自然语言词类型进行分类的系统。 超链接是表示用于特定单词的视频,URL,文本,标签,音乐,图片,程序和文件的参考链接,并且以诸如HTML的web文档的标记语言来实现。 这样的信息使得能够在不使用高级自然语言处理模型的情况下对配置超链接的单词的对象名称的类型进行分类。 利用超链接的元数据信息,由于由用户协作构建的网络数据的属性,可以比使用自然语言处理的分析更容易地使用大量的信息。
-
-
-
-
-
-
-
-
-