-
公开(公告)号:KR1020090108530A
公开(公告)日:2009-10-15
申请号:KR1020090023569
申请日:2009-03-19
Applicant: 한국전자통신연구원
CPC classification number: G06F17/21 , G06F17/275 , G06F17/30705
Abstract: PURPOSE: An apparatus and a method of a hierarchical document taxonomy for an intelligent information service are provided to show accurate classification result and systematize large amount of document set for management. CONSTITUTION: An apparatus of a hierarchical document taxonomy for an intelligent information service includes a document pre-pressing unit(110), a language analysis unit(120), a document classification unit(140) and a representative language selection unit(150). The document pre-pressing unit corrects a target document to enable a language analysis, and the language analysis unit performs a language analysis by word and sentence in the corrected target document. The document classification unit allocates the subject of the target document hierarchically, and the representative selection unit selects a keyword that represents the contents of a reconfigured document.
Abstract translation: 目的:提供智能信息服务层次化文档分类的设备和方法,以显示准确的分类结果,并将大量的文档集进行系统化管理。 构成:用于智能信息服务的分层文档分类装置包括文件预压单元(110),语言分析单元(120),文档分类单元(140)和代表语言选择单元(150)。 文档预压单元校正目标文档以启用语言分析,并且语言分析单元通过修正的目标文档中的单词和句子进行语言分析。 文档分类单元分级地分配目标文档的主题,并且代表选择单元选择表示重新配置的文档的内容的关键字。
-
公开(公告)号:KR100834536B1
公开(公告)日:2008-06-02
申请号:KR1020060094545
申请日:2006-09-28
Applicant: 한국전자통신연구원
IPC: G06F17/30
Abstract: 본 발명은 검색어 및 그룹별 표시 유형을 입력 받는 단계, 입력 받은 검색어에 상응하여 검색 정보를 출력하는 단계, 출력된 검색 정보를 온톨로지(Ontology)에 기반을 두어 적어도 하나의 그룹별 표시 유형으로 그룹화하는 단계 및 그룹화된 정보를 표시하는 단계를 포함하는 온톨로지(Ontology) 기반의 정보 표시 방법을 제공할 수 있다.
온톨로지(Ontology), 정보 표시-
公开(公告)号:KR100669239B1
公开(公告)日:2007-01-15
申请号:KR1020040102495
申请日:2004-12-07
Applicant: 한국전자통신연구원
Abstract: 본 발명은 어휘 개념망 구축을 위한 상위어 자동 추천 방법에 관한 것으로서, 개념망의 이식성과 확장성를 고려하고 객관성 확보를 위해, 기 구축된 개념망에서 표제어의 뜻풀이와 표제어의 상위어 간의 관계를 분석하여 패턴 추출을 위한 기계학습을 수행하고, 학습된 패턴을 기반으로 새로운 표제어를 개념망에 추가할 때, 상위어의 후보들을 선정하여 확률값과 함께 작업자에게 제시하는데, 상위어 후보들 중 중의성 표제어가 있으면, 상호정보량(Mutual Information)을 이용한 뜻풀이 유사도를 사용하여 중의성을 해소한 후, 제시된 상위어의 후보들 중 하나를 선택하면 새롭게 입력되는 표제어의 상위어로 선정되도록 하여, 작업 비용와 노력을 상대적으로 많이 줄일 수 있어 다른 분야로의 이식과 확장이 용이하고 객관성을 확보할 수 있다.
개념망, 상위어, 기계학습, 중의성-
-
-
-
-
公开(公告)号:KR1020170127882A
公开(公告)日:2017-11-22
申请号:KR1020160058670
申请日:2016-05-13
Applicant: 한국전자통신연구원
Abstract: 가부형질문응답을처리시, 입력된질문에대한질문유형을분류하여가부형질문을검출하고, 가부형질문에대해자연어분석처리하고, 자연어분석처리된질문의특정어휘구간을기설정된어휘로대체하여단답형형태의질문으로재생성하고, 특정어휘구간을정답후보로선정하고, 재생성된질문및 상기정답후보에대해기설정된하나이상의검색엔진을통해검색질의하고, 검색질의의결과및 가부형질문과의유사도를산출하여신뢰도를계산하고, 계산된신뢰도및 기설정된신뢰도임계값을비교하여참 또는거짓을판단하여, 판단의결과를제공한다.
Abstract translation: 当处理正确或错误类型的查询响应,取代了分类类型对输入的问题结束问题的具体词汇部分被检测到,并在预定的词汇表的正确或错误的类型询问问题处理,自然语言分析处理询问自然语言分析 并且带着问题和再生简答类型,并作为一个特定词汇的时间间隔的选择的结果回答的候选人,再生的查询,并通过预定的正确的候选查询,搜索查询和正确的或错误的类型的问题一个或多个搜索引擎搜索 计算相似度,计算可靠性,比较计算的可靠性和预定的可靠性阈值以确定真或假,并提供确定的结果。
-
公开(公告)号:KR1020170073354A
公开(公告)日:2017-06-28
申请号:KR1020150182158
申请日:2015-12-18
Applicant: 한국전자통신연구원
Abstract: 본발명은다의어데이터베이스에다의어의용례를확장하는장치및 기술에관한것으로써, 문서수집부, 다의어인식부, 다의어검증부, 데이터베이스확장부를포함할수 있으며, 단어의미중의성해소를위하여사용되는지식데이터베이스를자동또는수동으로쉽고빠르게확장함으로써다양한분야에적합한다의어인식기를개발할수 있도록문장유사도방법에기반해서대상문장과기존사전용례와의유사도를측정해서유사도가높으면자동으로사전용례로추가하고, 유사도가특정값보다낮으면수작업으로적합한의미의용례로추가하여자동또는수동으로확장하는문장유사도기반다의어데이터베이스확장장치및 그방법을제공하는데그 목적이있다.
Abstract translation: 本发明,因为它涉及到用于扩展多义的应用的多义数据库,文件收集单元,多义识别器,多义验证单元的装置和技术,并且可以包含一个数据库延伸部分,和知识用于解析词义数据库的唯一性 添加到自动或手动快速且通过自动预应用中容易扩大基于测量与预先存在的应用程序的目标句子之间的相似程度的句子相似度方法相似性高到它,这样就可以开发各种领域中的合适的多义识别,以及一定的相似性 手动添加值作为合适含义的示例,并通过添加手写的含义自动或手动扩展。
-
公开(公告)号:KR101709055B1
公开(公告)日:2017-02-23
申请号:KR1020100125839
申请日:2010-12-09
Applicant: 한국전자통신연구원
Abstract: 오픈웹의다양한특성과질의응답의특성을반영하여사용자의질문에대한명확한정답을찾을수 있는오픈웹 질의응답을위한질문분석장치및 방법이개시된다. 외부로부터제공된질문에언어분석을수행하는질문언어분석부와언어분석된질문에서질문유형인식결과, 주소정보, 주제정보및 질문형태정보중 적어도하나를질문인식결과로인식하는질문인식부와질문인식부로부터질문인식결과를제공받아기정의된패턴이나기정의된기계학습데이터에매칭되는경우에언어분석된질문의질문정답유형으로인식하는질문정답유형인식부와언어분석된질문에서키워드를추출하고추출된키워드를이형태정보, 클릭로그및 키워드확장사전중 적어도하나에기반하여키워드를확장하는키워드인식부를포함하는오픈웹 질의응답을위한질문분석장치및 방법을구성한다. 따라서, 오픈웹의다양한특성과질의응답의특성을반영하여사용자의질문에대한명확한정답을찾을수 있다.
Abstract translation: 目的:提供一种用于开放式Web问答的问题分析的设备和方法,用于预处理外部问题,分析语言,识别问题的信息,识别问题的答案类型,并提取关键字 的问题。 构成:用于开放式网络问答的问题分析装置,包括:对提供的问题进行语言分析的查询语言分析单元(110) 从语言分析的问题中识别至少一个查询类型识别结果,地址信息,主题信息和查询类型信息的查询识别单元(120) 查询答案类型识别单元(130),识别问题的答案类型; 以及关键词识别单元(140)从所述问题中提取关键词,并扩展所提取的关键字。
-
-
-
-
-
-
-
-
-