기계 학습을 이용한 학습 데이터 검증 장치 및 방법
    21.
    发明公开
    기계 학습을 이용한 학습 데이터 검증 장치 및 방법 无效
    使用机器学习训练数据验证的方法和装置

    公开(公告)号:KR1020100062801A

    公开(公告)日:2010-06-10

    申请号:KR1020090023605

    申请日:2009-03-19

    CPC classification number: G06Q50/20

    Abstract: PURPOSE: A learning data verification method using machine learning and a method thereof are provided to verify error of initial learning data efficiently by distinguishing the error of learning data by comparing with verified data and automatic tagging result. CONSTITUTION: A learning data separating unit(110) separates learning data and verified data of N about given initial learning data. A machine learning unit(120) performs the machine learning from the separated learning data and produces a learning model. Using the learning model, an automatic tagging unit(130) provides the auto tagging result by tagging the original of the verified data automatically. An error decider(140) compares the verified data and the automatically tagging result, and provides an error candidate of the learning data.

    Abstract translation: 目的:提供使用机器学习的学习数据验证方法及其方法,通过与验证数据和自动标记结果进行比较来区分学习数据的错误,有效地验证初始学习数据的错误。 构成:学习数据分离单元(110)分离关于给定初始学习数据的学习数据和N的验证数据。 机器学习单元(120)从分离的学习数据执行机器学习并产生学习模型。 使用学习模型,自动标记单元(130)通过自动标记验证数据的原件来提供自动标记结果。 错误决定器(140)比较经验证的数据和自动标记结果,并提供学习数据的错误候选。

    온톨로지 인스턴스 자동 생성 장치 및 방법
    22.
    发明授权
    온톨로지 인스턴스 자동 생성 장치 및 방법 失效
    用于自动生成本体实体的装置及其方法

    公开(公告)号:KR100918847B1

    公开(公告)日:2009-09-28

    申请号:KR1020070103554

    申请日:2007-10-15

    CPC classification number: G06F17/30734

    Abstract: 본 발명은 구조 문서 및 비구조 문서를 구분하여 온톨로지 인스턴스를 자동으로 생성하는 장치 및 방법에 대한 것으로서, 웹으로부터 온톨로지의 클래스에 대응하는 문서를 수집하는 문서 수집 단계; 수집된 문서가 비구조 문서인 경우에, 비구조 문서로부터 개체간 관계 정보를 추출하는 단계; 수집된 문서가 구조 문서인 경우에, 구조 문서로부터 개체간 관계 정보를 추출하는 단계; 추출된 개체간 관계 정보로부터 온톨로지 인스턴스를 생성하는 단계; 및 생성된 온톨로지 인스턴스를 온톨로지의 해당 클래스로 매핑하는 단계를 포함하는 것을 특징으로 한다.

    세부분류 개체명 인식 장치 및 방법
    23.
    发明授权
    세부분류 개체명 인식 장치 및 방법 有权
    细粒度实体识别的方法和装置

    公开(公告)号:KR100829401B1

    公开(公告)日:2008-05-15

    申请号:KR1020070064985

    申请日:2007-06-29

    CPC classification number: G06F17/2755 G06F17/30705

    Abstract: A method and a device for recognizing a fine-grained named entity are provided to recognize a fine-grained named entity class without increasing time needed for recognizing and learning the fine-grained named entity largely even if the number of fine-grained named entity classes is increased. A morpheme analyzer(100) analyzes morphemes of inputted text. A named entity quality recognizer(200) recognizes a named entity quality of each morpheme by using at least one of databases(D1-D4). A candidate named entity recognizer(300) recognizes a candidate named entity by using a named entity recognition model(M1) based on a named entity quality recognition result. A large class named entity classifier(400) classifies a large class named entity by using a large class named entity classification model(M2) based on a candidate named entity recognition result. A large class named entity classification re-ranker(500) ranks again a large class named entity classification result. A fine-grained named entity classifier(600) classifies a fine-grained named entity by using a fine-grained named entity classification model(M3) based on a large class named entity classification re-ranking result.

    Abstract translation: 提供了一种用于识别细粒度命名实体的方法和设备,以便在不增加用于识别和学习细粒度命名实体所需的时间的情况下,即使是细粒度的命名实体类的数量也能够识别细粒度的命名实体类 增加了。 语素分析器(100)分析输入文本的语素。 命名实体质量识别器(200)通过使用数据库(D1-D4)中的至少一个来识别每个语素的命名实体质量。 名为实体识别器(300)的候选者基于命名实体质量识别结果,通过使用命名实体识别模型(M1)来识别候选命名实体。 一个大类命名实体分类器(400)通过使用名为实体分类模型(M2)的大类,基于候选的实体识别结果对大类命名实体进行分类。 一个大类命名实体分类重新排序(500)再次排列了一个大类命名实体分类结果。 一个细粒度的命名实体分类器(600)通过使用基于大类命名实体分类重新排序结果的细粒度命名实体分类模型(M3)对细粒度命名实体进行分类。

    소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치 및 그 방법

    公开(公告)号:KR101907041B1

    公开(公告)日:2018-10-11

    申请号:KR1020120147067

    申请日:2012-12-17

    CPC classification number: G06Q10/0635 G06Q50/01

    Abstract: 본발명의소셜웹 콘텐츠에서의예측기반리스크관리장치는소셜웹 콘텐츠로부터리스크로관리해야하는어휘를추출하여관리하는리스크어휘관리부와, 상기소셜웹 콘텐츠의원문으로부터분석대상이되는텍스트와관련된메타정보를추출하여언어분석및 감성분석을수행하는리스크이슈예측분석자질추출부와, 추출된자질들을기반으로통계적및 기계학습방법의예측방식을통해리스크예측분석을모델링하는리스크예측모델링부와, 상기소셜웹 콘텐츠로부터미리모델링한리스크예측모델에기반하여인식되는리스크를자동탐지하고, 탐지된리스크를자동알람하는리스크탐지및 알람부와, 상기탐지된리스크에대해알람이울릴때 리스크대상에대한리스크상태를실시간으로모니터링하는리스크상황모니터링부와, 모니터링되는리스크정보에대한사용자피드백을수용하고, 종료된리스크의상황에대한기록을관리하는리스크히스토리관리부를포함할수 있다.

    상품 정보 자동 추출 방법 및 장치

    公开(公告)号:KR101903717B1

    公开(公告)日:2018-10-04

    申请号:KR1020110084529

    申请日:2011-08-24

    CPC classification number: G06F17/30716

    Abstract: 본발명은상품정보자동추출기술에관한것으로, 특정상품에대해사용자들이블로그, 커뮤니티사이트등의웹 문서에올려놓은장점및 단점을추출한후, 정리및 제시하여사용자가특정상품에대한장점및 단점을별도의노력없이파악하여구매에참고하거나활용하기위한것으로서, 대상이되는상품을질의하여관련된문서를검색하고, 검색된문서에서상품의장점혹은단점에대하여언급한문장을추출한후, 유사한내용의장점및 단점을묶고, 사용자에게제시할대표문장을선별하여각 묶음에속한문장들의개수를바탕으로해당묶음의가중치를정하여사용자에게제시하는것을특징으로한다. 본발명에의하면, 상품의장단점을자동으로분석및 추출하여사용자에게제시함으로써사용자가별도의노력없이상품에대한정보를얻고구매혹은모니터링에활용하게할 수있다.

    용언의 문형정보를 이용한 선택 제약 사전 구축 방법 및 시스템
    28.
    发明公开
    용언의 문형정보를 이용한 선택 제약 사전 구축 방법 및 시스템 有权
    使用预测模式构建选择限制字典的方法

    公开(公告)号:KR1020160060822A

    公开(公告)日:2016-05-31

    申请号:KR1020140162399

    申请日:2014-11-20

    CPC classification number: G06F17/2735 G06F17/271 G06F17/2785 G06F17/3061

    Abstract: 본발명은용언의문형정보를이용한선택제약사전구축방법을제공한다. 상기용언의문형정보를이용한선택제약사전구축방법은용언의문형정보를획득하는단계, 상기획득한용언의문형정보에서용언을추출하고, 상기추출된용언이포함된용례문장을검색하는단계, 상기검색된용례문장의의미를분석하여상기용언과다른의미의용언이포함된용례문장을필터링하는단계, 상기필터링된용례문장의구문을분석하여상기용언과관련없는구성성분을필터링하는단계, 상기필터링된용례문장에서선택제약대상을선택하고, 어휘의미망을이용하여상기선택된선택제약대상의상위경로를추출하는단계및 상기추출된상위경로들의비교를통해상기용언에대한선택제약경로를설정하고, 상기설정된선택제약경로를이용하여상기용언에대한선택제약사전을구축하는단계를포함한다.

    Abstract translation: 本发明提供一种使用谓词的句子模式构建选择限制词典的方法,其能够通过使用与句子谓词相关的信息来检测句子的结构和含义。 使用谓词的句型构建选择限制词典的方法包括以下步骤:获取谓词的句型; 从谓词的获取句型中提取谓词以搜索包括提取的谓词的句型; 分析句子模式的含义以过滤包括具有与谓词不同的含义的谓词的句子模式; 分析过滤句子模式的结构,以过滤与谓词无关的组件; 从所述过滤的句子中选择所述选择限制的目标,以通过使用词汇学的网络来提取所述选择限制的所述选定目标的高级路径; 并且通过将所提取的高级路径彼此进行比较来设置谓词的选择限制路径,以及为谓词构建选择限制字典。

    텍스트 빅데이터 기반 의미 프레임 운용 방법 및 이를 지원하는 장치
    29.
    发明公开
    텍스트 빅데이터 기반 의미 프레임 운용 방법 및 이를 지원하는 장치 无效
    基于文本大数据的语义框架操作方法及其支持的电子设备

    公开(公告)号:KR1020150082783A

    公开(公告)日:2015-07-16

    申请号:KR1020140002177

    申请日:2014-01-08

    CPC classification number: G06F17/2785 G06F17/21 G06F17/2795

    Abstract: 본발명은의미프레임운용에관한것으로, 의미프레임시드로사용할용언을수집하는시드수집과정, 수집된용언에대한동의어집합을구성하는동의어집합구성과정, 동의어집합에포함된용언들과관련하여텍스트빅데이터에서적어도하나의용례들을수집하는용례수집과정, 상기수집된용례들에의미격부착을수행하여의미프레임후보를추출하는과정, 상기의미프레임후보에대한오류검증을수행하는검증과정, 상기오류검증된의미프레임후보를상기용언에대한확장의미프레임으로저장하는과정을포함하는것을특징으로하는텍스트빅데이터기반의미프레임운용방법및 이를지원하는전자장치의구성을개시한다.

    Abstract translation: 本发明涉及一种语义帧操作方法,其可以包括以下步骤:收集将被用作意指帧种子的动词; 用收集的动词配置同义词集; 从文本大数据中收集关于包含在同义词集中的动词的至少一个示例; 通过附加收集的示例的意义来提取意义框架候选; 验证收集的例子中的错误; 并将所述错误验证的意义帧候选存储为相对于所述动词的扩展含义帧。

    위키피디아의 콘텐츠를 기반으로 하는 정보검색 장치 및 정보검색 방법
    30.
    发明公开
    위키피디아의 콘텐츠를 기반으로 하는 정보검색 장치 및 정보검색 방법 有权
    基于WIKIPEDIA目录搜索信息的装置和方法

    公开(公告)号:KR1020150082754A

    公开(公告)日:2015-07-16

    申请号:KR1020140002033

    申请日:2014-01-07

    Abstract: 본발명은위키피디아의콘텐츠를기반으로하는정보검색장치및 정보검색방법에관한것으로, 본발명에따른일 실시예는위키피디아원문에서본문문서, 섹션제목문서, 인포박스문서, 카테고리문서및 정의문문서를추출하여하나이상의질의응답용위키피디아문서를생성하는문서변환부, 상기질의응답용위키피디아문서를분석하여, 상기질의응답용위키피디아문서에서품사단위의색인어를추출하고, 질의응답용위키피디아문서색인을생성하는문서색인부, 자연어질문을수신하고, 상기자연어질문에서질문유형, 정답유형및 질문포커스를분석하여, 문서검색키워드를추출하는질문분석부, 상기질의응답용위키피디아문서색인에서상기문서검색키워드를이용하여문서검색을수행하고, 각각의상기질의응답용위키피디아문서색인으로부터문서검색결과를생성하는문서검색부, 상기문서검색결과로부터상기질문유형, 상기정답유형및 상기질문포커스에대한정보를이용하여, 제 1 정답을추출하는정답추출부및 상기제 1 정답을통합하고, 순위화하여제 2 정답을생성하는정답통합부를포함하는위키피디아의콘텐츠를기반으로하는정보검색장치를제공할수 있다.

    Abstract translation: 本发明涉及一种基于维基百科内容和信息搜索方法的信息搜索装置。 本发明的一个实施例提供了基于维基百科内容的信息搜索装置,包括:文档转换单元,从原始文本中提取主体文档,部分标题文档,信息框文档,类别文档和定义语句文档 的维基百科生成一个或多个Wikipedia文档以响应查询; 文档索引单元,分析维基百科文档以响应查询,从维基百科文档中提取单词类单元的索引词,以响应查询,并生成维基百科文档的索引以响应查询; 查询分析单元,接收自然语言查询,分析查询类型,答案类型和查询焦点,并提取文档搜索关键词; 文档搜索单元,其使用文档搜索关键字从维基百科文档执行文档搜索以响应查询,并且从维基百科文档的索引生成用于响应查询的文档搜索结果; 答案提取单元使用关于查询类型,答案类型和查询焦点的信息从文档搜索结果中提取第一答案; 以及答案整合单元,其将第一答案整合并排列第一答案以产生第二答案。

Patent Agency Ranking