학습 데이터 구축 장치 및 방법
    131.
    发明公开
    학습 데이터 구축 장치 및 방법 有权
    用于学习数据结构的装置和方法

    公开(公告)号:KR1020070060862A

    公开(公告)日:2007-06-13

    申请号:KR1020050120977

    申请日:2005-12-09

    CPC classification number: G06F17/2818

    Abstract: A device and a method for constructing learning data are provided to reduce expense/time required for constructing the learning data by generating candidate learning data through machine learning, calculating a reliability store of each candidate learning data, and selecting the learning data from the candidate learning data. An incremental learning part(10) generates a learning model from initial learning data(11) by using the machine learning. An automatic tag attaching part(20) generates the candidate learning data by automatically attaching a tag to a raw corpus(21) based on the generated learning model. A candidate learning data selector(30) selects the candidate learning data by calculating the reliability score of the generated candidate learning data. A manual error corrector(40) provides an interface for displaying the selected candidate learning data(41) to a user and enabling the user to correct an error.

    Abstract translation: 提供一种用于构建学习数据的装置和方法,以通过机器学习产生候选学习数据来计算构建学习数据所需的费用/时间,计算每个候选学习数据的可靠性存储,以及从候选学习中选择学习数据 数据。 增量学习部分(10)通过使用机器学习从初始学习数据(11)生成学习模型。 基于生成的学习模型,自动标签附加部件(20)通过自动地将标签附加到原始语料库(21)来生成候选学习数据。 候选学习数据选择器(30)通过计算所生成的候选学习数据的可靠性分数来选择候选学习数据。 手动错误校正器(40)提供用于将选择的候选学习数据(41)显示给用户并使用户能够校正错误的接口。

    생략된 문장성분 복원 장치 및 방법
    132.
    发明授权
    생략된 문장성분 복원 장치 및 방법 有权
    생략된문장성분복원장치및방법

    公开(公告)号:KR100641053B1

    公开(公告)日:2006-11-02

    申请号:KR1020050093880

    申请日:2005-10-06

    Abstract: A device and a method for restoring an omitted component of a sentence are provided to prevent an error caused from an ellipsis of the sentence component, offer correct sentence structure analysis information, and recognize/restore the omitted component of the Hangul sentence by properly using rule and statistics information. A sentence structure(10) analyzer analyzes a structure of the inputted sentence based on predefined grammar. An ellipsis candidate recognizer(20) detects restoration candidates of the ellipsis in the inputted sentence if the ellipsis of the sentence is determined by checking a necessary component of each inflected word appeared in the analyzed sentence. An ellipsis restorer(30) restores the ellipsis in the detected restoration candidates by using the predefined rule/statistics information(32).

    Abstract translation: 提供一种用于恢复句子的省略分量的设备和方法,以防止由句子分量的省略引起的错误,提供正确的句子结构分析信息,并且通过适当地使用规则来识别/恢复韩文句子的省略分量 和统计信息。 句子结构(10)分析器基于预定义语法分析输入句子的结构。 如果通过检查分析的句子中出现的每个屈曲词的必要成分来确定句子的省略号,则省略号候选识别器(20)检测输入语句中的省略号的恢复候选项。 省略号恢复器(30)通过使用预定义的规则/统计信息(32)来恢复检测到的恢复候选中的省略号。

    질의응답시스템에서의 정답색인 시스템 및 방법
    133.
    发明授权
    질의응답시스템에서의 정답색인 시스템 및 방법 失效
    Q&A系统中的正确答案索引系统和方法

    公开(公告)号:KR100599450B1

    公开(公告)日:2006-07-12

    申请号:KR1020040109134

    申请日:2004-12-21

    Abstract: 본 발명은 질의응답시스템에서의 정답색인 시스템 및 방법에 관한 것으로서, 입력문을 LF(Logical Form) 단위와 문장 단위로 각 어휘들을 정답대상어와 단서어로 나누고, 각 단서어와 정답대상어 쌍을 색인 할 수 있는 방법을 제시하여 정답 제시에서의 속도를 개선함으로써, 질의응답에서 사용자의 질문에 대한 검색 결과인 방대한 문서로부터 사용자가 원하는 정답만을 초점으로 할 수 있으므로 정보검색 및 질의응답 시스템의 성능을 개선할 수 있다.
    질의응답, 정답 색인

    Abstract translation: 涉及在电话系统中的正确索引系统和方法的本发明的查询,以便将输入门语言答案daesangeo并导致每个词汇为LF(逻辑形式)单元和一个句子单元,索引每个线索鳗鱼答案daesangeo对 通过提高通过介绍,在问题和答案给出答案的速度,方式可以是你的问题的搜索结果提供给用户的大量文件,以提高信息检索的性能和问答系统,这样你就可以只专注于所期望的答案 有。

    정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법
    134.
    发明授权
    정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법 有权
    信息检索和问答系统中基于混合的查询分类系统和方法

    公开(公告)号:KR100597435B1

    公开(公告)日:2006-07-10

    申请号:KR1020040102494

    申请日:2004-12-07

    Inventor: 황이규 장명길

    Abstract: 본 발명은 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 시스템 및 방법에 관한 것으로서, 입력된 질문에 포함된 작품명을 인식하는 질문 작품명 처리와, 질문을 형태소분석, 개체명 인식, 어휘 의미태깅 과정을 통해 개개의 어휘를 의미 있는 코드로 변환하는 질문 언어분석 과정과, 질문의 의미 있는 LSP 형태 코드와 미리 정의된 질문분류 규칙을 이용하여 질문이 요구하는 정답 유형을 분류하는 규칙기반 질문분류 과정과, 질문의 정답유형이 태깅된 학습문서로부터 구축된 통계정보를 이용하여, 질문의 LSP 코드에 대한 분류를 수행하는 통계기반 질문분류 과정과, 규칙기반 질문분류와 통계기반 질문분류의 결과를 이용하여 최종적으로 사용자의 질문에 대한 정답의 유형을 판별하는 질문 정답유형 결정 과정을 진행함으로써 정보검색 및 질문응답에서 사용자의 질문에 대한 검색 결과인 방대한 문서로부터, 사용자가 원하는 정답만을 초점으로 할 수 있어, 정보검색 및 질문응답 시스템의 성능을 개선할 수 있다.
    정보검색, 질문응답, 작품명 인식, 하이브리드 질문분류

    Abstract translation: 本发明涉及一种基于混合的问题分类系统和方法,用于信息检索和问答系统中,识别工作名称的问题包括在输入问题的标题处理和形态学分析的问题,实体识别,词义 基于规则的问题分类,以通过转换代码的单独的查询语言分析的过程,是指文字和预定义的问题意义所需要的答案类型的问题进行分类的分类规则,并通过标记过程有问题的LSP类型代码 基于问题的分类和基于统计的问题分类的结果,使用从标记的学习文档构建的统计信息以及将问题分类为LSP代码, 最后,确定用户问题的正确答案类型。 从你的问题中的问题和颜色的搜索结果,让用户只集中大量文件要回答,您可以提高信息检索的性能和问答系统。

    하이브리드 정답유형 인식 장치 및 방법
    135.
    发明公开
    하이브리드 정답유형 인식 장치 및 방법 失效
    混合正确答案类型识别装置和方法

    公开(公告)号:KR1020060069616A

    公开(公告)日:2006-06-21

    申请号:KR1020040108121

    申请日:2004-12-17

    CPC classification number: G10L15/1822 G10L2015/027 Y10S707/99936

    Abstract: An apparatus and a hybrid method for recognizing answer type are disclosed. The apparatus includes: a morpheme analyzer for analyzing morphemes of an input text; a syllabic answer type recognizer for extracting a predetermined size syllable from a morpheme list and recognizing an answer type based on the extracted syllable; a vocabulary feature recognizer for allocating feature to each morpheme and recognizing the feature; a vocabulary feature disambiguation unit for disambiguating vocabulary feature ambiguity of morphemes having more than one feature; a pattern rule answer type recognizer for recognizing an answer type by comparing a consecutive sequence of the morphemes and a consecutive sequence of constitutional features connected to the morphemes with a pre-constructed pattern rules; a statistic answer type recognizer for recognizing an answer type by implementing a statistic model; and an answer type sub-category recognizer for recognizing a sub-category of the recognized answer type classified to general category.

    Abstract translation: 本发明涉及一种用于识别问答系统的韩语的正确答案类型的混合正确答案类型识别装置和方法。 本发明音节识别所提取的音节的基础上的答案类型提取形态学分析单元,一个预定尺寸的音节的形态列表由词素分析单元的每个分析用于分析输入文本的词素 基于该答案类型识别部和由每个词素列表的禀赋梗所分配的配置,关于具有一个或多个质量的词素由词法品质识别器识别出识别所述质量识别词汇的相应的词汇品质 和性别减轻词汇质量的一部分,以消除质量的属性,基于规则图案答案类型来识别正确的类型,以连接到具有从相对于既定的模式规则词素组词素一系列列表的结构素质的连续序列 一个识别单元,以及与连续列表和词素的语素连接的组成特征的连续列表 它是由用于通过将统计模型,其中,由所述识别单元识别的正确类型的详细标准答案类型识别的基于统计的答案类型正确类型的详细类别被识别为大类别识别正确的类型基于统计的答案类型识别部构成。

    영상정보 검색을 위한 비선형 양자화 및 유사도 매칭 방법
    136.
    发明授权
    영상정보 검색을 위한 비선형 양자화 및 유사도 매칭 방법 有权
    用于检索图像数据的非线性量化和相似度匹配方法

    公开(公告)号:KR100556832B1

    公开(公告)日:2006-03-10

    申请号:KR1020037005476

    申请日:2001-10-18

    CPC classification number: G06F17/30259 H04N19/98

    Abstract: 본 발명은, 다수의 영상을 대표하는 영상정보를 갖는 데이터 베이스 구축 방법에 있어서, 대상 영상에 대하여, 각각 5개의 정규화 에지 히스토그램 빈을 포함하고 부영상에 포함된 4개의 방향성 에지와 하나의 비방향성 에지로 이루어진 5개의 기준 에지들의 공간분포를 나타내는 L (L은 양의 정수)개의 에지 히스토그램을 생성하기 위해 Lx5 개의 정규화 에지 히스토그램 빈을 계산하는 제 a단계; 상기 대상 영상에 대하여 Lx5 개의 양자화 색인값을 생성하기 위해 상기 Lx5 개의 정규화 에지 히스토그램 빈을 비선형적으로 양자화하는 제 b단계; 상기 Lx5 개의 양자화 색인값을 데이터베이스에 저장하는 제 c단계; 및 상기 영상정보를 갖는 데이터베이스를 구성하기위해 저장된 모든 영상들이 처리될 때까지 상기 제 a 내지 c단계를 반복하는 제 d단계로 이루어 지는 것을 특징으로 하는 다수의 영상을 대표하는 영상정보를 갖는 데이터 베이스 구축 방법.
    영상검색, 비선형, 양자화, 유사도, 매칭, 데이터베이서, 대상 영상

    인터넷 질의/응답을 위한 지식베이스 구축방법
    137.
    发明授权
    인터넷 질의/응답을 위한 지식베이스 구축방법 有权
    网络问答知识库建设

    公开(公告)号:KR100532585B1

    公开(公告)日:2005-12-02

    申请号:KR1020000086642

    申请日:2000-12-30

    Abstract: 1. 청구범위에 기재된 발명이 속하는 기술분야
    본 발명은 인터넷 질의/응답을 위한 지식베이스 구축방법에 관한 것임.
    2. 발명이 해결하려고 하는 기술적 과제
    본 발명은 기존의 개념망을 확장시켜 지식베이스의 정의와 개념망에 존재하는 개념어를 중심으로 웹문서를 수집 및 분류함으로써, 질의어의 의미해석을 보다 정확히 하고 속성에 의해 개념어들의 사용영역에 따라 적합한 정보를 제공하기 위한 인터넷 질의/응답을 위한 지식베이스 구축방법을 제공하고자 함.
    3. 발명의 해결 방법의 요지
    본 발명은, 인터넷 질의/응답을 위한 지식베이스 구축방법에 있어서, 개념어를 수집하여 개념망을 구성하는 개념망 구성 단계; 상기 개념어를 이용하여 웹 문서를 수집하여 정답문서를 추출하고, 추출된 정답문서에서 속성을 중심으로 문서를 분류하는 문서 추출 및 분류 단계; 상기 분류된 문서 중 속성이 부여되지 않은 문서집단에 대해서 속성을 정의하고 결정하는 속성 추출 단계; 상기 속성이 정의된 문서 중 유사 속성을 통합하여 정규화하는 유사 속성 통합 및 정규화 단계; 및 하위 노드들의 공통 속성을 상위 노드의 속성으로 통합하는 속성 통합 단계를 포함함.
    4. 발명의 중요한 용도
    본 발명은 질의/응답 시스템 등에 이용됨.

    단락 분할 장치 및 그 방법과 단락분할을 이용한 검색방법
    138.
    发明授权
    단락 분할 장치 및 그 방법과 단락분할을 이용한 검색방법 有权
    用于段落分割的装置和方法,以及使用段落分段的搜索方法

    公开(公告)号:KR100508549B1

    公开(公告)日:2005-08-17

    申请号:KR1020030078115

    申请日:2003-11-05

    Abstract: 단락 분할 장치 및 방법과 단락분할 방법을 이용한 검색방법이 개시된다. 주제 설정부는 소정의 도메인을 대표하는 학습 데이터에 적어도 하나 이상의 주제를 설정한다. 패턴 추출부는 학습 데이터를 언어분석과정을 통하여 단문으로 분할하고 분할된 각각의 단문으로부터 소정의 어휘쌍으로 이루어진 제1패턴을 추출한다. 패턴 학습부는 추출된 제1패턴을 설정된 주제에 따라 분류하여 주제별 패턴 DB를 생성한다. 단락 분할부는 입력문서를 언어분석과정을 통해 단문으로 분할하고 분할된 각각의 단문으로부터 소정의 어휘쌍으로 이루어진 제2패턴을 추출한 후 제2패턴과 가장 유사한 패턴의 주제를 주제별 패턴 DB로부터 추출하여 단문의 주제를 할당한다. 이로써, e-mail이나 백과사전 문서, 신문 기사와 같은 특정 도메인의 단락별 주제를 파악하는데 용이할 뿐만 아니라 질의 응답이나 정보검색 등의 응용시스템에서 사용자가 원하는 주제만을 선택하여 제공함으로써 검색의 효율을 높일 수 있다.

    셀 기반의 고차원 데이터 색인 장치 및 그 방법
    139.
    发明公开
    셀 기반의 고차원 데이터 색인 장치 및 그 방법 失效
    用于基于单元的高维数据索引的系统和方法

    公开(公告)号:KR1020030006638A

    公开(公告)日:2003-01-23

    申请号:KR1020010042482

    申请日:2001-07-13

    Abstract: PURPOSE: A cell based high dimensional data indexing system and method is provided to index high dimensional data based on a cell for preventing a lowering of a search efficiency in searching for high dimensional data. CONSTITUTION: The method comprises several steps. First, an N dimensional feature vector is extracted from a multimedia object via a feature vector extractor(801). A distance signature is generated via a signature generation module by using a distance between a signature on the feature vector and a cell center(802). One signature is generated by concatenating the feature vector signature and the distance signature(803), and then is stored at a signature database(804). At the same time, the feature vector is stored at a feature vector database(805). A user can perform a search operation on the stored feature vectors by using various queries like a point query, a range query or k-nearest query(806).

    Abstract translation: 目的:提供一种基于单元的高维数据索引系统和方法,用于根据单元索引高维度数据,以防止在搜索高维数据时降低搜索效率。 构成:该方法包括几个步骤。 首先,经由特征向量提取器(801)从多媒体对象提取N维特征向量。 通过使用特征向量的签名与小区中心之间的距离,通过签名生成模块生成距离签名(802)。 通过连接特征向量签名和距离签名(803)生成一个签名,然后存储在签名数据库(804)。 同时,特征向量存储在特征向量数据库(805)。 用户可以通过使用诸如点查询,范围查询或k-最近查询(806)的各种查询对所存储的特征向量执行搜索操作。

    키팩트기반 텍스트 검색시스템과, 이를 이용한 키팩트기반 텍스트 색인방법 및 검색방법
    140.
    发明公开
    키팩트기반 텍스트 검색시스템과, 이를 이용한 키팩트기반 텍스트 색인방법 및 검색방법 无效
    基于键盘的文本搜索系统,搜索基于键盘文本的设备和方法

    公开(公告)号:KR1020010004404A

    公开(公告)日:2001-01-15

    申请号:KR1019990025035

    申请日:1999-06-28

    Abstract: PURPOSE: A keyfact-based text search system is provided to display concepts of a document with a couple of an object and property and to index and search text based on the couple-displayed data. CONSTITUTION: In a keyfact-based text search system, a keyfact sampling device(11) samples keyfacts from plural key words having the improved vagueness in speech by analyzing a document group to be searched and question of a user. A keyfact index device(12) saves a keyfact list of the entire document groups in a search structure of keyfact as well as calculates frequency of various keyfacts in the document group to be searched. A keyfact search device(13) receives the key facts about the question of the user and the other ones of the document group. The keyfact search device defines a keyfact-based search model and outputs the similar document to the question by considering a weighting constant depending on the type of keyfacts.

    Abstract translation: 目的:提供了一个基于键的文本搜索系统,用于显示具有几个对象和属性的文档的概念,并根据显示的数据对文本进行索引和搜索。 构成:在基于关键词的文本搜索系统中,键状抽样装置(11)通过分析要搜索的文档组和用户的问题,从具有改进的语音模糊性的多个关键词中对关键词进行采样。 键状索引设备(12)将整个文档组的关键字列表保存在关键字的搜索结构中,并且计算要搜索的文档组中的各种关键词的频率。 键元搜索装置(13)接收关于用户的问题的关键事实和文档组中的其他问题。 键元搜索装置定义了基于键的搜索模型,并且通过考虑加权常数来输出相似的文档给该问题,这取决于关键词的类型。

Patent Agency Ranking