전자 문서 처리 장치 및 그 방법
    111.
    发明公开
    전자 문서 처리 장치 및 그 방법 无效
    电子文件处理装置及其方法

    公开(公告)号:KR1020100066920A

    公开(公告)日:2010-06-18

    申请号:KR1020080125438

    申请日:2008-12-10

    CPC classification number: G06F17/30011 G06F17/30613 G06F17/30705

    Abstract: PURPOSE: An electronic document processing device and a method thereof are provided to determine duplicated document according to duplicate sentence rate of electronic document and reduce target electronic document effectively, thereby increasing efficiency of query response. CONSTITUTION: A sentence separation block(106) separates each sentence in extracted body content. A duplicated document decision block(108) changes the separated documents through hash algorithm to inherent hash value. According to collision between the changed hash value and pre-stored hash value, the duplicated document decision block determines duplicated sentence. The duplicated document decision block determines duplicated document according to duplicated document ratio of the electronic document.

    Abstract translation: 目的:提供电子文件处理装置及其方法,根据电子文件的重复句子率确定重复的文件,有效减少目标电子文件,从而提高查询响应的效率。 构成:句子分离块(106)分离提取的身体内容中的每个句子。 复制文档决策块(108)通过散列算法将分离的文档改变为固有散列值。 根据改变的哈希值和预先存储的哈希值之间的冲突,复制的文档决定块确定重复的句子。 复制的文档决定块根据电子文档的重复文档比例确定重复的文档。

    음성 대화 분석 시스템 및 그 방법
    112.
    发明授权
    음성 대화 분석 시스템 및 그 방법 有权
    语音通信分析系统及其方法

    公开(公告)号:KR100920267B1

    公开(公告)日:2009-10-05

    申请号:KR1020070094047

    申请日:2007-09-17

    Abstract: 본 발명에 따른 음성 대화 분석 시스템은 음성 대화 시스템에서 빈번히 발생할 수 있는 생략어나 대용어를 통계적 방법 및 규칙 기반 오류 후처리에 의해서 자동으로 인식하여 복원하여줌으로써, 사용자 확인 절차를 간소화시켜 사용자 편의성을 높이고 사용자의 간단한 발화에 시스템이 지능적으로 대처할 수 있게 한다.
    음성, 대화, 분석, 생략어, 대용어, 복원

    대화형 정보 제공 서비스 장치 및 방법
    113.
    发明授权
    대화형 정보 제공 서비스 장치 및 방법 有权
    提供信息的对话服务的设备和方法

    公开(公告)号:KR100881334B1

    公开(公告)日:2009-02-02

    申请号:KR1020070119262

    申请日:2007-11-21

    Abstract: 본 발명은 사용자 요구에 따라 정보를 제공하기 위한 장치 및 방법에 관한 것으로서, 보다 상세하게는 사용자로부터 수신한 대화형 입력에 기반하여 사용자의 요구를 분석하고 이에 대응하는 정보를 제공하는 대화형 정보 제공 서비스 장치 및 방법에 관한 것이다. 본 발명에 따른 대화형 정보 제공 서비스 장치는 사용자로부터 수신된 입력문을 분석하는 대화문 분석부; 상기 대화문분석부의 분석결과를 이용하여 상기 사용자의 요구를 분석하는 대화 관리부; 상기 대화관리부로부터 실시간 정보 갱신요청이 있는 경우, 웹상에 갱신되는 일상생활 정보를 실시간으로 추출하여 일상정보 데이터베이스에 저장하는 실시간 자동 지식 구축부; 상기 대화관리부에서 분석된 상기 사용자의 요구에 대한 응답을 생성하고 사용자에게 응답을 제공하는 응답 생성부; 및 상기 사용자의 요구에 응답이 불가능한 경우 또는 상기 사용자의 요구에 대한 응답에 오류가 있는 경우, 상기 사용자로 하여금 상기 사용자의 요구를 취소할 수 있도록 하고 시스템을 복원하는 예외 처리부로 구성된다. 본 발명은 대화형 입력에 기반하여 사용자의 요구를 분석하고 이에 대응하는 정보를 제공함으로써, 사용자가 편리하게 필요한 정보를 획득하도록 할 수 있다.
    음성대화 시스템, 대화관리, 실시간 지식 구축, 예외처리, 오류복원

    학습 데이터 구축 장치 및 방법
    114.
    发明公开
    학습 데이터 구축 장치 및 방법 有权
    用于学习数据结构的装置和方法

    公开(公告)号:KR1020070060862A

    公开(公告)日:2007-06-13

    申请号:KR1020050120977

    申请日:2005-12-09

    CPC classification number: G06F17/2818

    Abstract: A device and a method for constructing learning data are provided to reduce expense/time required for constructing the learning data by generating candidate learning data through machine learning, calculating a reliability store of each candidate learning data, and selecting the learning data from the candidate learning data. An incremental learning part(10) generates a learning model from initial learning data(11) by using the machine learning. An automatic tag attaching part(20) generates the candidate learning data by automatically attaching a tag to a raw corpus(21) based on the generated learning model. A candidate learning data selector(30) selects the candidate learning data by calculating the reliability score of the generated candidate learning data. A manual error corrector(40) provides an interface for displaying the selected candidate learning data(41) to a user and enabling the user to correct an error.

    Abstract translation: 提供一种用于构建学习数据的装置和方法,以通过机器学习产生候选学习数据来计算构建学习数据所需的费用/时间,计算每个候选学习数据的可靠性存储,以及从候选学习中选择学习数据 数据。 增量学习部分(10)通过使用机器学习从初始学习数据(11)生成学习模型。 基于生成的学习模型,自动标签附加部件(20)通过自动地将标签附加到原始语料库(21)来生成候选学习数据。 候选学习数据选择器(30)通过计算所生成的候选学习数据的可靠性分数来选择候选学习数据。 手动错误校正器(40)提供用于将选择的候选学习数据(41)显示给用户并使用户能够校正错误的接口。

    질의응답시스템에서의 정답색인 시스템 및 방법
    115.
    发明授权
    질의응답시스템에서의 정답색인 시스템 및 방법 失效
    Q&A系统中的正确答案索引系统和方法

    公开(公告)号:KR100599450B1

    公开(公告)日:2006-07-12

    申请号:KR1020040109134

    申请日:2004-12-21

    Abstract: 본 발명은 질의응답시스템에서의 정답색인 시스템 및 방법에 관한 것으로서, 입력문을 LF(Logical Form) 단위와 문장 단위로 각 어휘들을 정답대상어와 단서어로 나누고, 각 단서어와 정답대상어 쌍을 색인 할 수 있는 방법을 제시하여 정답 제시에서의 속도를 개선함으로써, 질의응답에서 사용자의 질문에 대한 검색 결과인 방대한 문서로부터 사용자가 원하는 정답만을 초점으로 할 수 있으므로 정보검색 및 질의응답 시스템의 성능을 개선할 수 있다.
    질의응답, 정답 색인

    Abstract translation: 涉及在电话系统中的正确索引系统和方法的本发明的查询,以便将输入门语言答案daesangeo并导致每个词汇为LF(逻辑形式)单元和一个句子单元,索引每个线索鳗鱼答案daesangeo对 通过提高通过介绍,在问题和答案给出答案的速度,方式可以是你的问题的搜索结果提供给用户的大量文件,以提高信息检索的性能和问答系统,这样你就可以只专注于所期望的答案 有。

    인터넷 질의/응답을 위한 지식베이스 구축방법
    116.
    发明授权
    인터넷 질의/응답을 위한 지식베이스 구축방법 有权
    网络问答知识库建设

    公开(公告)号:KR100532585B1

    公开(公告)日:2005-12-02

    申请号:KR1020000086642

    申请日:2000-12-30

    Abstract: 1. 청구범위에 기재된 발명이 속하는 기술분야
    본 발명은 인터넷 질의/응답을 위한 지식베이스 구축방법에 관한 것임.
    2. 발명이 해결하려고 하는 기술적 과제
    본 발명은 기존의 개념망을 확장시켜 지식베이스의 정의와 개념망에 존재하는 개념어를 중심으로 웹문서를 수집 및 분류함으로써, 질의어의 의미해석을 보다 정확히 하고 속성에 의해 개념어들의 사용영역에 따라 적합한 정보를 제공하기 위한 인터넷 질의/응답을 위한 지식베이스 구축방법을 제공하고자 함.
    3. 발명의 해결 방법의 요지
    본 발명은, 인터넷 질의/응답을 위한 지식베이스 구축방법에 있어서, 개념어를 수집하여 개념망을 구성하는 개념망 구성 단계; 상기 개념어를 이용하여 웹 문서를 수집하여 정답문서를 추출하고, 추출된 정답문서에서 속성을 중심으로 문서를 분류하는 문서 추출 및 분류 단계; 상기 분류된 문서 중 속성이 부여되지 않은 문서집단에 대해서 속성을 정의하고 결정하는 속성 추출 단계; 상기 속성이 정의된 문서 중 유사 속성을 통합하여 정규화하는 유사 속성 통합 및 정규화 단계; 및 하위 노드들의 공통 속성을 상위 노드의 속성으로 통합하는 속성 통합 단계를 포함함.
    4. 발명의 중요한 용도
    본 발명은 질의/응답 시스템 등에 이용됨.

    단락 분할 장치 및 그 방법과 단락분할을 이용한 검색방법
    117.
    发明授权
    단락 분할 장치 및 그 방법과 단락분할을 이용한 검색방법 有权
    用于段落分割的装置和方法,以及使用段落分段的搜索方法

    公开(公告)号:KR100508549B1

    公开(公告)日:2005-08-17

    申请号:KR1020030078115

    申请日:2003-11-05

    Abstract: 단락 분할 장치 및 방법과 단락분할 방법을 이용한 검색방법이 개시된다. 주제 설정부는 소정의 도메인을 대표하는 학습 데이터에 적어도 하나 이상의 주제를 설정한다. 패턴 추출부는 학습 데이터를 언어분석과정을 통하여 단문으로 분할하고 분할된 각각의 단문으로부터 소정의 어휘쌍으로 이루어진 제1패턴을 추출한다. 패턴 학습부는 추출된 제1패턴을 설정된 주제에 따라 분류하여 주제별 패턴 DB를 생성한다. 단락 분할부는 입력문서를 언어분석과정을 통해 단문으로 분할하고 분할된 각각의 단문으로부터 소정의 어휘쌍으로 이루어진 제2패턴을 추출한 후 제2패턴과 가장 유사한 패턴의 주제를 주제별 패턴 DB로부터 추출하여 단문의 주제를 할당한다. 이로써, e-mail이나 백과사전 문서, 신문 기사와 같은 특정 도메인의 단락별 주제를 파악하는데 용이할 뿐만 아니라 질의 응답이나 정보검색 등의 응용시스템에서 사용자가 원하는 주제만을 선택하여 제공함으로써 검색의 효율을 높일 수 있다.

Patent Agency Ranking