개체 식별 결과 검색 시스템 및 방법
    1.
    发明申请
    개체 식별 결과 검색 시스템 및 방법 审中-公开
    对象识别结果搜索系统和方法

    公开(公告)号:WO2013008978A1

    公开(公告)日:2013-01-17

    申请号:PCT/KR2011/007357

    申请日:2011-10-05

    CPC classification number: G06F17/30876

    Abstract: 본 발명은 개체 식별 결과 검색 시스템 및 방법에 관한 것으로, 개체들에 대한 속성정보가 온톨로지로 저장된 다중 온톨로지 데이터베이스, 질의어가 입력된 경우, 상기 질의어에 대한 식별결과를 트리플 저장모듈로부터 획득하고, 상기 획득된 식별결과를 상기 다중 온톨로지 데이터베이스로부터 획득된 상기 질의어에 대한 식별결과와 비교하여 개체식별 필요 여부를 판단하고, 개체식별이 필요한 경우 상기 다중 온톨로지 데이터베이스로부터 식별대상 개체의 속성정보를 획득 및 비교하여 개체들을 식별하고, 상기 개체식별에 따른 결과정보를 제공하는 개체식별결과 검색장치를 포함한다. 따라서 본 발명에 따르면, Linked Data에 포함된 다중 온톨로지의 속성 정보를 이용하여 다양한 유형의 개체들을 점진적으로 식별할 수 있다.

    Abstract translation: 本发明涉及一种物体识别结果搜索系统和方法。 当将查询输入到多个本体数据库中时,对象识别结果搜索系统从三重存储模块获取查询的识别结果,其中存储关于对象的属性信息作为本体; 将获得的识别与从多个本体数据库获得的查询的识别结果进行比较,以确定是否需要对象标识; 当需要对象识别时,从多个本体数据库中获取并比较识别目标对象上的属性信息,以识别对象; 并根据对象识别提供结果信息。 因此,根据本发明,使用关联数据中包含的多个本体的属性信息逐渐地识别各种类型的对象。

    참고 문헌 적합성 판정 시스템 및 방법
    2.
    发明申请
    참고 문헌 적합성 판정 시스템 및 방법 审中-公开
    评估参考文献适用性的系统和方法

    公开(公告)号:WO2012005414A1

    公开(公告)日:2012-01-12

    申请号:PCT/KR2010/008114

    申请日:2010-11-16

    CPC classification number: G06F17/2211 G06F17/30675

    Abstract: 본 발명은 참고 문헌 적합성 판정 시스템 및 방법에 관한 것으로서, 입력 문헌에 할당된 하나 이상의 주제어와 상기 입력 문헌 내 하나 이상의 참고 문헌에 할당된 하나 이상의 주제어를 매칭 방식으로 비교하는 주제어 비교 모듈, 상기 주제어 비교 모듈에서의 비교 결과를 이용하여 상기 입력 문헌과 상기 참고 문헌간의 연관성을 판단하는 연관성 판정 모듈을 포함한다. 따라서, 본 발명에 따르면, 참고 문헌을 분석하여 입력 문헌과의 연관성을 규명함으로써 논문 심사 기준의 하나인 '적합한 참고문헌 인용'판단을 지원하고 더 나아가 중복 논문 검사 수행 대상을 결정할 수 있다.

    Abstract translation: 本发明涉及一种用于评估参考文献的适用性的系统和方法,包括:对象单词比较模块,将输入文档中分配的一个或多个主题词与参考文档中分配的一个或多个主题词进行比较, 匹配法 以及相关评价模块,使用所述主题词比较模块中的所述比较结果来评估所述输入文档和所述参考文档之间的相关性。 根据本发明,可以分析参考文献来调查输入文件与参考文献的相关性,从而提供支持以确定“引用适当的参考文献”并进一步确定在其上执行学术检查的对象 剽窃论文。

    온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 개체명 사전 또는 마이닝 규칙 데이터베이스 갱신 장치 및 방법
    3.
    发明申请
    온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 개체명 사전 또는 마이닝 규칙 데이터베이스 갱신 장치 및 방법 审中-公开
    与本体论相结合的命名实体字典和设备以及使用采矿规则重新生成名称实体字典或采矿规则数据库的方法

    公开(公告)号:WO2011162444A1

    公开(公告)日:2011-12-29

    申请号:PCT/KR2010/006425

    申请日:2010-09-17

    CPC classification number: G06N5/022

    Abstract: 본 발명은 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 개체명 사전 또는 마이닝 규칙 데이터베이스 갱신 장치 및 방법에 관한 것으로, 온톨로지 스키마와 결합되고 용어의 개체명이 정의된 개체명 사전, 상기 온톨로지 스키마와 결합되고 관계명에 대응되는 마이닝 패턴과 리소스 기술 프레임워크(RDF: Resource Description Framework) 트리플로 구성된 마이닝 규칙이 정의된 마이닝 규칙 데이터베이스가 저장되는 개체명 사전 및 마이닝 규칙 데이터베이스 저장모듈, 텍스트로부터 용어를 인식하여 마이닝 패턴으로 변환하는 마이닝 패턴 생성모듈, 상기 인식된 용어와 상기 마이닝 패턴을 이용하여 대응되는 개체명과 마이닝 규칙을 상기 개체명 사전과 상기 마이닝 규칙 데이터베이스에서 각각 검색하는 개체명 및 마이닝 규칙 검색모듈, 및 상기 인식된 용어에 대응되는 개체명이 상기 개체명 사전으로부터 검색되지 않고 상기 마이닝 패턴에 대응되는 마이닝 규칙이 상기 마이닝 규칙 데이터베이스로부터 검색되는 경우, 상기 마이닝 규칙을 이용하여 용어의 개체명을 추정하고, 상기 추정된 용어의 개체명을 사용자의 선택에 따라 개체명 사전에 저장하는 개체명 사전 갱신모듈을 포함한다.

    Abstract translation: 本发明涉及与本体模式组合的命名实体字典,以及用于使用挖掘规则更新命名实体字典或挖掘规则数据库的装置和方法,包括:命名实体字典,与本体模式相结合 并定义术语的命名实体; 命名实体字典和挖掘规则数据库存储模块,其存储包括与本体模式组合并对应于属性的挖掘模式和资源描述框架(RDF)三元组的挖掘规则数据库; 挖掘模式生成模块,其从文本识别术语并将其转换为挖掘模式; 一个命名实体和挖掘规则搜索模块,分别从命名实体字典和挖掘规则数据库中分别使用公认的术语和挖掘模式搜索相应的实体名称和挖掘规则; 以及命名实体字典更新模块,其使用挖掘规则来估计该术语的命名实体,并且当与所识别的术语相对应的命名实体时,根据用户的选择将命名的实体命名在命名实体字典中 未从命名实体字典搜索,并且从挖掘规则数据库中搜索与挖掘模式相对应的挖掘规则。

    시맨틱 서비스 시스템 및 방법
    4.
    发明申请
    시맨틱 서비스 시스템 및 방법 审中-公开
    用于语义服务的系统与方法

    公开(公告)号:WO2010128712A1

    公开(公告)日:2010-11-11

    申请号:PCT/KR2009/003806

    申请日:2009-07-10

    CPC classification number: G06F17/30861

    Abstract: 본 발명은 복수의 서비스 서버에 분산된 시맨틱 서비스들을 수집하여 등록 및 관리하고, 사용자에 의해서 설정되는 조건에 매칭되도록 복수의 시맨틱 서비스를 조합하여 제공하기 위한 시맨틱 서비스 시스템 및 방법에 관한 것으로서, 온톨로지(ontology) 기반 시맨틱 서비스 정보와 온톨로지를 등록, 삭제, 편집하며, 시맨틱 브로커 서버에 의한 정보 검색을 지원하는 시맨틱 서비스 관리 서버; 시맨틱 서비스 관리 서버를 통해 시맨틱 서비스를 탐색하고 조합하여 복합 시맨틱 서비스 또는 시맨틱 워크플로우 중 어느 하나로 결과를 제공하는 시맨틱 브로커 서버; 및 사용자가 기 설정된 항목에 따라 입력 인자를 비롯한 조건을 입력함에 따라, 시맨틱 브로커 서버로 해당 조건을 전송하여 결과를 요청하고, 이에 대응되는 결과를 수신하여 출력하는 시맨틱 서비스 저작 서버;를 포함하여, 온톨로지 기반 시맨틱 서비스들의 조합을 위해 사용자가 온톨로지를 자유롭게 탐색, 선택하고 이를 근거로 시맨틱 서비스들을 자동으로 조합하며, 조합된 복합 시맨틱 서비스 또는 시맨틱 워크플로우와 사용자가 상호 작용할 수 있는 인터페이스를 제공할 수 있다는 효과를 기대할 수 있다.

    Abstract translation: 本发明涉及一种用于通过收集在多个服务服务器之间分配的语义服务来注册和管理语义服务的语义服务的系统和方法,并且将要匹配的多个语义服务与由 用户,包括:语义服务管理服务器,其登记,删除和编辑本体和基于本体的语义服务信息,并且支持由语义代理服务器执行的信息搜索功能; 语义代理服务器,通过语义服务管理服务器搜索和组合语义服务,并为结果提供组合语义服务或语义工作流之一; 以及语义服务许可服务器,当用户根据预设项输入条件以及输入因子时,通过将相应条件发送到语义代理服务器来请求结果,并接收并输出相应的结果。 从本发明可以预见到以下效果:用户能够自由搜索和选择本体来组合基于本体的语义服务,并且语义服务基于本体自动组合; 并且提供了一个接口,用户可以通过该界面与组合语义服务或语义工作流进行交互。

    인스턴스 경로 탐색 및 시각화 방법 및 장치
    5.
    发明申请
    인스턴스 경로 탐색 및 시각화 방법 및 장치 审中-公开
    实时路径搜索和可视化方法和设备

    公开(公告)号:WO2012165709A1

    公开(公告)日:2012-12-06

    申请号:PCT/KR2011/005687

    申请日:2011-08-02

    CPC classification number: G06F17/30513 G06F17/30522 G06F17/30554

    Abstract: 본 발명은 인스턴스 경로 탐색 및 시각화 방법 및 장치에 관한 것으로, (a) 2개 이상의 키워드 및 경로탐색조건을 입력받는 단계, (b) 상기 키워드들에 대한 인스턴스 쌍들을 생성하고, 온톨로지 인스턴스 데이터베이스로부터 상기 각 인스턴스 쌍에 대응하는 클래스 쌍을 각각 추출하는 단계, (c) 온톨로지 스키마 경로 데이터베이스로부터 상기 각 클래스 쌍에 대한 온톨로지 스키마 경로들을 각각 획득하는 단계, (d) 상기 각 온톨로지 스키마 경로를 이용하여 상기 경로탐색조건에 해당하는 인스턴스 경로들을 각각 탐색하는 단계, (e) 상기 탐색된 인스턴스 경로들이 표시된 인스턴스 경로 제공 화면을 출력하는 단계, (f) 상기 인스턴스 경로 제공 화면을 통해 경로탐색조건이 변경되는 경우, 상기 변경된 경로탐색조건에 해당하는 인스턴스 경로들을 획득하여 시각화하는 단계를 포함한다. 따라서 본 발명에 따르면, 다양하고 복잡한 연관 관계를 빠르게 찾을 수 있도록 스키마 기반의 인스턴스간 경로 탐색 기법을 제시하고 둘 이상의 인스턴스간 경로를 효율적으로 보여줄 수 있는 인스턴스간 경로 가시화 기법을 제시할 수 있다.

    Abstract translation: 本发明涉及一种实例路径搜索和可视化方法及装置。 该方法包括:(a)接收至少两个关键字和路径搜索条件,(b)生成关键词的实例对,并从本体实例数据库中提取与每个实例对相对应的每个类对,(c)获取每个本体方案路径, (d)通过使用每个本体方案路径搜索与路径搜索条件相对应的每个实例路径,(e)输出具有所显示的搜索到的实例路径的实例路径提供屏幕,以及(f )当通过提供屏幕的实例路径改变路径搜索条件时,获得与改变的路径搜索条件相对应的实例路径,以便可视化它们。 根据本发明,可以建议用于搜索基于方案的实例之间的路径的技术来快速寻找各种和复杂的链接关系,并且可以建议用于可视化实例之间的路径的技术以有效地显示至少 两个实例。

    기술 추이 시각화 장치 및 방법
    6.
    发明申请
    기술 추이 시각화 장치 및 방법 审中-公开
    用于可视化技术开发的方法和装置

    公开(公告)号:WO2012144685A1

    公开(公告)日:2012-10-26

    申请号:PCT/KR2011/003641

    申请日:2011-05-17

    CPC classification number: G06Q10/06 G06Q10/0639

    Abstract: 본 발명은 기술 추이 시각화 장치 및 방법에 관한 것으로, 다중 자원이 통합된 문헌 데이터베이스, 기술별 유망 기술 라이프 사이클에서의 대표 단계, 현단계, 다음 단계 및 연도별 단계에 대한 정보가 저장된 기술 정보 데이터베이스, 사용자로부터 특정 기술을 입력받는 인터페이스 모듈, 유망 기술 라이프 사이클에 위치한 유망 기술들에 대해, 상기 문헌 데이터베이스를 검색하여 기 정의된 자질들에 대한 자질값을 구하고, 그 구해진 자질값들을 이용하여 유망 기술별 자질 집합을 생성하는 자질 집합 생성 모듈, 상기 유망 기술 라이프 사이클에서 동일 단계에 속하는 유망기술들의 자질 집합간에 공통 자질값을 구하여 단계별 정답 자질 집합을 생성하는 정답 자질 집합 생성 모듈, 상기 인터페이스 모듈을 통해 특정 기술이 입력된 경우, 상기 문헌 데이터베이스를 검색하여 상기 특정기술에 대한 자질관련정보를 획득하고, 상기 획득된 자질관련정보를 이용하여 상기 특정기술의 대표 자질집합 및 연도별 자질집합을 생성한 후, 상기 대표 자질집합 또는 연도별 자질집합을 상기 정답 자질 집합과 비교하여 상기 특정 기술이 상기 유망 기술 라이프 사이클내에서 속하는 대표단계 또는 연도별 단계를 판단하고, 상기 연도별 단계를 이용하여 상기 특정 기술의 발전속도를 예측하는 단계 판단 모듈, 상기 특정 기술의 대표단계가 표시된 유망 기술 라이프 사이클을 시각화하는 시각화 모듈, 상기 시각화된 유망 기술 라이프 사이클에서 상기 특정 기술이 선택된 경우, 상기 기술정보 데이터베이스로부터 상기 특정 기술에 대한 현단계, 연도별 단계 및 예측된 다음 단계를 획득하여 상기 시각화 모듈을 통해 시각화하는 연도별 단계 획득 모듈을 포함한다. 따라서 본 발명에 따르면, 다종의 문헌 데이터베이스를 활용하여 특정 기술이 유망 기술 라이프 사이클 내에서 속하는 현재 단계 및 연도별 단계뿐만 아니라 향후 발전 속도를 모두 예측할 수 있다.

    Abstract translation: 本发明涉及一种用于可视化技术开发的方法和装置,包括:文档数据库,其中多个资源被集成; 技术信息数据库在有希望的技术生命周期中存储有关代表性步骤,当前步骤,下一步骤和逐步技术的信息的信息; 用于用户输入特定技术的接口模块; 一种用于搜索文档数据库以找到预定属性的属性值的属性集生成模块,用于处于有希望的技术生命周期中的有希望的技术,并且使用所发现的属性值为每种有希望的技术生成属性集; 应答属性集生成模块,用于通过在有希望的技术生命周期中找到属于同一步骤的有希望的技术的属性集合之间的共享属性值来生成每步骤的答案属性集合; 步骤评估模块,用于搜索文档数据库并获取关于特定技术的属性相关信息,当通过接口模块输入特定技术时,使用所获得的属性相关信息来生成代表属性集和由年份设置的属性 具体技术之后,将代表性属性集合或年份设置的属性与答案属性集进行比较,从而评估具体技术属于有希望的技术生命周期中的代表性步骤或逐年递减, 并用于逐年预测具体技术的开发速度; 一个可视化模块,用于可视化指示具体技术的代表性步骤的有希望的技术生命周期; 以及从技术信息数据库中获取当前步骤,逐年获取具体技术的预测步骤的模块,当从可视化的有希望的技术生命周期中选择具体技术时, 并通过可视化模块进行可视化。 因此,本发明不仅使用多个文档数据库来预测具体技术属于有希望的技术生命周期的当前步骤和逐年的逐步增长,而且预测未来的发展速度。

    질의에 따른 연관정보 제공 장치 및 방법
    7.
    发明申请
    질의에 따른 연관정보 제공 장치 및 방법 审中-公开
    根据查询提供相关信息的设备和方法

    公开(公告)号:WO2012060526A1

    公开(公告)日:2012-05-10

    申请号:PCT/KR2011/003637

    申请日:2011-05-17

    CPC classification number: G06F17/30864

    Abstract: 본 발명은 질의에 따른 연관정보 제공 장치 및 방법에 관한 것으로서, 검색어 및 각 검색어에 대해 기 설정된 검색 사이트별 검색결과 존재 유무 및 검색결과가 저장된 검색어 정보 데이터베이스, 사용자에 의해 검색어가 입력된 경우, 상기 입력된 검색어가 상기 검색어 정보 데이터베이스에 존재하는지의 여부를 이용하여 신규 검색어인지를 판단하는 신규 검색어 판단부, 상기 신규 검색어 판단부의 판단결과를 근거로 상기 검색어에 대한 연관정보를 상기 사용자에게 제공하고, 상기 검색어가 신규 검색어인 경우 상기 검색어를 상기 검색어 정보 데이터베이스에 저장하거나 업데이트하며, 상기 검색어 및 검색사이트 정보를 포함하는 검색결과 수집요청 신호를 검색결과 수집부에 전송하는 연관정보 제공부, 상기 연관정보 제공부로부터 검색결과 수집요청 신호가 수신된 경우, 상기 검색사이트 정보에 해당하는 검색 사이트로부터 상기 검색어에 대한 검색결과를 수집하는 검색결과 수집부, 상기 검색결과 수집부에서 수집된 각 검색결과로부터 용어를 추출하고, 상기 추출된 용어를 순위화하여 연관정보를 획득한 후, 상기 검색어 정보 데이터베이스에 저장하는 연관정보 획득부를 포함한다. 따라서, 본 발명에 따르면, 시간 소모적인 검색결과 수집을 주기적 수집과 실시간 수집으로 이원화하여 시급성에 따라 능동적으로 대처할 수 있다.

    Abstract translation: 本发明涉及一种用于向查询提供相关信息的装置和方法,包括:用于保存搜索词的搜索词信息数据库,关于每个预定搜索网站的搜索结果的存在的信息以及搜索结果; 新的搜索词确定单元,用于当搜索词由用户输入时,通过使用搜索信息数据库中的输入搜索词的存在来确定输入搜索词是否是新的搜索词; 相关信息提供单元,用于基于新的搜索词确定单元的确定结果向用户提供与搜索词相关的信息,用于当搜索词是新的搜索时将搜索词保存或更新为搜索词信息数据库 用于将包括搜索词和搜索网站信息的搜索结果收集请求信号发送到搜索结果收集单元; 搜索结果收集单元,用于收集与搜索网站信息对应的搜索网站中搜索词的搜索结果; 以及相关信息获取单元,用于从搜索结果收集单元收集的每个搜索结果中提取术语,通过对所提取的术语进行优先排序获取相关信息,并将其保存在搜索信息数据库上。 结果,根据本发明,收集耗时的搜索结果可以分为包括定期收集和实时收集的两个活动,以便根据紧急程度实现主动响应。

    온톨로지 기반의 통계 분석 방법
    8.
    发明申请
    온톨로지 기반의 통계 분석 방법 审中-公开
    分析基于民族的统计学方法

    公开(公告)号:WO2012057383A1

    公开(公告)日:2012-05-03

    申请号:PCT/KR2010/007560

    申请日:2010-10-29

    CPC classification number: G06F17/30734

    Abstract: 전거 데이터를 효율적으로 관리함으로써 통계분석의 효율성을 제고시키는 온톨로지 기반의 통계 분석 방법이 개시된다. 온톨로지 기반의 통계 분석 방법은 통계 항목들을 대상으로 전거데이터 온톨로지를 구축하는 과정; 전거데이터 및 전거데이터 온톨로지를 기반으로 연구성과를 대상으로 연구성과 온톨로지를 구축하는 과정; 및 온톨로지 관계 정보를 이용하여 연구성과에 대한 통계 정보를 생성하는 과정을 포함한다. 제안된 온톨로지 기반의 통계 분석 방법에 따르면 동일한 개체에 대해 사용되던 이표기들을 온톨로지화하여 관리함으로써 효율적으로 통계 정보를 관리할 수 있게 하는 효과를 갖는다.

    Abstract translation: 公开了一种用于分析基于本体的统计的方法,其通过有效地管理权限数据来提高统计分析的效率。 本体统计分析方法包括:建立统计项目权威数据本体; 在权威数据和本体论的基础上建立研究成果的本体论; 并使用本体论关系信息生成研究结果的统计信息。 根据所公开的用于分析基于本体的统计的方法,用于同一对象的不同符号变成本体论并被管理,使得可以有效地管理统计信息。

    온톨로지 기반 개인화 서비스 시스템 및 방법
    9.
    发明申请
    온톨로지 기반 개인화 서비스 시스템 및 방법 审中-公开
    基于民族的个人化服务的系统与方法

    公开(公告)号:WO2011162445A1

    公开(公告)日:2011-12-29

    申请号:PCT/KR2010/006429

    申请日:2010-09-17

    CPC classification number: G06F17/30044 G06F17/30035 G06F17/30041

    Abstract: 본 발명은 사용자 개인 정보의 사용자 프로파일 온톨로지에 있는 주체 또는 객체와 개인화 서비스 온톨로지의 주체 또는 객체를 관계명으로 연계한 상태에서, 사용자로부터 개인화 서비스를 선택받는 경우, 선택된 개인화 서비스에 해당하는 개인화 서비스 온톨로지를 검색하여 개인화 서비스 온톨로지에 연계된 사용자 프로파일 온톨로지 내 인스턴스 형태의 개인 정보를 획득하고, 획득한 개인 정보를 적용하여 개인화 서비스를 실행하여 그 결과를 사용자에게 제공할 수 있도록 된, 온톨로지 기반 개인화 서비스 시스템 및 방법에 관한 것이다. 본 발명에 따른 개인화 서비스 방법은, 사용자의 개인 정보를 사용자 프로파일 온톨로지에 저장하고, 상기 사용자 프로파일 온톨로지에 개인화 서비스 온톨로지를 연계 시킨 상태에서, (a) 상기 사용자로부터 개인화 서비스를 선택받는 단계; (b) 상기 선택된 개인화 서비스에 해당하는 개인화 서비스 온톨로지를 검색하여, 상기 개인화 서비스 온톨로지에 연계된 상기 사용자 프로파일 온톨로지 내 인스턴스 형태의 개인 정보를 획득하는 단계; 및 (c) 상기 획득한 개인 정보를 적용하여 상기 개인화 서비스를 실행하고 그 결과를 상기 사용자에게 제공하는 단계를 포함한다.

    Abstract translation: 本发明涉及一种基于本体的个性化服务的系统和方法,该系统和方法搜索与所选择的个性化服务相关的个性化服务本体,以与该用户简档本体相关联的用户简档本体中的实例的形式获取个人信息 并且通过应用获取的个人信息来执行个性化服务,并且将用户的个人信息的结果提供给用户,如果用户在用户个人信息的用户简档本体中的主体或对象选择了个性化服务,以及 个性化服务本体的主题或对象由属性链接。 根据本发明的个性化服务的方法包括以下步骤:当用户的个人信息被保存在用户简档本体中时,个性化服务本体被链接到用户简档本体,(a)接收 从用户选择个性化服务; (b)搜索与所选择的个性化服务相关的个性化服务本体,并且从与个性化服务本体相关联的用户的简档本体中获取实例形式的个人信息; 以及通过应用获取的个人信息来执行个性化服务,并将其结果提供给用户。

    문맥으로부터의 개체명 추출을 이용한 개체명 사전 구축과 규칙 등록 방법 및 시스템
    10.
    发明申请
    문맥으로부터의 개체명 추출을 이용한 개체명 사전 구축과 규칙 등록 방법 및 시스템 审中-公开
    通过从上下文提取有名实体和注册规则来构建名词实体字典的方法和系统

    公开(公告)号:WO2011136426A1

    公开(公告)日:2011-11-03

    申请号:PCT/KR2010/003079

    申请日:2010-05-17

    CPC classification number: G06F17/30616

    Abstract: 본 발명은 기 구축된 개체명 사전에 등록된 특정 분류 내 개체명이 텍스트 문서에 포함되어 있을 때, 해당 개체명의 앞 문맥이나 뒷 문맥(문자열 또는 LSP 형식의 문맥)을 추출하고, 추출된 문맥 내에서 또 다른 용어(전문용어 포함)들을 빈도 순이나 가나다 순 등으로 정렬하여, 해당 분류에 속하는 개체명들을 찾기 쉽게 지원함으로써 개체명 사전을 확장하여 구축할 수 있도록 하고, 상기 다른 용어를 이용하는 다른 문맥들에서 다른 용어를 제외시킨 문맥들을 규칙으로 등록할 수 있도록 된, 문맥으로부터의 개체명 추출을 이용한 개체명 사전 구축과 규칙 등록 방법 및 시스템에 관한 것이다. 본 발명에 따른 개체명 사전 구축 방법은, 하나 이상의 개체명과 상기 개체명에 대응된 하나 이상의 용어들이 등록되어 있는 개체명 사전을 구비한 시스템의 개체명 사전 구축 방법으로서, (a) 상기 개체명 사전에 등록된 개체명을 가지는 용어가 텍스트 문서에 존재하는지의 여부를 검색하는 단계; (b) 상기 용어가 존재하는 경우, 상기 용어가 포함된 문맥을 상기 텍스트 문서로부터 추출하는 단계; (c) 상기 용어가 포함된 문맥에서 상기 용어가 제외된 문맥을 상기 텍스트 문서로부터 재검색하는 단계; (d) 재검색된 상기 용어가 제외된 문맥에서 상기 용어 위치에 존재하는 다른 용어를 분리하고 정렬하여 표시하는 단계; (e) 상기 다른 용어들을 상기 개체명에 추가하거나, 상기 다른 용어들이 가지는 제2 개체명을 추가하고 설정하는 단계; 및 (f) 상기 개체명 또는 상기 제2 개체명을 상기 개체명 사전에 등록하는 단계를 포함한다.

    Abstract translation: 本发明涉及通过从上下文中提取命名实体和注册规则来构造命名实体字典的方法和系统。 根据所述方法和系统,当在预先构建的命名实体字典中注册并被分类为特定类别的命名实体被包括在文本文档中时,在上下文(字符串或LSP类型上下文)之前或之后 在提取命名实体之后,在提取的上下文中按照频率或按字母顺序排列其他术语(包括技术术语)。 因此,容易找到属于类别的命名实体,以便可以扩展命名实体字典; 并且从使用其他术语的其他上下文中,可以定期注册排除其他术语的上下文。 根据本发明,对于具有指定实体字典的系统,用于构造命名实体的方法,其中登记有一个或多个命名实体和与之对应的一个或多个术语,所述方法包括:(a) 搜索以检测在命名实体字典中注册的命名实体的术语是否存在于文本文档中; (b)当该术语存在时,从文本文件中提取包含术语的上下文的步骤; (c)通过从包括该术语的上下文中排除该术语获得的上下文,再次搜索文本文档的步骤; (d)分离在上下文排除的术语位置中存在的其他术语,以及安排和显示其他术语的步骤; (e)将其他术语添加到命名实体的步骤,或为其他术语添加和配置第二命名实体; 和(f)用于将命名实体或第二命名实体注册到命名实体字典中的步骤。

Patent Agency Ranking