跨多个源标识主导概念

    公开(公告)号:CN102270220A

    公开(公告)日:2011-12-07

    申请号:CN201110159629.7

    申请日:2011-06-03

    Applicant: 微软公司

    CPC classification number: G06F17/3053 G06F17/30528

    Abstract: 本文描述了跨多个源标识主导概念。提供了用于标识主导概念的的系统、方法和计算机可读介质。该系统包括连接到各个源的搜索引擎、实体提取组件、元数据库、以及排名组件。搜索引擎接收上下文查询并且响应于该上下文查询提供结果。实体提取组件解析结果并且标识结果中包括的实体。元数据库提供包括在结果中的实体与包括在上下文查询中的查询项之间的距离。排名组件基于所提供距离来对实体进行排名,并且基于指派给实体的排名来选择结果内的主导概念。

    来自文档概述的问题概念的本体分类

    公开(公告)号:CN102163215A

    公开(公告)日:2011-08-24

    申请号:CN201110063258.2

    申请日:2011-03-07

    Applicant: 微软公司

    CPC classification number: G06F15/18 G06F17/30

    Abstract: 本发明描述了一种来自文档概述的问题概念的本体分类。分析电子文档来标识断言,逆转这些断言来生成可由断言回答的问题。可以分析文档或电子文档语料库来标识文档的文本内的各实体以及各实体之间的关系。基于各实体以及各实体之间的关系来标识断言。每一断言表示关于实体的一个事实,并且一组断言表示文档或文档语料库的概述。逆转断言来生成可由这些断言回答的问题。还可以进一步分析这些问题来标识相关概念和话题并围绕这些概念和话题来对问题进行聚类。还可以生成便于在话题、概念、问题、断言、文档概述和文档之间遍历的组合图。

    来自文档概述的问题概念的本体分类

    公开(公告)号:CN102163215B

    公开(公告)日:2013-11-06

    申请号:CN201110063258.2

    申请日:2011-03-07

    Applicant: 微软公司

    CPC classification number: G06F15/18 G06F17/30

    Abstract: 本发明描述了一种来自文档概述的问题概念的本体分类。分析电子文档来标识断言,逆转这些断言来生成可由断言回答的问题。可以分析文档或电子文档语料库来标识文档的文本内的各实体以及各实体之间的关系。基于各实体以及各实体之间的关系来标识断言。每一断言表示关于实体的一个事实,并且一组断言表示文档或文档语料库的概述。逆转断言来生成可由这些断言回答的问题。还可以进一步分析这些问题来标识相关概念和话题并围绕这些概念和话题来对问题进行聚类。还可以生成便于在话题、概念、问题、断言、文档概述和文档之间遍历的组合图。

Patent Agency Ranking