向用户提供数据的系统以及用于优化对数据的利用的方法

    公开(公告)号:CN1797399B

    公开(公告)日:2010-04-07

    申请号:CN200510116101.6

    申请日:2005-10-17

    Applicant: 微软公司

    CPC classification number: G06F17/30902

    Abstract: 描述了允许对结构化形式的搜索引擎结果和查询日志的计划性访问的系统和方法。能够从搜索引擎中检索包含提供给web浏览器的HTML页面中的信息(潜在地还有其它信息)的中间形式的搜索结果。该中间形式然后可以使用本地资源在客户机上分解来组装结构化的对象。该库也提供对搜索结果的高速缓存。这可以在本地机器和远程数据库上提供。例如,当一个查询的结果在高速缓存中存在时,它们可以从这些位置检索而不查询搜索引擎。文档和/或网页也可以被高速缓存。该库也能够被指导来仅从高速缓存中操作,从而有效地展现本地数据集而不是远程搜索引擎。

    为聚焦的搜索构建并使用子网

    公开(公告)号:CN1645370A

    公开(公告)日:2005-07-27

    申请号:CN200510006208.5

    申请日:2005-01-21

    Applicant: 微软公司

    CPC classification number: G06F17/30867 Y10S707/99933

    Abstract: 一种便于在包括对应于用户感兴趣的主题和/或用户特征的子网的站点集合上的聚焦搜索的执行的系统。该子网包括涉及该主题和/或用户特征的多个域和/或路径(如,站点)。该子网内的每一站点被分配一指示该站点与期望的主题和/或用户特征的相关度的权值。搜索引擎采用该子网以便于在站点集合上聚焦搜索。搜索引擎接收查询,并使用该子网在站点集合上聚焦对应于由该子网表示的主题和/或用户特征的搜索。搜索的结果至少部分地基于向该子网内的站点分配的相关度权值被返回到用户。

    改进的拼写检查系统和方法

    公开(公告)号:CN100517301C

    公开(公告)日:2009-07-22

    申请号:CN200510059231.0

    申请日:2005-03-16

    Applicant: 微软公司

    CPC classification number: G06F17/273

    Abstract: 本发明利用搜索查询字符串的迭代变换以及从搜索查询日志和/或web数据提取出来的统计量,给搜索查询字符串提供可能的备选拼写。这提供一种能用来给每个用户提供个性化建议的拼写检查方法。通过利用搜索查询日志,本发明能考虑到辞典里没有但仍可接受为所关心的搜索查询的子串。这允许一种提供在辞典内容之外的质量更高的备选拼写建议的方法。本发明的一个实例通过利用从查询日志中提取出来的词一元模型和/或二元模型的统计量并结合迭代搜索,在子串级别上工作。这为给定查询提供了实质上比只利用子串匹配的方法更好的拼写备选方案。本发明的其他实例能接收来自除了搜索查询输入之外的来源的输入数据。

    用于基于客户机的WEB蠕动的系统和方法

    公开(公告)号:CN1601528A

    公开(公告)日:2005-03-30

    申请号:CN200410076942.4

    申请日:2004-09-03

    Applicant: 微软公司

    CPC classification number: G06F17/30864

    Abstract: 本发明提供了各种系统和方法,用于利用分布式web爬虫来从联网系统获得信息。利用服务器的客户机的分布式性质来提供快速、准确的web蠕动数据。将服务器的web爬虫所搜集的信息与该服务器的客户机所检索的数据进行比较,以更新该爬虫的数据。在本发明的一个实例中,通过利用经由搜索引擎结果网页而加以传播的信息,来实现数据比较。在本发明的另一个实例中,由概括web爬虫数据的客户机词典(从服务器发出)来实现数据证实。本发明也通过提供用于抵抗web爬虫的电子欺骗法的方法,以提高数据准确度,来促进数据分析。

    为聚焦的搜索构建并使用子网

    公开(公告)号:CN1645370B

    公开(公告)日:2010-07-21

    申请号:CN200510006208.5

    申请日:2005-01-21

    Applicant: 微软公司

    CPC classification number: G06F17/30867 Y10S707/99933

    Abstract: 一种便于在包括对应于用户感兴趣的主题和/或用户特征的子网的站点集合上的聚焦搜索的执行的系统。该子网包括涉及该主题和/或用户特征的多个域和/或路径(如,站点)。该子网内的每一站点被分配一指示该站点与期望的主题和/或用户特征的相关度的权值。搜索引擎采用该子网以便于在站点集合上聚焦搜索。搜索引擎接收查询,并使用该子网在站点集合上聚焦对应于由该子网表示的主题和/或用户特征的搜索。搜索的结果至少部分地基于向该子网内的站点分配的相关度权值被返回到用户。

    改进的拼写检查系统和方法

    公开(公告)号:CN1670723A

    公开(公告)日:2005-09-21

    申请号:CN200510059231.0

    申请日:2005-03-16

    Applicant: 微软公司

    CPC classification number: G06F17/273

    Abstract: 本发明利用搜索查询字符串的迭代变换以及从搜索查询日志和/或web数据提取出来的统计量,给搜索查询字符串提供可能的备选拼写。这提供一种能用来给每个用户提供个性化建议的拼写检查方法。通过利用搜索查询日志,本发明能考虑到辞典里没有但仍可接受为所关心的搜索查询的子串。这允许一种提供在辞典内容之外的质量更高的备选拼写建议的方法。本发明的一个实例通过利用从查询日志中提取出来的词一元模型和/或二元模型的统计量并结合迭代搜索,在子串级别上工作。这为给定查询提供了实质上比只利用子串匹配的方法更好的拼写备选方案。本发明的其他实例能接收来自除了搜索查询输入之外的来源的输入数据。

    用于基于客户机的WEB蠕动的系统和方法

    公开(公告)号:CN1601528B

    公开(公告)日:2011-04-13

    申请号:CN200410076942.4

    申请日:2004-09-03

    Applicant: 微软公司

    CPC classification number: G06F17/30864

    Abstract: 本发明提供了各种系统和方法,用于利用分布式web爬虫来从联网系统获得信息。利用服务器的客户机的分布式性质来提供快速、准确的web蠕动数据。将服务器的web爬虫所搜集的信息与该服务器的客户机所检索的数据进行比较,以更新该爬虫的数据。在本发明的一个实例中,通过利用经由搜索引擎结果网页而加以传播的信息,来实现数据比较。在本发明的另一个实例中,由概括web爬虫数据的客户机词典(从服务器发出)来实现数据证实。本发明也通过提供用于抵抗web爬虫的电子欺骗法的方法,以提高数据准确度,来促进数据分析。

    查询图
    10.
    发明授权

    公开(公告)号:CN1755685B

    公开(公告)日:2010-09-08

    申请号:CN200510093960.8

    申请日:2005-08-30

    Applicant: 微软公司

    CPC classification number: G06F17/30651 Y10S707/99933

    Abstract: 本发明平衡基于查询和/或搜索意图的与查询相关的信息,以提供系统化手段来便于用户定位所希望的信息,而不用确切的搜索参数。这允许用户不用首先明确表示最优的搜索查询就能够找到信息。查询图通过表示与查询相关的信息的节点和表示信息之间的关联性的边而提供了关于与查询相关的信息的可导航的图形概念。在本发明的一个实例中,查询图从诸如查询日志、查询列表和/或搜索引擎等之类的信息源导出。本发明的其它实例利用查询图所采用的可视的和/或可听的指示符来便于向用户传播与查询相关的信息,包括但不限于覆盖图、图标、颜色和维度变化等等。

Patent Agency Ranking