索引文档以供信息检索

    公开(公告)号:CN101460949A

    公开(公告)日:2009-06-17

    申请号:CN200780020322.0

    申请日:2007-03-15

    Applicant: 微软公司

    CPC classification number: G06F16/3326 G06F16/951

    Abstract: 诸如web搜索系统等信息检索系统在查询项的基础上在数百万甚至数十亿可能的文档中定位文档。为实现这点,创建了文档索引。建议在文档中创建新的字段以存储反馈信息。该信息包括在特定搜索中所使用的查询项以及关于是否对所检索到的特定文档给予例如肯定反馈或否定反馈的信息。在该反馈信息加上其它可用信息的基础上创建索引。结果,改进了搜索结果的相关性。对给定文档有多个信息字段(如摘要字段、标题字段、锚文本字段以及此处的反馈字段可用。使用了处理多个字段以及多个查询项并提供对文档字段的差异加权的任何搜索算法。

    索引文档以供信息检索

    公开(公告)号:CN101460949B

    公开(公告)日:2014-08-27

    申请号:CN200780020322.0

    申请日:2007-03-15

    Applicant: 微软公司

    CPC classification number: G06F16/3326 G06F16/951

    Abstract: 诸如web搜索系统等信息检索系统在查询项的基础上在数百万甚至数十亿可能的文档中定位文档。为实现这点,创建了文档索引。建议在文档中创建新的字段以存储反馈信息。该信息包括在特定搜索中所使用的查询项以及关于是否对所检索到的特定文档给予例如肯定反馈或否定反馈的信息。在该反馈信息加上其它可用信息的基础上创建索引。结果,改进了搜索结果的相关性。对给定文档有多个信息字段(如摘要字段、标题字段、锚文本字段以及此处的反馈字段可用。使用了处理多个字段以及多个查询项并提供对文档字段的差异加权的任何搜索算法。

Patent Agency Ranking