对文件内容进行分布式索引

    公开(公告)号:CN101925899A

    公开(公告)日:2010-12-22

    申请号:CN200980103202.6

    申请日:2009-01-23

    Applicant: 微软公司

    CPC classification number: G06F17/30094

    Abstract: 本文描述的是一种特别地用于对文件内容进行分布式索引的技术。对文件进行基于内容的索引涉及确定该文件的基于内容的索引信息是否可从外部源获得。这避免重复已执行的内容分析,尤其对于非文本文件而言内容分析是耗时且计算密集的。如果基于内容的索引信息可用,则从外部源接收它并存储它。如果基于内容的索引信息不可用或不完整,则生成并存储该文件的基于内容的索引信息。此外,与外部源共享所生成的基于内容的索引信息。一旦执行了该文件的内容分析从而生成了该文件的基于内容的索引信息,则在需要时该基于内容的索引信息是可用并可共享的。不需要重复对该文件的同一内容分析。

Patent Agency Ranking