一种网页相似度计算方法及装置

    公开(公告)号:CN104133870B

    公开(公告)日:2017-06-09

    申请号:CN201410348586.0

    申请日:2014-07-22

    Abstract: 本发明实施例公开一种网页相似度计算方法及装置,应用于计算机网络领域,能够解决现有的比对两个网页的相似度时判断不准的问题。该方法包括:生成待测网页对应的基于视觉结构的第一分块特征向量,其中第一分块特征向量包括第一分块位置特征向量和第一分块内容特征向量;将第一分块特征向量和预设网页对应的基于视觉结构的第二分块特征向量进行比对,获得待测网页的相似度。本发明的实施例应用于比较网页相似度。

    一种网页相似度计算方法及装置

    公开(公告)号:CN104133870A

    公开(公告)日:2014-11-05

    申请号:CN201410348586.0

    申请日:2014-07-22

    CPC classification number: G06F17/30861

    Abstract: 本发明实施例公开一种网页相似度计算方法及装置,应用于计算机网络领域,能够解决现有的比对两个网页的相似度时判断不准的问题。该方法包括:生成待测网页对应的基于视觉结构的第一分块特征向量,其中第一分块特征向量包括第一分块位置特征向量和第一分块内容特征向量;将第一分块特征向量和预设网页对应的基于视觉结构的第二分块特征向量进行比对,获得待测网页的相似度。本发明的实施例应用于比较网页相似度。

Patent Agency Ranking