基于叙词表的信息检索方法及装置

    公开(公告)号:CN103778262B

    公开(公告)日:2017-07-21

    申请号:CN201410080938.9

    申请日:2014-03-06

    Abstract: 一种基于叙词表的信息检索方法和装置,所述方法包括根据叙词表,对用户输入的检索词进行规范化,获得规范化检索词K;利用规范化检索词K,通过通用搜索引擎对规范化检索词K进行检索,对结果的网址进行分析,提取要素信息;利用相似度计算的方法求出叙词表中K的相关词的相似度,将相似度大于阈值的相关词加入查询扩展集合N;将与K的相似度作为对应相关词的权值,利用相关词对每个网页中的要素信息进行加权求和计算,得到网页的权值,将网页按照权值由从大到小排序。本发明利用叙词表的词间关系,提出语义相似度计算方法,实现对叙词表词间关系的量化分析,并将计算相似度的叙词用于检索后结果的加权排序。本发明信息检索方法和装置显著提高了查询效果。

    基于叙词表的信息检索方法及装置

    公开(公告)号:CN103778262A

    公开(公告)日:2014-05-07

    申请号:CN201410080938.9

    申请日:2014-03-06

    CPC classification number: G06F17/30861 G06F17/3066 G06F17/30672

    Abstract: 一种基于叙词表的信息检索方法及装置,所述方法包括根据叙词表,对用户输入的检索词进行规范化,获得规范化检索词K;利用规范化检索词K,通过通用搜索引擎对规范化检索词K进行检索,对结果的网址进行分析,提取要素信息;利用相似度计算的方法求出叙词表中K的相关词的相似度,将相似度大于阈值的相关词加入查询扩展集合N;将与K的相似度作为对应相关词的权值,利用相关词对每个网页中的要素信息进行加权求和计算,得到网页的权值,将网页按照权值由从大到小排序。本发明利用叙词表的词间关系,提出语义相似度计算方法,实现对叙词表词间关系的量化分析,并将计算相似度的叙词用于检索后结果的加权排序。本发明信息检索方法和装置显著提高了查询效果。

Patent Agency Ranking