一种海量规模的邮件地址匹配方法

    公开(公告)号:CN108764840A

    公开(公告)日:2018-11-06

    申请号:CN201810508941.4

    申请日:2018-05-24

    CPC classification number: G06Q10/107

    Abstract: 本发明提供了一种海量规模的邮件地址匹配方法。选取海量规模下哈希耗时和哈希冲突处理优秀的哈希模型,作为匹配方法的哈希函数。由于邮件地址的域名重复概率很大,利用布隆过滤器对邮件地址的进行存储以及匹配,以此降低匹配方法的内存消耗和匹配效率。使用红黑树存储哈希冲突后的模式串,提高算法全文匹配的性能。本发明针对WM匹配方法的存储结构和匹配流程进行优化。利用一种高效的哈希模型(BKDRHash)减少哈希冲突;通过布隆过滤器存储和匹配邮件地址的域名,避免了邮件域名的重复存储,降低了匹配方法的内存消耗;通过使用红黑树处理产生哈希冲突的元素,降低全文匹配耗时。

Patent Agency Ranking