一种面向海量图片数据的重复数据删除方法

    公开(公告)号:CN104881470B

    公开(公告)日:2018-05-08

    申请号:CN201510283400.2

    申请日:2015-05-28

    Applicant: 暨南大学

    Inventor: 邓玉辉 谢恒翔

    Abstract: 本发明公开了一种面向海量图片数据的重复数据删除方法,涉及计算机存储领域。该方法包括:根据文件后缀名识别文件类型,将图片文件的位图矩阵数据读入内存;对位图矩阵按基于图片尺寸的分块算法进行分块;用传统的唯一块判定方法或相似性判定方法判定数据块是唯一块还是冗余块;若为冗余块,则将其删除,否则根据原图片文件类型选择对应的图片压缩算法对该数据块进行压缩,然后将其存入系统。本发明提供的技术方案适用于海量图片数据去重环境,能大大缩减其实际存储的数据量。

    一种面向海量图片数据的重复数据删除方法

    公开(公告)号:CN104881470A

    公开(公告)日:2015-09-02

    申请号:CN201510283400.2

    申请日:2015-05-28

    Applicant: 暨南大学

    Inventor: 邓玉辉 谢恒翔

    CPC classification number: G06F17/30156 G06F17/30153

    Abstract: 本发明公开了一种面向海量图片数据的重复数据删除方法,涉及计算机存储领域。该方法包括:根据文件后缀名识别文件类型,将图片文件的位图矩阵数据读入内存;对位图矩阵按基于图片尺寸的分块算法进行分块;用传统的唯一块判定方法或相似性判定方法判定数据块是唯一块还是冗余块;若为冗余块,则将其删除,否则根据原图片文件类型选择对应的图片压缩算法对该数据块进行压缩,然后将其存入系统。本发明提供的技术方案适用于海量图片数据去重环境,能大大缩减其实际存储的数据量。

Patent Agency Ranking