-
公开(公告)号:CN110543782B
公开(公告)日:2022-03-29
申请号:CN201910621268.X
申请日:2019-07-10
Applicant: 暨南大学
Abstract: 本发明公开了一种基于k‑匿名算法实现数据集脱敏的方法以及系统,包括以下步骤:获取未经脱敏处理的数据集;将数据集显示标识符删除,定义准标志符中的每个属性取值域上的顺序,使之成为有序域;将有序域一一映射到实数域中;对于空间各数据点的距离的定义并计算相对距离,根据相对距离结合投影区域密度划分算法确定数据集的划分点,递推求出各级分割点,最终建立超球体群;对超球体群中的每个超球体中所含的点信息进行概化处理,使得所有的记录的准标志符取值相同,完成脱敏处理。本发明能够改善矩形存在的区域角问题,并且能够考虑到临时匿名组中相邻点之间的距离问题,使得在保证隐私保护的前提下,得到更多的匿名组,使数据的概化程度越低,增大了数据的可用性。
-
公开(公告)号:CN110543782A
公开(公告)日:2019-12-06
申请号:CN201910621268.X
申请日:2019-07-10
Applicant: 暨南大学
Abstract: 本发明公开了一种基于k-匿名算法实现数据集脱敏的方法以及系统,包括以下步骤:获取未经脱敏处理的数据集;将数据集显示标识符删除,定义准标志符中的每个属性取值域上的顺序,使之成为有序域;将有序域一一映射到实数域中;对于空间各数据点的距离的定义并计算相对距离,根据相对距离结合投影区域密度划分算法确定数据集的划分点,递推求出各级分割点,最终建立超球体群;对超球体群中的每个超球体中所含的点信息进行概化处理,使得所有的记录的准标志符取值相同,完成脱敏处理。本发明能够改善矩形存在的区域角问题,并且能够考虑到临时匿名组中相邻点之间的距离问题,使得在保证隐私保护的前提下,得到更多的匿名组,使数据的概化程度越低,增大了数据的可用性。
-