-
公开(公告)号:CN117708638A
公开(公告)日:2024-03-15
申请号:CN202311363069.6
申请日:2023-10-20
Applicant: 暨南大学
IPC: G06F18/2337 , G06F18/2415 , G06Q40/03
Abstract: 本发明公开了一种基于重采样的数据公平粒化及分类方法。该方法首先在公平性优化的式前阶段,对输入数据集进行公平性概率的计算,根据敏感特征不同取值下对应的公平性权重,采用自适应替换重采样方法对数据集进行有选择的筛选,得到新的公平数据集。由于重采样方法存在一定的随机性,因此在该阶段添加了衡量数据集公平性的平衡因子DBF,使数据集尽可能达到最优;接着在式中阶段,在信息颗粒的生成过程中加入公平性约束调整颗粒大小,以每个特征下颗粒区间所能覆盖的数据点作为颗粒公平性能的评价指标。通过对数据集敏感特征比例的调整以及颗粒覆盖区间的调整,所生成的信息颗粒的公平性得到显著提升。