-
公开(公告)号:CN119598231A
公开(公告)日:2025-03-11
申请号:CN202510142384.9
申请日:2025-02-10
Applicant: 华侨大学
IPC: G06F18/2321 , G06F18/214 , G06Q10/04 , G06Q50/20
Abstract: 本发明提供的过采样多聚类融合的数据预测方法、装置、设备及介质,涉及数据预测领域。本发明通过获取原始数据集,进行预处理后,分为少数类数据和多数类数据;对少数类数据分别采用不同的聚类算法进行聚类,并将生成的聚类中心数据添加到少数类数据中;对添加聚类中心后的少数类数据进行IF‑SNNDPC聚类,并计算每个子簇的过采样数量;在每个子簇中,计算随机选择的两个非聚类中心的点与聚类中心之间的质心,并将质心作为新样本加入少数类数据中,直至满足对应子簇所需的样本数量,得到最终的少数类数据;将最终的少数类数据与多数类数据一起输入预先训练好的XGBoost模型,得到预测的数据。本发明能增加少数类别的样本数量,解决样本数据类别不平衡的问题。