-
公开(公告)号:CN119339961A
公开(公告)日:2025-01-21
申请号:CN202411884759.0
申请日:2024-12-20
Applicant: 华侨大学
Inventor: 范宗文
IPC: G16H50/50 , G06F18/214 , G06F18/243 , G06N3/006 , G06N3/0985
Abstract: 本发明提供的基于蝴蝶优化与CatBoost肝脏疾病预测模型的构建方法及装置,涉及疾病数据分析处理技术领域。本发明通过获取不平衡的肝脏疾病数据集;采用十折交叉验证法,将预处理后的原始数据集划分训练集和测试集;然后将训练集输入CatBoost模型进行训练,并采用蝴蝶优化算法对CatBoost模型的二元分类阈值和超参数进行优化,当设定的目标函数达到最大化时,得到最优模型参数;将测试集输入设有最优模型参数的CatBoost模型进行测试评估,得到构建好的基于蝴蝶优化与CatBoost肝脏疾病预测模型;将新获取到的肝脏疾病数据集输入构建好的预测模型进行预测,得到肝脏疾病预测结果。本发明能解决CatBoost模型对超参数的选择敏感的问题,达到最优的分类结果,从而提升模型预测准确性。
-
公开(公告)号:CN119377680A
公开(公告)日:2025-01-28
申请号:CN202411944990.4
申请日:2024-12-27
Applicant: 华侨大学
Inventor: 范宗文
IPC: G06F18/214 , G06N20/20 , G06N5/04 , G06Q10/04 , G06Q50/20 , G06F18/10 , G06F18/241 , G06F18/243
Abstract: 一种层次结构的成绩预测方法、装置、设备和介质,涉及大数据技术领域。这种成绩预测方法包含步骤S1至步骤S4。S1、获取训练数据,并进行清洗和预处理。其中,所述训练数据包含多个学生的多个特征数据。学生成绩被划分为多个成绩类别。S2、根据所述训练数据,构建包含多层二分类器的学生成绩预测模型。其中,依次连接的多层二分类器分别用于判断学生成绩是否属于学生分布由多到少排列的各个成绩类别。S3、根据所述训练数据采用交叉验证和网格搜索,分别训练所述学生成绩预测模型的每一层二分类器,得到训练后的学生成绩预测模型。S4、获取待预测的学生数据,并输入所述训练后的学生成绩预测模型,获取学生的预测成绩。
-
公开(公告)号:CN119646592B
公开(公告)日:2025-04-25
申请号:CN202510148439.7
申请日:2025-02-11
Applicant: 华侨大学
Abstract: 本发明提供了一种基于KFWAdaBoost的变压器故障检测方法、装置、设备及介质,涉及变压器技术领域,本方法通过结合特征生成技术和集成学习策略,利用KPP算法生成聚类特征,并通过分析样本与簇中心的关系来编码样本的分布模式。模型在分类过程中为每个样本生成加权软标签,利用软标签表达类别间的模糊性和相似性,有效提升数据集的信息表达能力。还通过多轮迭代调整样本权重,强化对难分类样本的学习,并结合投票机制输出最终分类结果。此外,生成的新数据集不仅限于KFWAdaBoost模型,而是可以广泛应用于各种分类器的训练,提高了数据的利用效率和诊断的准确性。
-
公开(公告)号:CN119598231A
公开(公告)日:2025-03-11
申请号:CN202510142384.9
申请日:2025-02-10
Applicant: 华侨大学
IPC: G06F18/2321 , G06F18/214 , G06Q10/04 , G06Q50/20
Abstract: 本发明提供的过采样多聚类融合的数据预测方法、装置、设备及介质,涉及数据预测领域。本发明通过获取原始数据集,进行预处理后,分为少数类数据和多数类数据;对少数类数据分别采用不同的聚类算法进行聚类,并将生成的聚类中心数据添加到少数类数据中;对添加聚类中心后的少数类数据进行IF‑SNNDPC聚类,并计算每个子簇的过采样数量;在每个子簇中,计算随机选择的两个非聚类中心的点与聚类中心之间的质心,并将质心作为新样本加入少数类数据中,直至满足对应子簇所需的样本数量,得到最终的少数类数据;将最终的少数类数据与多数类数据一起输入预先训练好的XGBoost模型,得到预测的数据。本发明能增加少数类别的样本数量,解决样本数据类别不平衡的问题。
-
公开(公告)号:CN119646592A
公开(公告)日:2025-03-18
申请号:CN202510148439.7
申请日:2025-02-11
Applicant: 华侨大学
Abstract: 本发明提供了一种基于KFWAdaBoost的变压器故障检测方法、装置、设备及介质,涉及变压器技术领域,本方法通过结合特征生成技术和集成学习策略,利用KPP算法生成聚类特征,并通过分析样本与簇中心的关系来编码样本的分布模式。模型在分类过程中为每个样本生成加权软标签,利用软标签表达类别间的模糊性和相似性,有效提升数据集的信息表达能力。还通过多轮迭代调整样本权重,强化对难分类样本的学习,并结合投票机制输出最终分类结果。此外,生成的新数据集不仅限于KFWAdaBoost模型,而是可以广泛应用于各种分类器的训练,提高了数据的利用效率和诊断的准确性。
-
公开(公告)号:CN105046346A
公开(公告)日:2015-11-11
申请号:CN201510342923.X
申请日:2015-06-19
Applicant: 华侨大学
Abstract: 本发明涉及一种利用最大相对误差最小多输入多输出支持向量回归机进行多种混凝土组分同时反预测方法。本发明在标准支持向量机的基础上进行改进,使用相对误差建立误差项来求解最优化问题。通过引入拉格朗日将一个有m个变量与k个约束条件的最优化问题转换为一个有m+k个变量的方程组的极值问题,其变量不受任何约束,通过拉格朗日乘子法及其对偶变换将原具有等式约束的最优化问题转换为新的最优化问题,之后使用KKT最优化条件进行求解。以RE-SVM为适应度函数,使用PSO进行参数寻优,最后,使用RE-SVM建立反预测模型,实现对多种混凝土组分同时反预测。本发明对混凝土部分组分的反预测时间效率高,预测结果精度高,实验结果基本满足工程中的精度要求。
-
-
-
-
-