-
公开(公告)号:CN119851769A
公开(公告)日:2025-04-18
申请号:CN202510027006.6
申请日:2025-01-08
Applicant: 天津城建大学
IPC: G16B40/00 , G16B45/00 , G16C20/10 , G16B40/10 , G16C20/70 , G16C20/80 , G16C20/30 , G06N20/00 , G06N3/0985
Abstract: 本发明涉及一种基于自动机器学习预测河流氮代谢基因丰度及其关键影响因素的方法。包括:采集河流水样检测水质理化指标,并进行宏基因组测序获取氮代谢基因丰度;以常规水质理化指标为解释变量,以氮代谢基因丰度为目标变量,采用自动机器学习构建模型,并通过均方误差(MSE)和拟合系数(R²)评估模型性能,选择最优算法进行预测;模型通过SHAP value图分析各水质指标的相对贡献,并利用部分依赖图(PDP)揭示各水质指标与基因丰度之间的关系。本发明在预测氮代谢基因丰度方面展现出高精度和良好的泛化性能,适用于描述河流水体的氮动态过程。模型事后可解释分析量化不同水质指标对氮代谢基因的影响,为河流水质管理和氮代谢优化调控提供科学依据。