基于Stacking多模型融合设计的空气污染物缺失值补充方法

    公开(公告)号:CN114611706A

    公开(公告)日:2022-06-10

    申请号:CN202210155739.4

    申请日:2022-02-21

    Applicant: 河南大学

    Abstract: 本发明提供一种基于Stacking多模型融合设计的空气污染物缺失值补充方法。该方法包括:获取各个国控站点监测的空气污染物数据和地理数据;针对每个国控站点,遍历其上的所有空气污染物数据,找到缺失值,并将缺失值所在位置处的数值补充为0;再次遍历其上的所有空气污染物数据,将数值非0的数据加入至训练集中,将数值为0的数据加入预测集中;将所有国控站点的训练集和预测集分别组合在一起,记作数据集Air‑data;使用Hyperopt分别对ET、RF、GBDT、XGBOOST和LGBM进行参数优化;将上述优化后的五种模型分别作为五个基学习器,将岭回归模型作为元学习器,基于数据集Air‑data对基学习器和元学习器进行融合得到Stacking集成模型;采用Stacking集成模型实现对空气污染物数据中的缺失值的估算。

    基于Stacking多模型融合设计的空气污染物缺失值补充方法

    公开(公告)号:CN114611706B

    公开(公告)日:2023-04-25

    申请号:CN202210155739.4

    申请日:2022-02-21

    Applicant: 河南大学

    Abstract: 本发明提供一种基于Stacking多模型融合设计的空气污染物缺失值补充方法。该方法包括:获取各个国控站点监测的空气污染物数据和地理数据;针对每个国控站点,遍历其上的所有空气污染物数据,找到缺失值,并将缺失值所在位置处的数值补充为0;再次遍历其上的所有空气污染物数据,将数值非0的数据加入至训练集中,将数值为0的数据加入预测集中;将所有国控站点的训练集和预测集分别组合在一起,记作数据集Air‑data;使用Hyperopt分别对ET、RF、GBDT、XGBOOST和LGBM进行参数优化;将上述优化后的五种模型分别作为五个基学习器,将岭回归模型作为元学习器,基于数据集Air‑data对基学习器和元学习器进行融合得到Stacking集成模型;采用Stacking集成模型实现对空气污染物数据中的缺失值的估算。

Patent Agency Ranking