-
公开(公告)号:CN108830510A
公开(公告)日:2018-11-16
申请号:CN201810793396.8
申请日:2018-07-16
Applicant: 国网上海市电力公司
Abstract: 本发明公开了一种基于数理统计的电力数据预处理方法,包括原始数据集输入步骤、抽取数据步骤、负值与空值筛查步骤、异常大值筛查步骤、数据初步预分类步骤和标签添加步骤。本发明的基于数理统计的电力数据预处理方法,将数理统计中的四分位数检测和标准分数检测方法结合在一起,可以帮助电网工作人员提高审查原始异常数据的效率,优化原始数据集的数据质量。
-
公开(公告)号:CN108830510B
公开(公告)日:2021-09-21
申请号:CN201810793396.8
申请日:2018-07-16
Applicant: 国网上海市电力公司
Abstract: 本发明公开了一种基于数理统计的电力数据预处理方法,包括原始数据集输入步骤、抽取数据步骤、负值与空值筛查步骤、异常大值筛查步骤、数据初步预分类步骤和标签添加步骤。本发明的基于数理统计的电力数据预处理方法,将数理统计中的四分位数检测和标准分数检测方法结合在一起,可以帮助电网工作人员提高审查原始异常数据的效率,优化原始数据集的数据质量。
-
公开(公告)号:CN108985632A
公开(公告)日:2018-12-11
申请号:CN201810793660.8
申请日:2018-07-16
Applicant: 国网上海市电力公司
Abstract: 本发明公开了一种基于孤立森林算法的用电数据异常检测模型,包括特征提取模块、特征降维模块、孤立森林计算模块、构建专家样本模块和二次训练模块,特征提取模块从原始数据集中提取用户的用电数据的时间序列作为初始特征集,然后对初始特征集进行无量纲化和特征选择处理;特征降维模块采用主成分分析法和自编码网络法对初始特征集进行降维得到有效特征集;孤立森林计算模块采用孤立森林算法计算出每个用户的异常分数以判定用户数据有无异常。本发明的基于孤立森林算法的用电数据异常检测模型,是一种无监督的用电数据异常检测模型,不仅能够快速地处理大量的数据,而且能够适应缺乏训练样本的情况,能够更好地满足于电力部门的实践需求。
-
-