-
公开(公告)号:CN109800310A
公开(公告)日:2019-05-24
申请号:CN201811465625.X
申请日:2018-12-03
Applicant: 国网浙江省电力有限公司杭州供电公司 , 天津市普迅电力信息技术有限公司 , 国网信息通信产业集团有限公司
Inventor: 祝春捷 , 夏霖 , 潘坚跃 , 陈超 , 孔晓杭 , 泮莉莎 , 施婧 , 李雅 , 雷云 , 陈晨 , 陈文康 , 王汝英 , 李欣荣 , 赵光俊 , 周航帆 , 魏伟 , 边立云 , 刘畅 , 李艳
Abstract: 一种基于结构化表达的电力运维文本分析方法,包括如下步骤:①通过采集电力运维日志并加入维基百科的开源中文语料库构建电力运维语料数据库,同时对所构建的语料数据库进行预处理;②基于所构建的电力运维语料库,针对这种中文记录文档特征设计基于拼音统计的词向量;③采用CBOW模型网络架构生成中文词表示向量;④采用基于Bi-LSTM字符级提取方法识别实体关键词⑤对于所提取的实体关键词,构建多维特征语义槽结构;⑥提取影响事故发生的多类特征的类内和类间的关系。该方法可对庞大且冗杂的企业级文本数据资产实现对其进行统一管理,通过数据分析并高效获取相关设备网点运营状况,发现潜在的危险和隐患,在第一时间能够对异常事件做出响应。
-
公开(公告)号:CN109815476B
公开(公告)日:2023-03-24
申请号:CN201811465623.0
申请日:2018-12-03
Applicant: 国网浙江省电力有限公司杭州供电公司 , 天津市普迅电力信息技术有限公司 , 国网信息通信产业集团有限公司
IPC: G06F40/30 , G06F40/284 , G06N3/0464 , G06N3/08
Abstract: 一种基于中文语素和拼音联合统计的词向量表示方法,包括如下步骤:①采集互联网文本信息构建语料库,对构建的语料库进行正文清洗和分词处理;②对中文语料进行分词处理后转为不保留声调信息的拼音信息,然后分别对语素和拼音特征在训练集语料和全文档中统计词频和逆文档概率作统计权重TFc、IDFc、TFp和IDFp;③基于上下文语素和拼音联合统计的中文词表示模型,构造中文单个语素表示向量;④在步骤③的基础上训练一个三层神经网络以用于中心目标词的预测。该方法可满足离线词典和语料数据规模的适应性、可直接学习大规模无标注的互联网信息文本数据、可提高常规的词嵌入模型对于中文语言差异特性的兼顾性、可提高对错别字词语的表示和识别准确性。
-
公开(公告)号:CN109800310B
公开(公告)日:2021-11-09
申请号:CN201811465625.X
申请日:2018-12-03
Applicant: 国网浙江省电力有限公司杭州供电公司 , 天津市普迅电力信息技术有限公司 , 国网信息通信产业集团有限公司
Inventor: 祝春捷 , 夏霖 , 潘坚跃 , 陈超 , 孔晓杭 , 泮莉莎 , 施婧 , 李雅 , 雷云 , 陈晨 , 陈文康 , 王汝英 , 李欣荣 , 赵光俊 , 周航帆 , 魏伟 , 边立云 , 刘畅 , 李艳
IPC: G06F16/36 , G06F16/35 , G06F40/289 , G06F40/216 , G06F40/30
Abstract: 一种基于结构化表达的电力运维文本分析方法,包括如下步骤:①通过采集电力运维日志并加入维基百科的开源中文语料库构建电力运维语料数据库,同时对所构建的语料数据库进行预处理;②基于所构建的电力运维语料库,针对这种中文记录文档特征设计基于拼音统计的词向量;③采用CBOW模型网络架构生成中文词表示向量;④采用基于Bi‑LSTM字符级提取方法识别实体关键词⑤对于所提取的实体关键词,构建多维特征语义槽结构;⑥提取影响事故发生的多类特征的类内和类间的关系。该方法可对庞大且冗杂的企业级文本数据资产实现对其进行统一管理,通过数据分析并高效获取相关设备网点运营状况,发现潜在的危险和隐患,在第一时间能够对异常事件做出响应。
-
公开(公告)号:CN109815476A
公开(公告)日:2019-05-28
申请号:CN201811465623.0
申请日:2018-12-03
Applicant: 国网浙江省电力有限公司杭州供电公司 , 天津市普迅电力信息技术有限公司 , 国网信息通信产业集团有限公司
Abstract: 一种基于中文语素和拼音联合统计的词向量表示方法,包括如下步骤:①采集互联网文本信息构建语料库,对构建的语料库进行正文清洗和分词处理;②对中文语料进行分词处理后转为不保留声调信息的拼音信息,然后分别对语素和拼音特征在训练集语料和全文档中统计词频和逆文档概率作统计权重TFc、IDFc、TFp和IDFp;③基于上下文语素和拼音联合统计的中文词表示模型,构造中文单个语素表示向量;④在步骤③的基础上训练一个三层神经网络以用于中心目标词的预测。该方法可满足离线词典和语料数据规模的适应性、可直接学习大规模无标注的互联网信息文本数据、可提高常规的词嵌入模型对于中文语言差异特性的兼顾性、可提高对错别字词语的表示和识别准确性。
-
公开(公告)号:CN109783637A
公开(公告)日:2019-05-21
申请号:CN201811518919.4
申请日:2018-12-12
Applicant: 国网浙江省电力有限公司杭州供电公司 , 浙江华云信息科技有限公司
Abstract: 本发明提供了基于深度神经网络的电力检修文本挖掘方法,包括获取由电力服务热线服务系统生成的电力检修文本;对获取到的电力检修文本进行由文本数据向数值型数据转换的处理;对处理后的数据进行基于神经网络的语义分类,得到表明具体需求的分类结果。通过引入通用的大规模预训练词向量,并没有因为专业词语覆盖度降低而影响分类效果,反而使得分类准确率大幅提升。这说明大规模外部词向量的引入,对提升电力行业复杂文本挖掘任务的效果有重要意义。
-
公开(公告)号:CN110738349B
公开(公告)日:2023-07-11
申请号:CN201910837763.4
申请日:2019-09-05
Applicant: 国网浙江省电力有限公司杭州供电公司
Abstract: 本发明提出了基于多模型融合的电网故障抢修时长预测方法,包括在故障抢修时长的预测前,对输入的特征数据进行清洗,排除异常数据;使用清洗后的数据进行特征工程建设,选取特征数据,将特征数据分别输入到预测模型中进行建模;在建模的过程中,分别对单个模型参数进行调优,输出最优的预测结果;对预测结果进行加权求和,输出最终的预测值。通过使用多种机器学习方法进行建模,并将预测结果进行加权,融合多模型的优势特点,得到相较于单模型更为准确的预测结果。可以较为准确地对故障抢修时长进行预估,为电网故障抢修的自动化和智能化提供更好地支撑。
-
公开(公告)号:CN111882173A
公开(公告)日:2020-11-03
申请号:CN202010646733.8
申请日:2020-07-07
Applicant: 国网浙江省电力有限公司杭州供电公司
Abstract: 本发明公开了一种基于气象信息的电网静态安全风险评估系统及评估方法,解决了现有技术的不足,系统包括电网气象信息集成模块,用于收集气象信息、地理信息以及电网设备基础信息,并将气象信息、地理信息以及电网设备基础信息发送至气象风险评估及预警模块;气象风险评估及预警模块,用于对气象信息、地理信息以及电网设备基础信息进行综合分析,判断电网设备是否具有安全风险,并将分析结果发送至气象风险预警可视化模块;气象风险预警可视化模块,用于将气象风险评估及预警模块的分析结果进行显示。
-
公开(公告)号:CN112507006A
公开(公告)日:2021-03-16
申请号:CN202011173851.8
申请日:2020-10-28
Applicant: 国网浙江省电力有限公司杭州供电公司
Abstract: 本申请实施例提出了基于云端的电网企业运行数据整合系统,包括数据接入层:用于将各类异构数据从数据源层抽取、转换、同步到上层;数据治理层:用于通过包括元数据管理、数据字典与主数据管理、数据质量管理在内的方式实现企业数据管控;数据模型层:用于将全域数据的基础表按主题归类,形成全业务基础模型;通用分析模型层:用于为优质客户的增值业务场景、金融机构贷款授信场景提供数据服务;数据服务层:用于提供数据服务化工具和高可用服务响应能力。通过重新定义多层数据模型的具体内容以及应用功能,从数据抽取、主体归类等多方面对数据处理过程进行限定,从而于提升对数据的处理效率。
-
公开(公告)号:CN111898650A
公开(公告)日:2020-11-06
申请号:CN202010650325.X
申请日:2020-07-08
Applicant: 国网浙江省电力有限公司杭州供电公司
IPC: G06K9/62 , G06F16/215 , G06N3/04 , G06N3/08 , G06Q50/06
Abstract: 本发明公开了一种基于深度学习的营配用数据自动聚类分析设备及方法,解决了现有技术的不足,方法包括预训练方法和微调方法,预训练方法首先将营配用数据输入预训练模块,然后预训练模块通过对营配用数据进行预训练构成预训练模型,微调方法首先读取预训练模型,然后加载营配用数据通过多次微调优化预训练模型构成最后自动聚类分析模型。
-
公开(公告)号:CN110738349A
公开(公告)日:2020-01-31
申请号:CN201910837763.4
申请日:2019-09-05
Applicant: 国网浙江省电力有限公司杭州供电公司
Abstract: 本发明提出了基于多模型融合的电网故障抢修时长预测方法,包括在故障抢修时长的预测前,对输入的特征数据进行清洗,排除异常数据;使用清洗后的数据进行特征工程建设,选取特征数据,将特征数据分别输入到预测模型中进行建模;在建模的过程中,分别对单个模型参数进行调优,输出最优的预测结果;对预测结果进行加权求和,输出最终的预测值。通过使用多种机器学习方法进行建模,并将预测结果进行加权,融合多模型的优势特点,得到相较于单模型更为准确的预测结果。可以较为准确地对故障抢修时长进行预估,为电网故障抢修的自动化和智能化提供更好地支撑。
-
-
-
-
-
-
-
-
-