-
公开(公告)号:CN118520378B
公开(公告)日:2024-11-08
申请号:CN202410985098.4
申请日:2024-07-23
Applicant: 国网山东省电力公司信息通信公司 , 国网智能电网研究院有限公司
Inventor: 孙岗 , 田鹏 , 严莉 , 曲延盛 , 王晓慧 , 刘同阳 , 张强 , 呼海林 , 牛德玲 , 杨坤 , 肖沈阳 , 朱尤祥 , 李明 , 李宁 , 张金国 , 胡斌浩 , 王雨晨 , 刘保臣 , 孟祥鹿
IPC: G06F18/243 , G06F18/214 , G06N20/20 , G06N5/01
Abstract: 本发明提供了一种基于集成学习的电力数据分类分级方法及系统,涉及电力数据处理技术领域,该方法包括:结合预处理模型进行源端电力数据的预处理,确定电力数据集;遍历电力数据集筛选关键特征,以特征稳定度与普适度为基准进行特征转换,确定有效数据特征;基于有效数据特征与电力数据集训练数据分类器,基于数据分级规则训练数据分级器,构成数据划分模型;结合数据划分模型执行横向分类与纵向分级处理,确定数据划分结果。通过本发明可以解决由于电力数据的多样性和复杂性,现有技术无法对其进行精准划分,导致数据分类分级精准性不足的技术问题,可以提高电力数据分类分级的精细度和准确性,达到提高数据管理效率和处理质量的技术效果。
-
公开(公告)号:CN118520378A
公开(公告)日:2024-08-20
申请号:CN202410985098.4
申请日:2024-07-23
Applicant: 国网山东省电力公司信息通信公司 , 国网智能电网研究院有限公司
Inventor: 孙岗 , 田鹏 , 严莉 , 曲延盛 , 王晓慧 , 刘同阳 , 张强 , 呼海林 , 牛德玲 , 杨坤 , 肖沈阳 , 朱尤祥 , 李明 , 李宁 , 张金国 , 胡斌浩 , 王雨晨 , 刘保臣 , 孟祥鹿
IPC: G06F18/243 , G06F18/214 , G06N20/20 , G06N5/01
Abstract: 本发明提供了一种基于集成学习的电力数据分类分级方法及系统,涉及电力数据处理技术领域,该方法包括:结合预处理模型进行源端电力数据的预处理,确定电力数据集;遍历电力数据集筛选关键特征,以特征稳定度与普适度为基准进行特征转换,确定有效数据特征;基于有效数据特征与电力数据集训练数据分类器,基于数据分级规则训练数据分级器,构成数据划分模型;结合数据划分模型执行横向分类与纵向分级处理,确定数据划分结果。通过本发明可以解决由于电力数据的多样性和复杂性,现有技术无法对其进行精准划分,导致数据分类分级精准性不足的技术问题,可以提高电力数据分类分级的精细度和准确性,达到提高数据管理效率和处理质量的技术效果。
-
公开(公告)号:CN119131826A
公开(公告)日:2024-12-13
申请号:CN202411185184.3
申请日:2024-08-27
Applicant: 国网智能电网研究院有限公司 , 中国电力科学研究院有限公司
IPC: G06V30/416 , G06V30/412 , G06V30/14 , G06V30/19 , G06V10/82 , G06N3/0455 , G06Q50/06 , G06V30/146 , G06V30/148 , G06V30/18 , G06N3/0464
Abstract: 本发明公开一种电力知识图片内容提取方法和系统,属于电力知识提取技术领域,方法包括:获取电力知识图片;采用预先训练的电力领域内容提取模型将所述电力知识图片识别成文字信息;通过数据质量判别器对所述文字信息进行质量判断,若质量判别为优,则输出对应的格式化信息,否则将所述文字信息通过电力专家标注成对应的格式化信息。该方法的电力领域内容提取模型能快速的识别文字信息,并通过数据质量判别器对所述文字信息进行质量判断,准确性更高,处理效率更高。
-
公开(公告)号:CN117611133A
公开(公告)日:2024-02-27
申请号:CN202311589328.7
申请日:2023-11-27
Applicant: 国网安徽省电力有限公司电力科学研究院 , 国网智能电网研究院有限公司
IPC: G06Q10/20 , G06Q50/06 , G06N3/0455 , G06N3/0499 , G06N3/08
Abstract: 本发明提供基于电力运检业务的大模型推理加速方法及系统,方法包括:多任务请求的调度,该调度将多个请求拼成一个输入作为整体网络的输入,在生成式对话中,可以做到一次回答多个请求问题;GPT网络,包括:Transformer Attention和Feed Forward Network组成,在预训练电力设备运检业务模型的一次解码Decode后的解码过程中,采用CUDA算子调用所述kv_cache,以调整kv_cache的形状,据以处理得到重构GPT网络模型;利用贪心算法将GPT模型的输出转化为一个token或者一个字。本发明解决了管理操作工作量大、电力设备运检业务信息总结不便以及维护成本高的技术问题。
-
公开(公告)号:CN119647574A
公开(公告)日:2025-03-18
申请号:CN202411704195.8
申请日:2024-11-26
Applicant: 中国电力科学研究院有限公司 , 国网智能电网研究院有限公司 , 国网山东省电力公司电力科学研究院 , 国家电网有限公司
Abstract: 本发明属于电力设备运检技术领域,公开了一种面向多模态数据的电力设备运检知识抽取方法及相关装置;其中,所述电力设备运检知识抽取方法包括:获取待知识抽取的电力设备运检多模态数据;将电力设备运检多模态数据输入电力设备多模态抽取网络模型进行知识抽取,获得电力设备运检知识;其中,电力设备运检多模态数据包括电力设备运检记录中指定实体和关系类型的文本记录信息和图像记录信息;电力设备多模态抽取网络模型包括预训练语言模型、视觉自注意力模型、多模态特征融合模块以及实体关系抽取网络。本发明技术方案,实现了图像信息与文本信息的相互补充,能够提高电力设备运检知识抽取的准确性。
-
公开(公告)号:CN116756573B
公开(公告)日:2024-01-16
申请号:CN202311026963.4
申请日:2023-08-16
Applicant: 国网智能电网研究院有限公司 , 国网江苏省电力有限公司 , 国家电网有限公司
IPC: G06F18/214 , G06F18/2431 , G06F18/2413 , G06N3/0455 , G06N3/08 , G06N5/022
Abstract: 本申请提供一种负例采样方法、训练方法、缺陷定级方法、装置和系统,通过自采样负样例训练语言模型,并使用该语言模型对标准缺陷进行编码并离线存储于知识库。当收到用户的缺陷描述后,利用该语言模型进行缺陷编码,并引入额外阈值控制模型将缺陷编码与知识库存储的标准缺陷编码进行对比,得到标准缺陷描述和缺陷等级。本申请解决了模型训练需要大规模标注数据的问题,同时由于引入阈值控制模型良好的兼容了缺陷描述字段缺失等问题,增加模型的鲁棒性,返回用户需要的准确答案;同时缺陷定级均来自于知识库中的标准,模型返回缺陷等级时,可同时返回对应的规定条款以及答案置信度,可辅助用户判断设备缺陷等级,实现了缺陷描述和缺陷定级可溯源。
-
公开(公告)号:CN115129826B
公开(公告)日:2022-11-22
申请号:CN202211060951.9
申请日:2022-09-01
Applicant: 国网智能电网研究院有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06K9/62
Abstract: 本发明公开了一种电力领域模型预训练方法、精调方法、装置及设备,其中,所述预训练方法包括:获取原始电力语料数据;对所述原始电力语料数据进行处理,所述处理至少包括分词处理;对处理后得到的电力语料数据,采用全词遮蔽的方法,构建电力领域模型的预训练语料;构建电力领域模型,所述电力领域模型包括注意力矩阵,所述注意力矩阵引入了词与词之间的相对位置编码;利用所述预训练语料,对所述电力领域模型进行预训练。本发明提供的技术方案,能够提升预训练模型的迁移能力。
-
公开(公告)号:CN115129826A
公开(公告)日:2022-09-30
申请号:CN202211060951.9
申请日:2022-09-01
Applicant: 国网智能电网研究院有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06K9/62
Abstract: 本发明公开了一种电力领域模型预训练方法、精调方法、装置及设备,其中,所述预训练方法包括:获取原始电力语料数据;对所述原始电力语料数据进行处理,所述处理至少包括分词处理;对处理后得到的电力语料数据,采用全词遮蔽的方法,构建电力领域模型的预训练语料;构建电力领域模型,所述电力领域模型包括注意力矩阵,所述注意力矩阵引入了词与词之间的相对位置编码;利用所述预训练语料,对所述电力领域模型进行预训练。本发明提供的技术方案,能够提升预训练模型的迁移能力。
-
公开(公告)号:CN119106664A
公开(公告)日:2024-12-10
申请号:CN202411108350.X
申请日:2024-08-13
Applicant: 国网智能电网研究院有限公司
IPC: G06F40/16 , G06F40/30 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本发明属于人工智能领域,公开了一种语义大模型增量预训练方法及相关装置,包括:获取专业领域增量训练样本、语义大模型和语义大模型预训练样本;将语义大模型作为生成器和判别器构建对抗生成网络,并基于专业领域增量训练样本和语义大模型预训练样本训练对抗生成网络;获取训练后的对抗生成网络中的生成器,得到专业领域增量预训练大模型。可有效避免语义大模型在拟合专业领域增量训练样本时发生灾难性遗忘的风险,也有效避免了模型崩溃问题。可以在专业领域的数据基础上使用较小的算力、样本和时间成本完成增量训练,可借助语义大模型本身的理解能力,更好地学习和适应专业领域的专业术语、知识结构和业务逻辑,提高在专业领域的应用效果。
-
公开(公告)号:CN119067233A
公开(公告)日:2024-12-03
申请号:CN202411034052.0
申请日:2024-07-30
Applicant: 国网智能电网研究院有限公司
IPC: G06N20/00 , G06F18/214 , G06F18/241 , G06F16/35
Abstract: 本发明属于机器学习技术领域,公开了一种专业领域文本大模型的多阶段预训练方法及相关装置;其中,所述多阶段预训练方法包括:基于获取的全量数据,采用混合随机采样的方式对待预训练的文本大模型进行预设轮次的训练,获得一次训练后的文本大模型;对全量数据进行分批次采样,并计算获得各批次采样数据对应的交叉熵损失,基于各批次采样数据对应的交叉熵损失对全量数据进行难度分类,获得各个预设难度等级的预训练数据集;基于各个预设难度等级的预训练数据集,对一次训练后的文本大模型进行由易到难的分阶段预训练,获得多阶段预训练后的专业领域文本大模型。本发明技术方案训练获得的文本大模型具有更好的测试结果以及更好的模型鲁棒性。
-
-
-
-
-
-
-
-
-