-
公开(公告)号:CN116089701A
公开(公告)日:2023-05-09
申请号:CN202211478596.7
申请日:2022-11-17
Applicant: 国家电网有限公司大数据中心 , 北京中电普华信息技术有限公司
IPC: G06F16/9535 , G06F16/335 , G06F16/36 , G06F40/216 , G06F40/30
Abstract: 本申请公开了一种个性化推荐方法及装置,具体涉及互联网技术领域。本申请具体包括:先从目标对象文本浏览记录中提取关键词,并将关键词作为第一关键词,再确定第一关键词在预设语义树中对应的节点位置,其中,预设语义树由若干个节点和各个节点之间的链接组成,一个节点对应着一个词语,各个节点之间的链接标识着词语间的关系,接着根据第一关键词对应的节点位置和预设语义树选取至少一个第二关键词,最后根据至少一个第二关键词向目标对象推荐文本,这样,将关键词进行语义拓展,并根据原关键词以及语义拓展后得到的词语对用户进行个性化推荐,进而,推荐的内容更容易满足用户偏好,提高了用户对个性化推荐的满意度。
-
公开(公告)号:CN119226529A
公开(公告)日:2024-12-31
申请号:CN202411288306.1
申请日:2024-09-14
Applicant: 国家电网有限公司大数据中心
IPC: G06F16/36 , G06F16/332 , G06F40/295 , G06F40/16 , G06F40/30 , G06N5/04
Abstract: 本发明提供了一种大模型与知识图谱融合方法、应用方法及系统,该方法通过对获取的知识图谱进行知识图谱嵌入生成知识图谱嵌入信息,进而基于知识图谱嵌入信息生成自然语言问句,并将该知识图谱嵌入信息以及自然语言问句输入实体关系学习模型,输出自然语言问句对应的实体表示以及关系表示,进而基于该自然语言问句、实体表示、关系表示提取自然语言问句对应的子图,进一句将子图转换为自然语言,再结合实体关系学习模型以及知识图谱嵌入信息融入大模型,生成目标推理模型,实现知识图谱与大模型的融合。使得模型能够抽取关键信息并进行深入理解与推理,增强了模型在处理复杂问题时的推理能力,进一步提高模型后续输出内容的清晰度和可解释性。
-
公开(公告)号:CN117332147A
公开(公告)日:2024-01-02
申请号:CN202311271573.3
申请日:2023-09-28
Applicant: 国家电网有限公司大数据中心
IPC: G06F16/9535 , G06F21/62 , G06F18/214
Abstract: 本发明涉及人工智能技术领域,具体提供了一种用于用户检索的隐私保护方法及装置,包括:获取用户检索特征信息对应的向量信息;将用户检索特征信息对应的向量信息作为多个预先构建的隐私判断模型,得到多个预先构建的隐私判断模型输出的判断结果;采用权重投票的方式在多个预先构建的隐私判断模型输出的判断结果选择最终判断结果。本发明提供的技术方案,采用训练多个模型投票的方式进行训练,通过多个模型提高模型泛化能力,还可以提升预测精度。
-
公开(公告)号:CN116502646A
公开(公告)日:2023-07-28
申请号:CN202310224345.4
申请日:2023-03-09
Applicant: 国家电网有限公司大数据中心
IPC: G06F40/30 , G06F40/279 , G06F16/28 , G06F18/2415 , G06F18/22 , G06N3/04 , G06N3/047 , G06N3/0499 , G06N3/0442 , G06N3/08 , G06N5/02 , G06Q50/06
Abstract: 本发明公开了一种语义漂移检测方法、装置、电子设备及存储介质。其中,该语义漂移检测方法,包括:获取待识别文本数据;根据预设知识抽取框架获取所述待识别文本数据中实体文本的实体类型以及实体关系,其中,所述知识抽取框架包括实体抽取框架和实体关系抽取框架;基于预设语义漂移检测模型对所述实体类型以及所述实体关系进行语义漂移检测,确定语义漂移情况,其中,所述预设语义漂移检测模型基于标记电力数据集、电力种子集以及未标记电力数据训练生成。本发明实施例,实现便捷检测电力领域数据的语义漂移情况,降低人工检测的成本,进而可以剔除低质量的数据,构建高质量电力领域知识图谱。
-
公开(公告)号:CN115878662A
公开(公告)日:2023-03-31
申请号:CN202211358681.X
申请日:2022-11-01
Applicant: 国家电网有限公司大数据中心
IPC: G06F16/2452 , G06F16/242 , G06N3/044 , G06N3/0455 , G06N3/047 , G06N3/08 , G06F40/216 , G06F40/284
Abstract: 本发明实施例公开了一种语句生成方法、装置、电子设备及介质。方法包括:确定至少一个向量对、各向量对对应的第一联合概率密度、至少一个聚合运算符、至少一个列和聚合列;基于至少一个向量对和各向量对的第一联合概率密度确定目标向量对;基于至少一个聚合运算符、至少一个列、聚合列和双向递归神经网络,确定目标兼容对;基于各目标向量对、各目标兼容对和预设SQL查询语句框架生成目标SQL查询语句。该方法通过所得到的向量对、向量对对应的第一联合概率密度、聚合运算符、列和聚合列确定关联关系较高的目标兼容对和目标向量对,再结合预设SQL查询语句框架可得到准确可执行的SQL查询语句,提高了SQL查询语句生成的准确性。
-
公开(公告)号:CN114020919A
公开(公告)日:2022-02-08
申请号:CN202111395009.3
申请日:2021-11-23
Applicant: 国家电网有限公司大数据中心
IPC: G06F16/35 , G06F16/2452 , G06F16/242
Abstract: 本发明公开了一种数据处理方法、装置、设备和存储介质。该方法包括:对预先构建的训练样本集中的所有训练样本进行无监督自动聚类,得到至少两个类别的训练样本子集;基于预先创建的错误样本修正模型,自动对每个所述训练样本子集中的所有错误样本进行在线修正标注,得到对应的修正样本。本实施例通过对预先创建的训练样本集中的所有训练样本进行无监督自动聚类,得到至少两个类别的训练样本子集,并基于预先创建的错误样本修正模型,自动对每个训练样本子集中的所有错误样本进行在线修正和标注,得到对应的修正样本,实现了在线自动修正和标注错误样本的效果,从而提高了错误样本的修正效率。
-
公开(公告)号:CN113495900A
公开(公告)日:2021-10-12
申请号:CN202110933193.6
申请日:2021-08-12
Applicant: 国家电网有限公司大数据中心
IPC: G06F16/2452 , G06F40/284
Abstract: 本发明实施例公开了基于自然语言的结构化查询语言语句获取方法、装置、电子设备及存储介质,该方法包括:获取自然语言下的查询文本,并确定查询文本的查询类别;获取查询文本中的命名实体,并确定命名实体的实体类别;根据查询文本的查询类别,以及命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,以获取第一填充结果;根据第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。本发明实施例提供的技术方案,实现了基于自然语言构建SQL查询语句,提升了用户对SQL数据库的访问便利性,提高了SQL查询语句的转换精度。
-
公开(公告)号:CN119942104A
公开(公告)日:2025-05-06
申请号:CN202411853196.9
申请日:2024-12-16
Applicant: 国家电网有限公司大数据中心 , 国网信息通信产业集团有限公司 , 国网浙江省电力有限公司信息通信分公司
Inventor: 闫华光 , 刘识 , 陈振宇 , 黄晓光 , 郭庆 , 薛濛 , 杜建光 , 李杏 , 廖小琦 , 李继伟 , 沈潋 , 朱天佑 , 杨诗语 , 朱彤 , 冯珺 , 沈潇军 , 赵帅 , 彭梁英 , 潘司晨
Abstract: 本发明实施例提供电力设备图像的增广方法、系统和计算机可读存储介质,属于电力设备图像处理领域。所述增广方法包括:获取关于电力设备的图像;对所述图像进行分割,以将所述图像中的主体目标物从背景中分离出来;获取经过分割后的图像,并将分割后的图像进行编码处理;将经过编码处理的所述图像输入到Stable Diffusion模块中,以得到完整有序清晰的电力设备图像;对所述电力设备图像进行身份特征提取;对所述电力设备图像进行细节特征提取,以提高所述电力设备图像的质量和分辨率;将所述电力设备图像和原始图像的剩余部分融合,以得到完整的关于电力设备的清晰的图像。该增广方法可以针对电力业务场景实现样本增广。
-
公开(公告)号:CN119888272A
公开(公告)日:2025-04-25
申请号:CN202411622645.9
申请日:2024-11-14
Applicant: 国家电网有限公司大数据中心
IPC: G06V10/74 , G06N3/045 , G06V10/82 , G06V10/80 , G06N3/0464
Abstract: 本发明提供了基于稀疏注意力机制的电力图像冗余处理方法及系统,包括:获取电力图像数据集中每个电力图像的序列化嵌入式向量;将每个所述电力图像的序列化嵌入式向量输入稀疏注意力机制的Transformer模型,得到每个所述电力图像的融合特征向量;基于每个所述电力图像的融合特征向量,计算每两个电力图像之间的相似度;根据所述每两个电力图像之间的相似度,确定所述电力图像数据集的冗余图像并进行处理;通过稀疏注意力机制的Transformer模型提取电力图像的融合特征向量,能够保留电力图像中的重要信息,去除干扰性元素,进而通过融合特征向量计算电力图像之间的相似度,实现了对图像冗余问题的自动化处理。
-
公开(公告)号:CN117609460A
公开(公告)日:2024-02-27
申请号:CN202311615794.8
申请日:2023-11-29
Applicant: 国家电网有限公司大数据中心
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F18/22 , G06F40/35
Abstract: 本发明涉及人工智能技术领域,具体提供了一种基于关键词语义分解的智能问答方法及装置,包括:将用户问句输入至预先训练的关键词抽取模型,得到预先训练的关键词抽取模型输出的关键词;在文本信息索引库中获取关键词对应的召回答案;将关键词及其对应的各召回答案分别组成问答对并作为预先训练的相似度识别模型的输入,得到预先训练的相似度识别模型输出的关键词与其对应的各召回答案之间的相似度,选取相似度大于预设值的召回答案作为关键词的答案;将用户问句和关键词的答案作为自动总结分析模型的输入,得到自动总结分析模型输出的用户问句回答结果。本发明提供的技术方案,能够使用户的问句可以实现问句关键词语义切分,同时保证召回效果。
-
-
-
-
-
-
-
-
-