-
公开(公告)号:CN119026070A
公开(公告)日:2024-11-26
申请号:CN202410910249.X
申请日:2024-07-09
Applicant: 广东电网有限责任公司 , 广东电网有限责任公司信息中心
Abstract: 本发明公开了一种流批数据快速融合方法,包括流批一体化架构、流批统一接口、数据预处理和缓存、实时流数据窗口化、数据格式标准化、并行计算和分布式处理、实时流数据存储和实时流数据索引,所述流批一体化架构主要包括:先收集各种流批数据和批量处理数据,然后对该数据进行解析和格式化,然后通过流批一体化架构集成实时流数据处理和批量数据处理,通常包括实时计算引擎和批处理引擎。通过流批一体化架构,能够将实时流数据和批量数据快速融合,使得企业能够更快速地开展实时决策和应对突发事件,可以充分利用实时处理和批量处理的优势,根据不同的需求灵活分配资源,提高数据处理的效率和性能,使得数据分析更加全面。
-
公开(公告)号:CN118014611A
公开(公告)日:2024-05-10
申请号:CN202410048694.X
申请日:2024-01-12
Applicant: 广东电网有限责任公司 , 广东电网有限责任公司信息中心
IPC: G06Q30/0201 , G06Q50/06 , G06Q10/063
Abstract: 本发明公开了一种基于大数据技术的用户用电分析系统及方法,包括数据采集模块,配置为从源系统采集用户用电相关数据,所述源系统包括但不限于营销系统、资产系统、客服系统和财务系统;存储处理模块,配置为存储和处理大规模用户用电数据,其中数据量级达到千万级,原始存储12TB,每月增量500Gb;分析模型模块,配置为运用多种用户用电分析模型,基于规则和逻辑对用户进行分类判断;整个系统不仅响应了电力行业在数据处理和分析方面的需求,还为电力公司提供了一套全面的工具来优化电网运营和提升服务质量,同时为电力行业的数字化转型和可持续发展奠定了坚实的基础。
-
公开(公告)号:CN119201983A
公开(公告)日:2024-12-27
申请号:CN202411248114.8
申请日:2024-09-06
Applicant: 广东电网有限责任公司 , 广东电网有限责任公司信息中心
IPC: G06F16/2452 , G06F16/242 , G06N5/04
Abstract: 本发明公开了一种自然语言转SQL查询方法及系统,包括将数据库中的表名、列名向量化并存入向量数据库;利用LLM提取自然语言问题中的关键信息并在向量数据库中进行检索,返回与关键信息最相关的表名、列名和值;将自然语言问题输入训练集数据库,从中选择与自然语言问题相似的若干示例及其对应的SQL查询;将其与自然语言问题输入LLM中,输出候选SQL查询以及生成理由;基于候选SQL查询执行结果对其进行分组,将执行结果相同的候选SQL查询同组并根据数量降序,保留前N组中各组查询速度最快的候选SQL查询作为候选SQL列表输出;将其与自然语言问题输入LLM,从中选择最准确的SQL查询。本发明能更好地处理复杂和多变的自然语言查询,使查询结果更全面和准确。
-
公开(公告)号:CN119669269A
公开(公告)日:2025-03-21
申请号:CN202411829984.4
申请日:2024-12-11
Applicant: 广东电网有限责任公司 , 广东电网有限责任公司信息中心
IPC: G06F16/2452 , G06F18/22 , G06N3/0455 , G06N3/096
Abstract: 本发明公开了一种基于元数据无关表征学习的自然语言转数据库查询生成方法、系统及介质,所述方法包括:对训练数据预处理;构建查询编辑距离函数;采用查询编辑距离函数构建增强数据集,对预处理后的数据打上分数标签;采用增强数据集以及所述分数标签训练半非对称编码器模型;将问题输入到训练好的半非对称编码器模型,得到模型输出的问题‑SQL语句相嵌入的查询结构。本发明通过构建自然语言问题和SQL查询之间的共享嵌入空间,消除了对数据库元数据的依赖,提高了大模型的示例选择精度和跨领域表现,提升了大模型在自然语言问题转换为SQL查询(Text‑to‑SQL)任务中的示例选择能力和执行准确率。
-
公开(公告)号:CN117541195A
公开(公告)日:2024-02-09
申请号:CN202311805771.3
申请日:2023-12-25
Applicant: 广东电网有限责任公司 , 广东电网有限责任公司信息中心
IPC: G06Q10/10 , G06F18/10 , G06F18/20 , G06F18/2135
Abstract: 本申请公开了一种审计项目智能管理方法及系统。首先获取目标审计项目的审计计划数据,通过推荐模型得到审计计划推荐结果;与审计数据库进行关联,确定与目标审计项目的关联信息;然后将各类审计工具进行集成得到融合应用;对目标审计项目的关联信息进行处理,生成目标审计报告;最后基于目标审计报告确定整改问题,并将整改问题分配给关联用户。本申请实现了审计计划智能推荐、审前资料推送、智能审计工具库和智能生成审计报告等功能,提高了审计效率和质量。
-
公开(公告)号:CN119669265A
公开(公告)日:2025-03-21
申请号:CN202411835115.2
申请日:2024-12-13
Applicant: 广东电网有限责任公司 , 广东电网有限责任公司信息中心
IPC: G06F16/242 , G06F16/2455 , G06F16/2452 , G06F16/2457 , G06F40/30 , G06F18/22 , G06N3/0455
Abstract: 本发明公开了一种基于上下文学习的数据库查询生成方法、系统及存储介质,所述方法包括从自然语言查询中提取关键词和短语,在数据库中检索与关键词相似的值,并返回与各关键词最相关的值及其对应的列,并且检索数据库目录中与关键词和短语相关的描述信息;针对各关键词最相关的值及其对应的列进行模式选择,包括:筛除与自然语言查询不相关的列,并进一步选择生成SQL查询所必需的表,最终将模式缩减到生成SQL查询所必需的最小列集;通过数据库模式、自然语言查询、生成的候选SQL查询及其执行结果,修正方法模型的逻辑和语法错误。本发明通过智能理解数据上下文和查询需求,生成高效的SQL查询语句。
-
公开(公告)号:CN119441631A
公开(公告)日:2025-02-14
申请号:CN202411248617.5
申请日:2024-09-06
Applicant: 广东电网有限责任公司 , 广东电网有限责任公司信息中心
IPC: G06F16/9536 , G06F16/951 , G06F16/35 , G06Q50/00
Abstract: 本发明公开了一种用户论坛观点提取和分析方法及系统,包括:利用网络爬虫技术,从论坛爬取各帖子数据;利用CoT技术引导大模型执行以下步骤:识别帖子数据中各用户的关注点、将关注点归纳为不同主题并去重、评估各主题的出现频率和重要性,以及输出各主题及其描述;基于所述大模型输出的各主题及其描述,利用大模型对待分析论坛中各帖子分类,若帖子不属于所述大模型输出的各主题时,将其列为其他类别;利用大模型提取各主题对应帖子中用户的观点,一个主题获取其中具有代表性的若干观点,并根据所述观点进行总结分析。本发明能高效地提取和分析论坛观点。
-
公开(公告)号:CN117787786A
公开(公告)日:2024-03-29
申请号:CN202311805607.2
申请日:2023-12-25
Applicant: 广东电网有限责任公司 , 广东电网有限责任公司信息中心
IPC: G06Q10/0639 , G06F16/36 , G06N5/02 , G06N5/04
Abstract: 本申请公开了一种基于知识图谱的数字审计方法及装置,涉及数字审计技术领域,通过获取审计数据;对审计数据进行预处理,并基于预处理后的审计数据构建知识图谱;从审计数据中识别出实体,并将实体链接到知识图谱中的相应节点;提取审计数据中的实体关系,并实体关系加入到知识图谱中;根据知识图谱进行推理和分析,从而得到审计结果;将审计结果发送至显示界面进行显示,并生成相应的审计报告。本申请通过知识图谱能够很好的整理出海量结构化和非结构化数据之间的潜在关系,有助于审计人员更好地理解数据之间的关联,帮助审计人员更加高效、精准的完成审计工作。
-
公开(公告)号:CN117786109A
公开(公告)日:2024-03-29
申请号:CN202311805712.6
申请日:2023-12-25
Applicant: 广东电网有限责任公司 , 广东电网有限责任公司信息中心
Inventor: 王永斌 , 梁敏杰 , 陈国华 , 钟正 , 蔡玲嘉 , 肖嘉丽 , 张恭杰 , 李雄 , 肖峻 , 伍伦 , 胡夏俊 , 刘晔 , 粱盈威 , 朱泰鹏 , 钟敏 , 陈玥 , 杨雨飞
IPC: G06F16/35 , G06Q10/0639 , G06F18/213 , G06F18/23 , G06F18/24
Abstract: 本申请公开了一种审计问题库管理方法及系统,涉及审计技术领域,通过获取历史审计问题,并将其存储到历史问题数据库;对历史问题数据库中的历史审计问题进行预处理,并提取历史审计问题的文本特征;将历史审计问题的文本特征输入至预先训练好的聚类模型中进行第一次分类;将第一次分类后的历史审计问题的文本特征输入至预先训练好的分类模型中进行第二次分类,得到所有历史审计问题的分类信息;将所有历史审计问题的分类信息存储到标准问题数据库。本申请通过对海量历史审计问题文本特征进行提取,并应用聚类和分类模型建立了标准问题数据库,能够帮助审计人员充分利用历史审计问题,提高审计工作效率,提升审计分析问题的能力。
-
公开(公告)号:CN119474198A
公开(公告)日:2025-02-18
申请号:CN202411353527.2
申请日:2024-09-26
Applicant: 广东电网有限责任公司 , 广东电网有限责任公司信息中心
IPC: G06F16/27 , G06F16/26 , G06F16/2457 , G06F16/2458
Abstract: 本发明涉及数据分析技术领域,具体涉及一种基于数据资产的管控能力分析评估方法,包括:设定遍历逻辑,基于遍历逻辑实时遍历数据库中储存的数据,在遍历数据库中储存的数据时,同步捕捉数据库中储存数据的关键信息,进一步对捕捉到的数据库中储存数据的关键信息进行记录;监测数据库中储存数据的关键信息的记录次数累积,本发明通过对数据库中数据资产的遍历,在数据资产中提取到与数据资产相关的关键信息,进一步对关键信息进行记录,从而根据累积记录的关键信息构建可视化的趋势图,进而基于趋势图多方分析储存数据资产的数据库对于其内部储存数据资产的管控状态,最后实现对数据库管控其内部数据资产的能力进行评估。
-
-
-
-
-
-
-
-
-