基于大语言模型赋能Text2SQL的电力数据增强分析方法

    公开(公告)号:CN118964410B

    公开(公告)日:2024-12-17

    申请号:CN202411449483.3

    申请日:2024-10-17

    Abstract: 本发明涉及基于大语言模型赋能Text2SQL的电力数据增强分析方法,包括以下步骤:S1:收集电力相关的自然语言文本与相应的SQL查询对;S2:对步骤S1收集的数据进行预处理;S3:使用预训练的大型语言模型,基于训练数据集进行模型微调,结合自然语言理解和信息抽取来强化模型的泛化能力,得到电力大语言模型;S4:扩充训练数据集和测试数据集;S5:评估电力大语言模型性能;S6:采用对抗训练增强模型的鲁棒性,并使用自动调参技术优化模型参数,得到优化后的电力大语言模型;S7:将优化后的电力大语言模型打包成容器进行部署,部署后设置实时监控机制,跟踪电力系统中自然语言查询到SQL的转换效果。本发明能够更有效地处理电力系统中的自然语言查询。

    一种业务语义识别方法及装置
    4.
    发明公开

    公开(公告)号:CN115618883A

    公开(公告)日:2023-01-17

    申请号:CN202211428321.2

    申请日:2022-11-15

    Abstract: 本发明涉及一种业务语义识别方法,包括以下步骤:步骤S1:接收待识别语义的英文字符串及其他上下文信息;步骤S2:对待识别字段进行预处理;步骤S3:切分待识别字段,得到若干种分词方案;步骤S4:对每个分词方案,使用转移概率矩阵计算词切分点处的概率得分;步骤S5:对方案中的每个词,通过拼音语义DFA树判断为非拼音,则与词库中的词条进行逐个匹配,并计算相似得分;步骤S6:取相似得分最高的词条的语义,计算整个匹配方案语义间的关联得分;步骤S7:提取综合得分最高的匹配方案,拼接作为推荐标注;步骤S8:输出推荐的中文业务语义及推荐指标等相关信息。本发明提升元数据梳理工作的效率。

    基于大语言模型赋能Text2SQL的电力数据增强分析方法

    公开(公告)号:CN118964410A

    公开(公告)日:2024-11-15

    申请号:CN202411449483.3

    申请日:2024-10-17

    Abstract: 本发明涉及基于大语言模型赋能Text2SQL的电力数据增强分析方法,包括以下步骤:S1:收集电力相关的自然语言文本与相应的SQL查询对;S2:对步骤S1收集的数据进行预处理;S3:使用预训练的大型语言模型,基于训练数据集进行模型微调,结合自然语言理解和信息抽取来强化模型的泛化能力,得到电力大语言模型;S4:扩充训练数据集和测试数据集;S5:评估电力大语言模型性能;S6:采用对抗训练增强模型的鲁棒性,并使用自动调参技术优化模型参数,得到优化后的电力大语言模型;S7:将优化后的电力大语言模型打包成容器进行部署,部署后设置实时监控机制,跟踪电力系统中自然语言查询到SQL的转换效果。本发明能够更有效地处理电力系统中的自然语言查询。

Patent Agency Ranking