-
公开(公告)号:CN119669268A
公开(公告)日:2025-03-21
申请号:CN202411827829.9
申请日:2024-12-11
Applicant: 广东电网有限责任公司 , 广东电网有限责任公司信息中心
IPC: G06F16/2452 , G06F16/242 , G06F40/253 , G06F40/30
Abstract: 本发明公开了一种基于增量解析的受限自回归解码方法、系统及介质,该方法包括:对于给定的Text‑to‑SQL任务,将输入的自然语言查询问题和相应的数据库模式进行格式化和编码;采用大语言模型生成SQL查询;根据模型预测的log‑softmax分数和当前假设的令牌来调整分数,在SQL的每个令牌的生成步骤中,对候选令牌进行增量解析,以检查它们是否符合SQL的语法和语义规则;通过预先设置的不同检查模型对生成的SQL查询进行有效性检查;对未通过检查的令牌被赋予负无穷的分数,在束搜索中被排除,通过检查的有效SQL查询序列进行输出、评估与优化。本发明能有效提升语言模型的执行精度。
-
公开(公告)号:CN119669269A
公开(公告)日:2025-03-21
申请号:CN202411829984.4
申请日:2024-12-11
Applicant: 广东电网有限责任公司 , 广东电网有限责任公司信息中心
IPC: G06F16/2452 , G06F18/22 , G06N3/0455 , G06N3/096
Abstract: 本发明公开了一种基于元数据无关表征学习的自然语言转数据库查询生成方法、系统及介质,所述方法包括:对训练数据预处理;构建查询编辑距离函数;采用查询编辑距离函数构建增强数据集,对预处理后的数据打上分数标签;采用增强数据集以及所述分数标签训练半非对称编码器模型;将问题输入到训练好的半非对称编码器模型,得到模型输出的问题‑SQL语句相嵌入的查询结构。本发明通过构建自然语言问题和SQL查询之间的共享嵌入空间,消除了对数据库元数据的依赖,提高了大模型的示例选择精度和跨领域表现,提升了大模型在自然语言问题转换为SQL查询(Text‑to‑SQL)任务中的示例选择能力和执行准确率。
-