-
公开(公告)号:CN119690987A
公开(公告)日:2025-03-25
申请号:CN202411835001.8
申请日:2024-12-13
Applicant: 广东电网有限责任公司 , 广东电网有限责任公司信息中心
IPC: G06F16/242 , G06F16/2452 , G06F40/30 , G06F18/22
Abstract: 本发明公开了一种基于多选择优化的数据库查询生成方法、系统及存储介质,所述方法通过多重提示从数据库模式中提取出与自然语言查询相关的表和列;基于提取出的与自然语言查询相关的表和列,以及基于问题相似性及掩码问题相似性的选择策略,利用多重提示生成多个候选SQL查询;根据各候选SQL查询的置信度分数进行筛选,并通过多选择方法选出最优SQL查询。本发明提高了生成SQL查询的准确性和鲁棒性。
-
公开(公告)号:CN119669268A
公开(公告)日:2025-03-21
申请号:CN202411827829.9
申请日:2024-12-11
Applicant: 广东电网有限责任公司 , 广东电网有限责任公司信息中心
IPC: G06F16/2452 , G06F16/242 , G06F40/253 , G06F40/30
Abstract: 本发明公开了一种基于增量解析的受限自回归解码方法、系统及介质,该方法包括:对于给定的Text‑to‑SQL任务,将输入的自然语言查询问题和相应的数据库模式进行格式化和编码;采用大语言模型生成SQL查询;根据模型预测的log‑softmax分数和当前假设的令牌来调整分数,在SQL的每个令牌的生成步骤中,对候选令牌进行增量解析,以检查它们是否符合SQL的语法和语义规则;通过预先设置的不同检查模型对生成的SQL查询进行有效性检查;对未通过检查的令牌被赋予负无穷的分数,在束搜索中被排除,通过检查的有效SQL查询序列进行输出、评估与优化。本发明能有效提升语言模型的执行精度。
-