基于聚类的Text-to-SQL示例合成方法、设备以及存储介质

    公开(公告)号:CN119377711A

    公开(公告)日:2025-01-28

    申请号:CN202411492400.9

    申请日:2024-10-24

    Abstract: 本发明属于自然语言处理领域,尤其基于聚类的Text‑to‑SQL示例合成方法、设备以及存储介质。本发明目的是解决现有的方法依赖于人工标注的示例池导致大模型性能根据用户问题生成SQL语句准确率低的问题,采用基于人工标注,获取原示例池;采用聚类方法将步骤一获取的原示例池中的示例划分为N个子示例池;根据划分后的N个子示例池进行合成,得到合成示例池;所述合成示例池包括M个合成示例;将合成示例池加入原示例池中,得到融合示例池,增强示例池多样性,从而降低示例标注的开销,解决了依赖于人工标注的示例池导致大模型性能根据用户问题生成SQL语句准确率低的问题。

    基于模板检索的文本到SQL生成方法

    公开(公告)号:CN115203236A

    公开(公告)日:2022-10-18

    申请号:CN202210836518.3

    申请日:2022-07-15

    Abstract: 基于模板检索的文本到SQL生成方法,涉及数据处理技术领域,针对现有技术中针对长度较长的SQL语句解码速度慢的问题,由于非自回归模型的并行性带来时间性能提升的同时,也存在一些缺陷,无法在生成阶段观察到目标序列的上下文信息,因此本申请通过模板检索和多次迭代生成,弥补了非自回归模型的不足,本申请的技术方案对于结构复杂,长度较长的SQL语句,解码速度较传统方式提升了50%以上。本申请技术方案的模板库具有可扩展性,易于迁移,且具有较快的生成速度。

    一种基于表达式分解的数值推理方法、系统、存储介质及设备

    公开(公告)号:CN118643813A

    公开(公告)日:2024-09-13

    申请号:CN202410836145.9

    申请日:2024-06-26

    Abstract: 一种基于表达式分解的数值推理方法、系统、存储介质及设备,它属于自然语言处理领域。本发明解决了现有数值推理模型难以处理表格类型的数据的问题。本发明首先构造表格预测任务数据、表格计算任务数据以及别名定位任务数据,将构造的数据作为数值推理模型的预训练数据;利用预训练数据对数值推理模型进行预训练后,获得预训练好的数值推理模型;再基于表达式分解来构造数值推理模型的训练数据;利用构造的训练数据对预训练好的数值推理模型进行训练,获得训练好的数值推理模型;将用户问题作为训练好的数值推理模型的输入,通过训练好的数值推理模型输出对输入问题的回复。本发明方法可以应用于数值推理。

    基于模板检索的文本到SQL生成方法

    公开(公告)号:CN115203236B

    公开(公告)日:2023-05-12

    申请号:CN202210836518.3

    申请日:2022-07-15

    Abstract: 基于模板检索的文本到SQL生成方法,涉及数据处理技术领域,针对现有技术中针对长度较长的SQL语句解码速度慢的问题,由于非自回归模型的并行性带来时间性能提升的同时,也存在一些缺陷,无法在生成阶段观察到目标序列的上下文信息,因此本申请通过模板检索和多次迭代生成,弥补了非自回归模型的不足,本申请的技术方案对于结构复杂,长度较长的SQL语句,解码速度较传统方式提升了50%以上。本申请技术方案的模板库具有可扩展性,易于迁移,且具有较快的生成速度。

Patent Agency Ranking