-
公开(公告)号:CN118626494B
公开(公告)日:2024-11-26
申请号:CN202411046420.3
申请日:2024-08-01
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/22 , G06F40/18 , G06F40/186 , G06F40/117
Abstract: 本发明提供了一种结构化数据洞察生成方法、系统及介质,该方法包括以下步骤:使用对应的表格、问题和答案数据集对开源自然语言模型进行微调后,得到数据定位模型和洞察生成模型;数据定位模型从表格中识别出与问题相关的位置并标注;数据定位模型对表格使用预生成事实的方法从模板中生成相关推理事实;将标注后的表格、问题和生成的推理事实输入到洞察生成模型中,洞察生成模型给出最终的结构化数据洞察。相较现有技术,本发明减少了收集数据时人工标注的压力,提高了模型预测的可解释性和准确率,减少了语言模型在推理(尤其是数值推理)时的模型幻觉问题。
-
公开(公告)号:CN118626494A
公开(公告)日:2024-09-10
申请号:CN202411046420.3
申请日:2024-08-01
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/22 , G06F40/18 , G06F40/186 , G06F40/117
Abstract: 本发明提供了一种结构化数据洞察生成方法、系统及介质,该方法包括以下步骤:使用对应的表格、问题和答案数据集对开源自然语言模型进行微调后,得到数据定位模型和洞察生成模型;数据定位模型从表格中识别出与问题相关的位置并标注;数据定位模型对表格使用预生成事实的方法从模板中生成相关推理事实;将标注后的表格、问题和生成的推理事实输入到洞察生成模型中,洞察生成模型给出最终的结构化数据洞察。相较现有技术,本发明减少了收集数据时人工标注的压力,提高了模型预测的可解释性和准确率,减少了语言模型在推理(尤其是数值推理)时的模型幻觉问题。
-