一种基于监督微调的大模型微调方法、装置、设备及介质

    公开(公告)号:CN118445397A

    公开(公告)日:2024-08-06

    申请号:CN202410652558.1

    申请日:2024-05-24

    Abstract: 本申请公开了一种基于监督微调的大模型微调方法、装置、设备及介质,应用于大语言模型,涉及大模型领域,包括:基于所述大语言模型生成相应的合成数据,并根据所述合成数据构建所述大语言模型的训练数据集;根据预设数据清洗规则对所述训练数据集进行清洗,并根据预设数据检验规则对得到的清洗后数据集进行数据标注以及数据检验得到目标数据集;根据所述目标数据集利用预设模型微调工具对所述大语言模型进行微调训练,直至得到满足预设训练要求的目标大语言模型。通过引入合成数据,在真实数据很少的场景,可以短时间内生成大量数据,有效减少采集真实数据的时间,提高模型微调工作效率。

    公文写作模型训练方法及装置、介质、设备

    公开(公告)号:CN118966186A

    公开(公告)日:2024-11-15

    申请号:CN202411156165.8

    申请日:2024-08-22

    Abstract: 本发明提供一种公文写作模型训练方法及装置、介质、设备。该方法包括:通过网络爬虫技术获取多种公文类型的公文数据;对所述公文数据进行清洗;基于清洗后的公文数据,构造训练集;其中,所述训练集中包括多条训练样本,每一条训练样本包括任务指令、用户输入信息和公文信息;根据所述训练集,进行模型训练,得到公文写作模型;其中,所述公文写作模型能够在应用场景中基于用户输入信息和任务指令,生成公文大纲,并对所述公文大纲进行内容填充,得到对应的公文信息。基于本发明实施例可以得到一种公文写作模型。

    一种交互方法、装置、设备及存储介质

    公开(公告)号:CN118246540B

    公开(公告)日:2024-08-13

    申请号:CN202410675246.2

    申请日:2024-05-29

    Abstract: 本申请公开了一种交互方法、装置、设备及存储介质,涉及数据处理技术领域,包括:获取当前交互请求,并利用预设语言模型生成与所述当前交互请求对应的知识检索请求;从预设知识文档库中检索与所述知识检索请求相匹配的若干候选文档;基于交叉熵损失函数对所述若干候选文档与所述当前交互请求进行计算,以根据相应的计算结果对所述若干候选文档进行排序,得到排序后文档;利用所述预设语言模型对所述排序后文档进行处理,以输出与所述当前交互请求对应的应答信息。这样一来,本申请可以对检索得到的候选文档进行重新排序,可以提高最终输入语言模型的文档与用户的交互请求的相关性,可以提高最终生成的应答信息与交互请求之间的交互效果。

    一种交互方法、装置、设备及存储介质

    公开(公告)号:CN118246540A

    公开(公告)日:2024-06-25

    申请号:CN202410675246.2

    申请日:2024-05-29

    Abstract: 本申请公开了一种交互方法、装置、设备及存储介质,涉及数据处理技术领域,包括:获取当前交互请求,并利用预设语言模型生成与所述当前交互请求对应的知识检索请求;从预设知识文档库中检索与所述知识检索请求相匹配的若干候选文档;基于交叉熵损失函数对所述若干候选文档与所述当前交互请求进行计算,以根据相应的计算结果对所述若干候选文档进行排序,得到排序后文档;利用所述预设语言模型对所述排序后文档进行处理,以输出与所述当前交互请求对应的应答信息。这样一来,本申请可以对检索得到的候选文档进行重新排序,可以提高最终输入语言模型的文档与用户的交互请求的相关性,可以提高最终生成的应答信息与交互请求之间的交互效果。

    一种基于微调大模型的代码检测方法以及装置

    公开(公告)号:CN119807003A

    公开(公告)日:2025-04-11

    申请号:CN202510006669.X

    申请日:2025-01-03

    Abstract: 本发明提供一种基于微调大模型的代码检测方法以及装置,包括:构建微调模型,其中,微调模型包括检测代码与参考检测结果之间的对应关系,获取待检测代码,对待检测代码进行预处理,以得到预处理后的待检测代码,根据待检测代码以及微调模型,获取待检测代码的检测结果,基于代码生成模型,根据检测结果,调整待检测代码并生成代码片段。通过构建微调模型,并将待检测代码输入到微调模型中,可以确定待检测代码是否异常,并将异常的代码输入到代码生成模型中并对异常的代码进行修改,从而生成的代码片段为可以正常运行的代码,从而实现现有技术中手动检测代码和修复代码的准确度以及效率较低的问题。

    一种基于大模型的文本纠错方法、装置、设备及存储介质

    公开(公告)号:CN118520869A

    公开(公告)日:2024-08-20

    申请号:CN202410920292.4

    申请日:2024-07-10

    Abstract: 本申请公开了一种基于大模型的文本纠错方法、装置、设备及存储介质,涉及人工智能技术领域,包括:基于大语言模型根据第一预设指令生成第一训练数据,并对预设数据进行人工标注生成第二训练数据,以构建训练数据集;通过预设文本纠错任务对应的第二预设指令和训练数据集构建相应的目标数据集,以利用目标数据集对大语言模型进行微调得到目标大语言模型;获取待纠错文本,并确定待纠错文本对应的纠错指令,以将待纠错文本和纠错指令进行拼接后输入目标大语言模型,得到纠错后的目标文本。基于大语言模型生成数据混合人工标注数据,并针对不同任务构造不同指令微调大模型,从而将拼写纠错和语法纠错串联起来,可以有效提升文本纠错准确率。

Patent Agency Ranking