一种面向软件工程的生成式大模型训练方法

    公开(公告)号:CN118966385A

    公开(公告)日:2024-11-15

    申请号:CN202411448896.X

    申请日:2024-10-17

    Inventor: 孙伟宏 白亮 吕鹏

    Abstract: 本发明公开了一种面向软件工程的生成式大模型训练方法,包括具体步骤如下:步骤A:Agent服务端每分钟访问一次训练服务端的待执行任务队列,Agent服务将携带的服务器ip与队列中队头的任务训练服务器匹配,如果ip相同,则获取训练任务信息;如果不相同,则继续与队列中下一个训练任务的ip匹配,直到找到具有相同服务器ip的任务;步骤B:获取到待执行的训练任务后,需要判断该任务是否是多轮训练任务,如果是:则执行步骤G;如果不是执行步骤C;本发明涉及软件工程技术领域本发明的有益效果是,生成式大模型训练方法,其特征在于Agent服务实时监测训练服务端的待执行任务,如监测到有待执行任务,则按照步骤训练任务。

    一种基于单向翻译与有效性自验证的等价代码数据增强方法

    公开(公告)号:CN120010853A

    公开(公告)日:2025-05-16

    申请号:CN202510077737.1

    申请日:2025-01-17

    Abstract: 本发明属于智能软件工程的数据增强方法领域,涉及一种基于单向翻译与有效性自验证的等价代码数据增强方法。首先获取待数据增强项目内容,提取出所含各个函数,依次利用大语言模型进行功能需求单向翻译,获取自然语言描述;进而填充提示模板,输入大语言模型生成候选代码。为了确保被增强数据的语法有效性,使用静态语法分析工具检验候选代码;为了确保语义等价性,从断言知识增强与焦点方法‑测试用例关系学习角度依次预训练Func2Test模型并进行微调,为每个候选代码生成m个测试用例用于测试,最终仅保留通过率最高的候选代码作为新生成代码。最后对原始代码和新生成代码进行mixup处理,获得最终增强结果,即混合数据集Dmix。

    一种面向软件工程的生成式大模型训练方法

    公开(公告)号:CN118966385B

    公开(公告)日:2025-03-14

    申请号:CN202411448896.X

    申请日:2024-10-17

    Inventor: 孙伟宏 白亮 吕鹏

    Abstract: 本发明公开了一种面向软件工程的生成式大模型训练方法,包括具体步骤如下:步骤A:Agent服务端每分钟访问一次训练服务端的待执行任务队列,Agent服务将携带的训练服务器IP与队列中队头的任务训练服务器匹配,如果IP相同,则获取训练任务信息;如果不相同,则继续与队列中下一个训练任务的IP匹配,直到找到具有相同服务器IP的任务;步骤B:获取到待执行的训练任务后,需要判断该任务是否是多轮训练任务,如果是:则执行步骤G;如果不是执行步骤C;本发明涉及软件工程技术领域,本发明的有益效果是,生成式大模型训练方法,其特征在于Agent服务实时监测训练服务端的待执行任务,如监测到有待执行任务,则按照步骤训练任务。

Patent Agency Ranking