-
公开(公告)号:CN120010853A
公开(公告)日:2025-05-16
申请号:CN202510077737.1
申请日:2025-01-17
Applicant: 大连理工大学 , 信华信技术股份有限公司
Abstract: 本发明属于智能软件工程的数据增强方法领域,涉及一种基于单向翻译与有效性自验证的等价代码数据增强方法。首先获取待数据增强项目内容,提取出所含各个函数,依次利用大语言模型进行功能需求单向翻译,获取自然语言描述;进而填充提示模板,输入大语言模型生成候选代码。为了确保被增强数据的语法有效性,使用静态语法分析工具检验候选代码;为了确保语义等价性,从断言知识增强与焦点方法‑测试用例关系学习角度依次预训练Func2Test模型并进行微调,为每个候选代码生成m个测试用例用于测试,最终仅保留通过率最高的候选代码作为新生成代码。最后对原始代码和新生成代码进行mixup处理,获得最终增强结果,即混合数据集Dmix。
-
公开(公告)号:CN120010854A
公开(公告)日:2025-05-16
申请号:CN202510078021.3
申请日:2025-01-17
Applicant: 大连理工大学 , 信华信技术股份有限公司
IPC: G06F8/41 , G06F18/22 , G06N3/0455
Abstract: 本发明属于软件工程领域,尤其涉及一种基于树指令大语言模型的代码翻译方法,可用于将源编程语言转换为目标编程语言。本发明通过从线性化AST中提取关键的树结构信息,并训练了一个相似度模型使树结构与代码结构对齐,从而构造更精确的指令数据集,增加了大语言模型对AST结构的理解能力;通过与大语言模型相结合,大大减少了人力干预,极大降低了代码翻译的成本;通过增加额外的功能评估方案,提升了了翻译结果对用户结果的友好度;此外,本发明方法还具有高度可扩展性,可以很容易地切换使用不同的大语言模型,有利于改善用户体验,降低使用所需的专业技能门槛。
-
公开(公告)号:CN118966385B
公开(公告)日:2025-03-14
申请号:CN202411448896.X
申请日:2024-10-17
Applicant: 信华信技术股份有限公司
Abstract: 本发明公开了一种面向软件工程的生成式大模型训练方法,包括具体步骤如下:步骤A:Agent服务端每分钟访问一次训练服务端的待执行任务队列,Agent服务将携带的训练服务器IP与队列中队头的任务训练服务器匹配,如果IP相同,则获取训练任务信息;如果不相同,则继续与队列中下一个训练任务的IP匹配,直到找到具有相同服务器IP的任务;步骤B:获取到待执行的训练任务后,需要判断该任务是否是多轮训练任务,如果是:则执行步骤G;如果不是执行步骤C;本发明涉及软件工程技术领域,本发明的有益效果是,生成式大模型训练方法,其特征在于Agent服务实时监测训练服务端的待执行任务,如监测到有待执行任务,则按照步骤训练任务。
-
公开(公告)号:CN117998102A
公开(公告)日:2024-05-07
申请号:CN202311830556.9
申请日:2023-12-28
Applicant: 信华信技术股份有限公司
IPC: H04N21/214 , H04N21/2387 , H04N21/262 , H04N21/81 , H04N13/122 , H04N13/194 , H04N13/332
Abstract: 本发明公开了一种工业三维大模型高清低延时呈现与交互系统,包括数字孪生体,所述数字孪生体包括云渲染系统,所述数字孪生体通过重大技术装备智能运维工业互联网平台以及制造业作业协同平台构成。本发明涉及数字孪生技术领域,本发明的有益效果是,工业三维大模型高清低延时呈现与交互系统,基于元宇宙技术底座,结合实时渲染及像素流送,通过云端或本地化的快速部署云渲染服务,解决数字孪生应用在多端设备中对超大规模场景的高清低延时呈现与交互的需求。
-
公开(公告)号:CN120010852A
公开(公告)日:2025-05-16
申请号:CN202510077454.7
申请日:2025-01-17
Applicant: 大连理工大学 , 信华信技术股份有限公司
Abstract: 本发明属于智能软件工程的数据增强方法领域,尤其涉及一种基于AST抽象语法树同义替换的代码大模型等价数据增强方法。首先进行数据筛选和静态语法分析检查,之后通过AST抽象语法树提取其代码所含变量名、函数名、类名建立词库进行筛选,在此基础上采用四种等价替换方法进行数据增强,最终将其与原始数据合并,获得最后的增强代码数据集。本发明可用于自动增强代码大模型训练语料,以微调提升大语言模型在垂直领域的性能。
-
公开(公告)号:CN118966385A
公开(公告)日:2024-11-15
申请号:CN202411448896.X
申请日:2024-10-17
Applicant: 信华信技术股份有限公司
Abstract: 本发明公开了一种面向软件工程的生成式大模型训练方法,包括具体步骤如下:步骤A:Agent服务端每分钟访问一次训练服务端的待执行任务队列,Agent服务将携带的服务器ip与队列中队头的任务训练服务器匹配,如果ip相同,则获取训练任务信息;如果不相同,则继续与队列中下一个训练任务的ip匹配,直到找到具有相同服务器ip的任务;步骤B:获取到待执行的训练任务后,需要判断该任务是否是多轮训练任务,如果是:则执行步骤G;如果不是执行步骤C;本发明涉及软件工程技术领域本发明的有益效果是,生成式大模型训练方法,其特征在于Agent服务实时监测训练服务端的待执行任务,如监测到有待执行任务,则按照步骤训练任务。
-
-
-
-
-