-
公开(公告)号:CN120010852A
公开(公告)日:2025-05-16
申请号:CN202510077454.7
申请日:2025-01-17
Applicant: 大连理工大学 , 信华信技术股份有限公司
Abstract: 本发明属于智能软件工程的数据增强方法领域,尤其涉及一种基于AST抽象语法树同义替换的代码大模型等价数据增强方法。首先进行数据筛选和静态语法分析检查,之后通过AST抽象语法树提取其代码所含变量名、函数名、类名建立词库进行筛选,在此基础上采用四种等价替换方法进行数据增强,最终将其与原始数据合并,获得最后的增强代码数据集。本发明可用于自动增强代码大模型训练语料,以微调提升大语言模型在垂直领域的性能。
-
公开(公告)号:CN120010854A
公开(公告)日:2025-05-16
申请号:CN202510078021.3
申请日:2025-01-17
Applicant: 大连理工大学 , 信华信技术股份有限公司
IPC: G06F8/41 , G06F18/22 , G06N3/0455
Abstract: 本发明属于软件工程领域,尤其涉及一种基于树指令大语言模型的代码翻译方法,可用于将源编程语言转换为目标编程语言。本发明通过从线性化AST中提取关键的树结构信息,并训练了一个相似度模型使树结构与代码结构对齐,从而构造更精确的指令数据集,增加了大语言模型对AST结构的理解能力;通过与大语言模型相结合,大大减少了人力干预,极大降低了代码翻译的成本;通过增加额外的功能评估方案,提升了了翻译结果对用户结果的友好度;此外,本发明方法还具有高度可扩展性,可以很容易地切换使用不同的大语言模型,有利于改善用户体验,降低使用所需的专业技能门槛。
-
公开(公告)号:CN120010853A
公开(公告)日:2025-05-16
申请号:CN202510077737.1
申请日:2025-01-17
Applicant: 大连理工大学 , 信华信技术股份有限公司
Abstract: 本发明属于智能软件工程的数据增强方法领域,涉及一种基于单向翻译与有效性自验证的等价代码数据增强方法。首先获取待数据增强项目内容,提取出所含各个函数,依次利用大语言模型进行功能需求单向翻译,获取自然语言描述;进而填充提示模板,输入大语言模型生成候选代码。为了确保被增强数据的语法有效性,使用静态语法分析工具检验候选代码;为了确保语义等价性,从断言知识增强与焦点方法‑测试用例关系学习角度依次预训练Func2Test模型并进行微调,为每个候选代码生成m个测试用例用于测试,最终仅保留通过率最高的候选代码作为新生成代码。最后对原始代码和新生成代码进行mixup处理,获得最终增强结果,即混合数据集Dmix。
-
公开(公告)号:CN118966385A
公开(公告)日:2024-11-15
申请号:CN202411448896.X
申请日:2024-10-17
Applicant: 信华信技术股份有限公司
Abstract: 本发明公开了一种面向软件工程的生成式大模型训练方法,包括具体步骤如下:步骤A:Agent服务端每分钟访问一次训练服务端的待执行任务队列,Agent服务将携带的服务器ip与队列中队头的任务训练服务器匹配,如果ip相同,则获取训练任务信息;如果不相同,则继续与队列中下一个训练任务的ip匹配,直到找到具有相同服务器ip的任务;步骤B:获取到待执行的训练任务后,需要判断该任务是否是多轮训练任务,如果是:则执行步骤G;如果不是执行步骤C;本发明涉及软件工程技术领域本发明的有益效果是,生成式大模型训练方法,其特征在于Agent服务实时监测训练服务端的待执行任务,如监测到有待执行任务,则按照步骤训练任务。
-
公开(公告)号:CN119067077B
公开(公告)日:2025-03-14
申请号:CN202411564084.1
申请日:2024-11-05
Applicant: 信华信技术股份有限公司
IPC: G06F40/151 , G06F40/30 , G06N5/022
Abstract: 本发明公开了一种基于大模型的MES概要设计文档生成方法,包括以下步骤:步骤a:MES领域知识生产;步骤b:概要设计文档生成。本发明涉及人工智能技术领域,本发明的有益效果是,本方法借助大模型技术,再保证生成安全、可控前提下,利用知识图谱指导大模型进行MES系统概要设计文档的生成,将业务专家的功能需求准确、完整、规范地转换为概要设计文档,保证开发人员充分理解业务场景与功能需求。本方法分为领域知识生产与概要设计书生成两个阶段。领域知识生产包括行业MES国家标准、概要设计文档结构、领域内MES相关文档,通过算法实现数据向量的存储与知识图谱的建立。
-
公开(公告)号:CN117493939A
公开(公告)日:2024-02-02
申请号:CN202311516506.3
申请日:2023-11-15
Applicant: 信华信技术股份有限公司
IPC: G06F18/24 , G06F18/214 , G06F40/279 , G06F40/216 , G06N3/09
Abstract: 本发明公开了一种基于文本信息监督的零样本工业木制品质检方法,包括以下步骤:S1:通过提示工程对提示模板进行优化;S2:状态词优化;S3:实体词优化;S4:合成文本提示输入;S5:质检流程。本发明涉及机器视觉技术领域,本发明的有益效果是,不需要工厂提供带缺陷的样本,也不需要对缺陷种类进行穷举,只需几张合格品的样本,采用本专利提出的方法即可对缺陷样本进行检出。
-
公开(公告)号:CN118966385B
公开(公告)日:2025-03-14
申请号:CN202411448896.X
申请日:2024-10-17
Applicant: 信华信技术股份有限公司
Abstract: 本发明公开了一种面向软件工程的生成式大模型训练方法,包括具体步骤如下:步骤A:Agent服务端每分钟访问一次训练服务端的待执行任务队列,Agent服务将携带的训练服务器IP与队列中队头的任务训练服务器匹配,如果IP相同,则获取训练任务信息;如果不相同,则继续与队列中下一个训练任务的IP匹配,直到找到具有相同服务器IP的任务;步骤B:获取到待执行的训练任务后,需要判断该任务是否是多轮训练任务,如果是:则执行步骤G;如果不是执行步骤C;本发明涉及软件工程技术领域,本发明的有益效果是,生成式大模型训练方法,其特征在于Agent服务实时监测训练服务端的待执行任务,如监测到有待执行任务,则按照步骤训练任务。
-
公开(公告)号:CN119067077A
公开(公告)日:2024-12-03
申请号:CN202411564084.1
申请日:2024-11-05
Applicant: 信华信技术股份有限公司
IPC: G06F40/151 , G06F40/30 , G06N5/022
Abstract: 本发明公开了一种基于大模型的MES概要设计文档生成方法,包括以下步骤:步骤a:MES领域知识生产;步骤b:概要设计文档生成。本发明涉及人工智能技术领域,本发明的有益效果是,本方法借助大模型技术,再保证生成安全、可控前提下,利用知识图谱指导大模型进行MES系统概要设计文档的生成,将业务专家的功能需求准确、完整、规范地转换为概要设计文档,保证开发人员充分理解业务场景与功能需求。本方法分为领域知识生产与概要设计书生成两个阶段。领域知识生产包括行业MES国家标准、概要设计文档结构、领域内MES相关文档,通过算法实现数据向量的存储与知识图谱的建立。
-
公开(公告)号:CN117998102A
公开(公告)日:2024-05-07
申请号:CN202311830556.9
申请日:2023-12-28
Applicant: 信华信技术股份有限公司
IPC: H04N21/214 , H04N21/2387 , H04N21/262 , H04N21/81 , H04N13/122 , H04N13/194 , H04N13/332
Abstract: 本发明公开了一种工业三维大模型高清低延时呈现与交互系统,包括数字孪生体,所述数字孪生体包括云渲染系统,所述数字孪生体通过重大技术装备智能运维工业互联网平台以及制造业作业协同平台构成。本发明涉及数字孪生技术领域,本发明的有益效果是,工业三维大模型高清低延时呈现与交互系统,基于元宇宙技术底座,结合实时渲染及像素流送,通过云端或本地化的快速部署云渲染服务,解决数字孪生应用在多端设备中对超大规模场景的高清低延时呈现与交互的需求。
-
公开(公告)号:CN117541831A
公开(公告)日:2024-02-09
申请号:CN202311483895.4
申请日:2023-11-09
Applicant: 信华信技术股份有限公司
Abstract: 本发明公开了一种多模态信息监督的零异常样本医疗塑料制品质检方法,包括以下步骤:步骤S1:设计提示模板;步骤S2:计算文本特征向量T;步骤S3:计算合格品图像的特征向量I 0;步骤S4:质检流程。本发明涉及机器视觉技术领域,本发明的有益效果是,首先不需要工厂提供带缺陷的样本,也不需要对缺陷种类进行穷举,只需几张合格品的样本,采用本专利提出的方法即可对缺陷样本进行检出,直接解决了上述工业场景缺陷种类多无法穷举、缺陷样本少、无法采集的两大痛点。
-
-
-
-
-
-
-
-
-