Invention Grant
- Patent Title: 模型蒸馏训练的方法及相关装置和设备、可读存储介质
-
Application No.: CN202080106943.6Application Date: 2020-11-17
-
Publication No.: CN116438546BPublication Date: 2025-04-25
- Inventor: 闫文 , 于益俊 , 秦东润 , 辛阳
- Applicant: 华为技术有限公司
- Applicant Address: 广东省深圳市龙岗区坂田华为总部办公楼
- Assignee: 华为技术有限公司
- Current Assignee: 华为技术有限公司
- Current Assignee Address: 广东省深圳市龙岗区坂田华为总部办公楼
- Agency: 广州三环专利商标代理有限公司
- Agent 易浩球
- International Application: PCT/CN2020/129478 2020.11.17
- International Announcement: WO2022/104550 ZH 2022.05.27
- Date entered country: 2023-05-08
- Main IPC: G06N3/096
- IPC: G06N3/096

Abstract:
一种模型蒸馏训练的方法,包括:第一设备蒸馏训练神经网络模型之前,要和第二设备建立蒸馏训练的通信连接,通过第一设备和第二设备之间蒸馏训练信息的交互,第二设备使用第一设备发送的第一配置信息,配置第一参考神经网络模型。第二设备配置好第一参考神经网络模型后,使用第一数据信息,将第一数据信息中的第一样本数据通过已配置好的第一参考神经网络模型进行运算处理后,得到第一指示信息,并发送给第一设备。第一设备使用第一指示信息训练其设计的第一神经网络模型。通过这种方式,实现了第二设备通过迁移“知识”来指导第一设备进行蒸馏训练。
Public/Granted literature
- CN116438546A 模型蒸馏训练的方法及相关装置和设备、可读存储介质 Public/Granted day:2023-07-14
Information query