-
公开(公告)号:CN118798298A
公开(公告)日:2024-10-18
申请号:CN202410293153.3
申请日:2024-03-14
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
Abstract: 本申请涉及人工智能技术领域,提供一种模型的缩放因子确定方法、装置、设备、产品及存储介质。方法包括:基于模型的初始缩放因子和模型的损失值,确定扩大梯度;基于扩大梯度的反向传播结果,迭代更新初始缩放参数的上限值和下限值;基于最终更新后的上限值和下限值,确定模型的缩放因子。本申请根据扩大梯度的反向传播结果,迭代更新初始缩放参数的上限值和下限值,减少了确定缩放参数的上限值和下限值的模型迭代次数,简化了确定缩放参数的上限值和下限值的流程;根据更新后的上限值和更新后的下限值,确定缩放因子,提高了确定缩放因子的准确性,根据扩大梯度的反向传播结果,确定缩放因子,减少了确定缩放因子的迭代次数,提高了确定缩放因子的效率。
-
公开(公告)号:CN118981385A
公开(公告)日:2024-11-19
申请号:CN202410987881.4
申请日:2024-07-23
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种数据处理方法、装置、电子设备、存储介质及程序产品,属于数据处理技术领域,用以降低显存占用,提供数据处理效率。所述方法包括:确定用于处理待处理数据的目标专家模型;通过第一内存的共享权重和第二内存的目标低秩矩阵构造所述目标专家模型,所述目标低秩矩阵为预先对所述目标专家模型进行分解得到的;通过所述目标专家模型处理所述待处理数据。
-