-
公开(公告)号:CN118786437A
公开(公告)日:2024-10-15
申请号:CN202380022764.8
申请日:2023-01-31
Applicant: 高通股份有限公司
IPC: G06N3/0495 , G06N3/063
Abstract: 一种处理器实现的方法包括对神经网络参数的二进制表示进行位移。该神经网络参数具有比由处理该神经网络参数的硬件支持的硬件位的数目B少的位b。该位移有效地将该神经网络参数乘以2B‑b。该方法还包括将量化尺度除以2B‑b以获得更新的量化尺度。该方法还包括利用该更新的量化尺度来量化该位移的二进制表示以获得该神经网络参数的值。
-
公开(公告)号:CN118140229A
公开(公告)日:2024-06-04
申请号:CN202280070845.0
申请日:2022-10-29
Applicant: 高通股份有限公司
Inventor: Y·邦达连科 , M·纳格尔 , T·P·F·布兰克沃特
IPC: G06N3/045 , G06N3/0495
Abstract: 用于提供按嵌入群激活量化的处理器实现的方法包括在转换器神经网络的第一层处接收顺序数据。经由该转换器神经网络的该第一层处理该顺序数据以生成激活张量。将该激活张量分成多个嵌入群。这些嵌入群中的每个嵌入群具有不同的量化参数的集合。基于该不同的量化参数的集合中的对应量化参数来单独地量化这些嵌入群中的每个嵌入群。将所量化的嵌入群与一组权重相乘以生成输出。
-
-
公开(公告)号:CN119404198A
公开(公告)日:2025-02-07
申请号:CN202380047766.2
申请日:2023-06-08
Applicant: 高通股份有限公司
IPC: G06N3/0495 , G06N3/045 , G06N3/088
Abstract: 一种用于人工神经网络(ANN)中的自适应量化的处理器实现的方法包括接收ANN模型。该ANN模型具有目标激活的多个通道。将量化模块结合在该ANN的第一线性层与该ANN的第二线性层之间以生成适配的ANN。该量化模块基于可学习量化模块参数来缩放该第一线性层的权重和偏置的第一集合并基于该可学习量化模块参数的逆来缩放该第二线性层的权重的第二集合。
-
-
公开(公告)号:CN118661179A
公开(公告)日:2024-09-17
申请号:CN202380017780.8
申请日:2023-01-04
Applicant: 高通股份有限公司
Abstract: 本文所描述的各方面提供了用于执行机器学习模型的量化稳健联合学习的技术,包括:从联合学习服务器接收模型;使用本地目标函数来训练模型,其中该本地目标函数包括被配置成增加客户端设备处的量化稳健性的修改;以及向联合学习服务器传送经更新的模型。
-
公开(公告)号:CN117716687A
公开(公告)日:2024-03-15
申请号:CN202280035149.6
申请日:2022-03-31
Applicant: 高通股份有限公司
IPC: H04N19/103 , H04N19/172 , H04N19/463 , H04N19/537 , H04N19/146 , H04N19/124 , G06N3/045 , G06N3/084
Abstract: 描述了用于使用机器学习系统来对数据进行压缩和解压缩的技术。示例过程可包括接收用于由神经网络压缩系统进行压缩的多个图像。该过程可包括基于来自该多个图像中的第一图像来确定与该神经网络压缩系统的第一模型相关联的第一多个权重值。该过程可包括生成包括第一多个权重值的经压缩版本的第一比特流。该过程可包括输出第一比特流以供传输至接收方。
-
-
-
-
-
-