按嵌入群激活量化
    2.
    发明公开

    公开(公告)号:CN118140229A

    公开(公告)日:2024-06-04

    申请号:CN202280070845.0

    申请日:2022-10-29

    Abstract: 用于提供按嵌入群激活量化的处理器实现的方法包括在转换器神经网络的第一层处接收顺序数据。经由该转换器神经网络的该第一层处理该顺序数据以生成激活张量。将该激活张量分成多个嵌入群。这些嵌入群中的每个嵌入群具有不同的量化参数的集合。基于该不同的量化参数的集合中的对应量化参数来单独地量化这些嵌入群中的每个嵌入群。将所量化的嵌入群与一组权重相乘以生成输出。

    用于经量化训练的量化范围估计
    3.
    发明公开

    公开(公告)号:CN117136364A

    公开(公告)日:2023-11-28

    申请号:CN202280027306.9

    申请日:2022-04-18

    Abstract: 本公开的某些方面提供了用于高效经量化学习的技术。在神经网络的一层处接收张量,并且基于所接收的张量以第一位宽生成当前张量。基于当前张量来确定一个或多个量化参数值。根据基于在神经网络的训练期间生成的先前张量来确定的一个或多个量化参数值将当前张量量化为较低位宽。

    用于量化的适配器
    4.
    发明公开

    公开(公告)号:CN119404198A

    公开(公告)日:2025-02-07

    申请号:CN202380047766.2

    申请日:2023-06-08

    Abstract: 一种用于人工神经网络(ANN)中的自适应量化的处理器实现的方法包括接收ANN模型。该ANN模型具有目标激活的多个通道。将量化模块结合在该ANN的第一线性层与该ANN的第二线性层之间以生成适配的ANN。该量化模块基于可学习量化模块参数来缩放该第一线性层的权重和偏置的第一集合并基于该可学习量化模块参数的逆来缩放该第二线性层的权重的第二集合。

Patent Agency Ranking