算力引擎构建方法、装置、设备和存储介质

    公开(公告)号:CN119358617B

    公开(公告)日:2025-04-01

    申请号:CN202411958126.X

    申请日:2024-12-30

    Inventor: 刘杨 翟福民 原超

    Abstract: 本申请提供一种算力引擎构建方法、装置、设备和存储介质。涉及计算机数据处理技术领域。该方法基于一种计算芯片,该计算芯片包括处理单元架构、第一存储器以及第二存储器,处理单元架构与第一存储器和第二存储器连接,处理单元架构包括至少两个处理单元阵列;该方法包括:根据神经网络中每一层的权重,将原始张量逐步分解为多个子张量;其中,各个子张量的秩满足设定要求;将多个子张量存储于所述第一存储器中;根据子张量的排序顺序以及各子张量之间的计算依赖关系,确定计算顺序;根据计算顺序,利用处理单元架构执行并行计算。本申请通过提出新的张量核构建和计算排序机制,减少计算冗余,从而显著提高计算效率。

    算力编排方法、装置、设备和存储介质

    公开(公告)号:CN119356828A

    公开(公告)日:2025-01-24

    申请号:CN202411918639.8

    申请日:2024-12-25

    Inventor: 刘杨 翟福民 原超

    Abstract: 本申请提供一种算力编排方法、装置、设备和存储介质。涉及计算机数据处理技术领域。该方法包括:将加速器资源虚拟化以实现灵活、可扩展的任务分配;使用自适应流量控制机制检测和管理任务之间的争用;通过集成的运行时系统协调资源分配和争用管理。本申请通过集成自适应加速器分配与动态争用管理功能,确保服务水平协议(SLA)的达成与性能的稳定性。并结合虚拟化的加速器编排与实时争用调节,使得加速器与内存资源可以灵活分配,在多个应用之间有效部署DNN,保障其高效、可靠的执行。

    算力编排方法、装置、设备和存储介质

    公开(公告)号:CN119356828B

    公开(公告)日:2025-04-22

    申请号:CN202411918639.8

    申请日:2024-12-25

    Inventor: 刘杨 翟福民 原超

    Abstract: 本申请提供一种算力编排方法、装置、设备和存储介质。涉及计算机数据处理技术领域。该方法包括:将加速器资源虚拟化以实现灵活、可扩展的任务分配;使用自适应流量控制机制检测和管理任务之间的争用;通过集成的运行时系统协调资源分配和争用管理。本申请通过集成自适应加速器分配与动态争用管理功能,确保服务水平协议(SLA)的达成与性能的稳定性。并结合虚拟化的加速器编排与实时争用调节,使得加速器与内存资源可以灵活分配,在多个应用之间有效部署DNN,保障其高效、可靠的执行。

    算力引擎构建方法、装置、设备和存储介质

    公开(公告)号:CN119358617A

    公开(公告)日:2025-01-24

    申请号:CN202411958126.X

    申请日:2024-12-30

    Inventor: 刘杨 翟福民 原超

    Abstract: 本申请提供一种算力引擎构建方法、装置、设备和存储介质。涉及计算机数据处理技术领域。该方法基于一种计算芯片,该计算芯片包括处理单元架构、第一存储器以及第二存储器,处理单元架构与第一存储器和第二存储器连接,处理单元架构包括至少两个处理单元阵列;该方法包括:根据神经网络中每一层的权重,将原始张量逐步分解为多个子张量;其中,各个子张量的秩满足设定要求;将多个子张量存储于所述第一存储器中;根据子张量的排序顺序以及各子张量之间的计算依赖关系,确定计算顺序;根据计算顺序,利用处理单元架构执行并行计算。本申请通过提出新的张量核构建和计算排序机制,减少计算冗余,从而显著提高计算效率。

Patent Agency Ranking