-
公开(公告)号:CN114902179A
公开(公告)日:2022-08-12
申请号:CN202080090838.8
申请日:2020-12-30
Applicant: 高通股份有限公司
Abstract: 本公开涉及用于计算处理的方法和装置。例如,所公开的技术促进提高流式处理器中的矩阵乘法的性能。本公开的各方面可以利用加载控制单元执行第一加载指令以将输入矩阵的输入数据集从第一存储器加载到第二存储器。本公开的各方面还可以利用加载控制单元执行第二加载指令以将权重矩阵的权重数据集从第一存储器加载到第二存储器。此外,本公开的各方面可以利用ALU组件使用输入数据集和权重数据集来执行矩阵乘法运算以生成输出矩阵。此外,本公开的各方面可以将输出矩阵存储在ALU组件可存取的通用寄存器中。
-
公开(公告)号:CN115885254A
公开(公告)日:2023-03-31
申请号:CN202180051097.7
申请日:2021-08-04
Applicant: 高通股份有限公司
IPC: G06F8/41
Abstract: 图形处理单元(GPU)利用块通用寄存器(bGPR)将指令组的样本的多个波加载到处理管线中,并从管线接收处理后的样本。GPU使用持久GPR和bGPR为执行第一波的指令组来获取bGPR的信用。GPU在将第一波加载到管线中时退还信用。当至少一个信用是可用的并且管线正在处理第一波时,GPU执行指令组的后续波来将样本加载到管线。GPU在队列中存储已加载到管线中的每个波的指示。GPU在bGPR的物理时隙是可用的时将队列中下一波的样本从管线返回到bGPR以供进一步处理。
-