分层线程调度
    2.
    发明公开
    分层线程调度 审中-实审

    公开(公告)号:CN113760495A

    公开(公告)日:2021-12-07

    申请号:CN202011534900.6

    申请日:2020-12-23

    Abstract: 本发明标题为“分层线程调度”。本文所述示例涉及图形处理设备,其包括存储器装置以及耦合到存储器装置的图形处理单元(GPU),GPU可被配置成:执行指令线程;确定信号屏障是否与指令线程相关联;对于与指令线程相关联的信号屏障,确定信号屏障是否被清除;以及基于信号屏障被清除,允许与信号屏障标识符相关联的任何等待指令线程开始执行,但不允许不与信号屏障标识符相关联的任何等待线程开始执行。在一些示例中,信号屏障包含信号屏障标识符。在一些示例中,信号屏障标识符是多个值之一。在一些示例中,网关被用于接收信号屏障标识符的指示并且基于与信号屏障相关联的清除条件被满足来选择性地清除与信号屏障标识符相关联的等待指令线程的信号屏障。

    用于降低L1带宽要求的分布式寄存器堆缓存

    公开(公告)号:CN119513028A

    公开(公告)日:2025-02-25

    申请号:CN202410979975.7

    申请日:2024-07-22

    Abstract: 本公开的发明名称是“用于降低L1带宽要求的分布式寄存器堆缓存”。本文中描述了一种包括与存储器接口耦合的图形处理集群的图形处理器,所述图形处理集群包括多个处理资源,所述多个处理资源中的处理资源包括:寄存器堆,所述寄存器堆包括与处理资源的多个硬件线程中的第一硬件线程相关联的第一多个寄存器以及与处理资源的多个硬件线程中的第二硬件线程相关联的第二多个寄存器;以及第一电路,所述第一电路被配置成促进代表多个硬件线程对存储器的访问以及存储来自多个硬件线程的存储器访问请求的元数据。

    以单独的线程粒度使用单级同步的前向进展保证

    公开(公告)号:CN116136776A

    公开(公告)日:2023-05-19

    申请号:CN202211334883.0

    申请日:2022-10-28

    Abstract: 公开了以单独的线程粒度使用单级同步的前向进展保证。公开了用于以单独的线程粒度使用单级同步来促进前向进展保证的装置。该装置包括处理器,该处理器包括:屏障同步硬件电路,用于:将全局命名屏障标识符(ID)的集合指派给多个执行线程中的单独的执行线程;以及经由全局命名屏障ID的集合在单个级别上同步单独的执行线程的执行;以及多个处理资源,用于执行多个执行线程并包括分散屏障调度硬件电路,该分散屏障调度硬件电路用于促进从由第一线程执行的第一分散分支到由第二线程执行的第二分散分支的执行流切换,该执行流切换响应于第一线程停止以在具有全局命名屏障ID的集合的命名屏障上等待而被执行。

    基于范围的转储清除机制
    8.
    发明公开

    公开(公告)号:CN114661453A

    公开(公告)日:2022-06-24

    申请号:CN202111374312.5

    申请日:2021-11-19

    Abstract: 本申请公开了基于范围的转储清除机制。公开了一种用于促进存储器转储清除的设备。所述设备包括:高速缓存存储器;一个或多个处理资源;跟踪器硬件,所述跟踪器硬件用于分派工作负载以在所述处理资源处执行并且用于监测所述工作负载以跟踪所述执行的完成情况;基于范围的转储清除(RBF)硬件,所述RBF硬件用于处理RBF命令并生成用于对来自所述高速缓存存储器的数据进行转储清除的转储清除指示;以及转储清除控制器,所述转储清除控制器用于接收所述转储清除指示并执行转储清除操作以丢弃来自所述高速缓存存储器的在所述转储清除指示中提供的地址范围处的数据。

    用于支持每命令多个遍历器的系统和方法

    公开(公告)号:CN111667396A

    公开(公告)日:2020-09-15

    申请号:CN202010080494.4

    申请日:2020-02-05

    Abstract: 本申请公开了用于支持每命令多个遍历器的系统和方法。本文中描述的实施例提供了一种装置,该装置包括处理器,该处理器用于:将命令引擎的多个上下文配置成用于执行包括多个遍历器的图形工作负载;至少部分地基于被配置成用于上下文的遍历器的预定数量,从图形处理器的执行单元的池将执行单元的子集分配给多个遍历器中的每个遍历器;对于多个上下文中的每个上下文,将多个遍历器中的一个或多个遍历器分派给执行单元;以及在分派了多个遍历器中的一个或多个遍历器后,将指示遍历器的分派完成的操作码写入到计算机可读存储器,其中,该操作码包括用于多个遍历器中的一个或多个遍历器的依赖性数据。可描述并要求保护其他实施例。

Patent Agency Ranking