-
公开(公告)号:CN103970506A
公开(公告)日:2014-08-06
申请号:CN201410196526.1
申请日:2009-03-27
Applicant: 英特尔公司
CPC classification number: G06F9/30036 , G06F9/30018 , G06F9/30021 , G06F9/30032 , G06F9/3004 , G06F9/30043 , G06F9/30087 , G06F9/3834 , G06F9/3885 , G06K9/6212 , G06T5/40 , H04N1/4074
Abstract: 本发明公开了用于实现高效同步和并行归约操作的向量指令。在一个实施例中,处理器可包括:向量单元,用于响应于单条指令对多个数据元素执行操作;以及耦合到向量单元的控制单元,用于向该向量单元提供数据元素,其中该控制单元使得能响应于要在第一掩码下执行的第一向量指令和要在第二掩码下执行的第二向量指令对这些数据元素中的至少一些数据元素执行原子向量操作。描述并要求保护其他实施例。
-
-
公开(公告)号:CN103970506B
公开(公告)日:2017-07-14
申请号:CN201410196526.1
申请日:2009-03-27
Applicant: 英特尔公司
CPC classification number: G06F9/30036 , G06F9/30018 , G06F9/30021 , G06F9/30032 , G06F9/3004 , G06F9/30043 , G06F9/30087 , G06F9/3834 , G06F9/3885 , G06K9/6212 , G06T5/40 , H04N1/4074
Abstract: 本申请公开了用于实现高效同步和并行归约操作的向量指令。在一个实施例中,处理器可包括:向量单元,用于响应于单条指令对多个数据元素执行操作;以及耦合到向量单元的控制单元,用于向该向量单元提供数据元素,其中该控制单元使得能响应于要在第一掩码下执行的第一向量指令和要在第二掩码下执行的第二向量指令对这些数据元素中的至少一些数据元素执行原子向量操作。描述并要求保护其他实施例。
-
公开(公告)号:CN101978350B
公开(公告)日:2014-06-11
申请号:CN200980110598.7
申请日:2009-03-27
Applicant: 英特尔公司
CPC classification number: G06F9/30036 , G06F9/30018 , G06F9/30021 , G06F9/30032 , G06F9/3004 , G06F9/30043 , G06F9/30087 , G06F9/3834 , G06F9/3885 , G06K9/6212 , G06T5/40 , H04N1/4074
Abstract: 在一个实施例中,处理器可包括:向量单元,用于响应于单条指令对多个数据元素执行操作;以及耦合到向量单元的控制单元,用于向该向量单元提供数据元素,其中该控制单元使得能响应于要在第一掩码下执行的第一向量指令和要在第二掩码下执行的第二向量指令对这些数据元素中的至少一些数据元素执行原子向量操作。描述并要求保护其他实施例。
-
公开(公告)号:CN113538206B
公开(公告)日:2024-06-04
申请号:CN202110826628.7
申请日:2018-05-07
Applicant: 英特尔公司
Abstract: 本申请公开了用于机器学习操作的经优化计算硬件。一个实施例提供了用于执行机器学习操作的计算设备,该计算设备包括:获取单元,用于获取具有多个输入操作数的单个指令,其中,所述多个操作数具有不相等的位长度,具有第一位长度的第一输入和具有第二位长度的第二输入;解码单元,用于将单个指令解码成经解码的指令;操作数长度单元,用于确定第一位长度和第二位长度中的较小位长度;以及计算单元,用于对多个输入操作数执行矩阵操作以生成具有较小位长度的位长度的输出值。
-
公开(公告)号:CN108805797A
公开(公告)日:2018-11-13
申请号:CN201810427080.7
申请日:2018-05-07
Applicant: 英特尔公司
Abstract: 一个实施例提供了用于执行机器学习操作的计算设备,该计算设备包括:获取单元,用于获取具有多个输入操作数的单个指令,其中,所述多个操作数具有不相等的位长度,具有第一位长度的第一输入和具有第二位长度的第二输入;解码单元,用于将单个指令解码成经解码的指令;操作数长度单元,用于确定第一位长度和第二位长度中的较小位长度;以及计算单元,用于对多个输入操作数执行矩阵操作以生成具有较小位长度的位长度的输出值。
-
-
公开(公告)号:CN103262058A
公开(公告)日:2013-08-21
申请号:CN201180061575.9
申请日:2011-12-07
Applicant: 英特尔公司
CPC classification number: G06F9/3887 , G06F9/30018 , G06F9/30032 , G06F9/30036 , G06F9/345
Abstract: 系统和方法被配置以检测在将标量进程转换成并行进程(“SIMD化”)时的冲突。可针对未排序的单个索引、经过排序的单个索引和/或经过排序的索引对来检测冲突。还可对写入后读取依赖关系检测冲突。冲突检测被配置以标识无法并行完成的迭代的序列中的操作(即迭代)。
-
公开(公告)号:CN111932435B
公开(公告)日:2024-08-27
申请号:CN202010802305.X
申请日:2018-05-07
Applicant: 英特尔公司
IPC: G06T1/20 , G06N3/044 , G06N3/09 , G06N3/0464 , G06N3/084
Abstract: 本申请公开了用于机器学习操作的经优化计算硬件。一个实施例提供了用于执行机器学习操作的计算设备,该计算设备包括:获取单元,用于获取具有多个输入操作数的单个指令,其中,所述多个操作数具有不相等的位长度,具有第一位长度的第一输入和具有第二位长度的第二输入;解码单元,用于将单个指令解码成经解码的指令;操作数长度单元,用于确定第一位长度和第二位长度中的较小位长度;以及计算单元,用于对多个输入操作数执行矩阵操作以生成具有较小位长度的位长度的输出值。
-
公开(公告)号:CN108292220B
公开(公告)日:2024-05-28
申请号:CN201680070403.0
申请日:2016-11-18
Applicant: 英特尔公司
Abstract: 描述了用于加速图形分析的装置和方法。例如,处理器的一个实施例包括:指令取出单元,用于取出包括集合交和集合并操作的程序代码;图形加速器单元(GAU),用于执行该程序代码的、与集合交和集合并操作有关的至少第一部分,并生成结果;以及执行单元,用于使用从GAU提供的结果来执行该程序代码的至少第二部分。
-
-
-
-
-
-
-
-
-