-
公开(公告)号:CN107220029B
公开(公告)日:2020-10-27
申请号:CN201710387372.8
申请日:2011-12-23
Applicant: 英特尔公司
Inventor: E·乌尔德-阿迈德-瓦尔 , R·凡伦天 , J·考博尔圣阿德里安 , S·赛尔
IPC: G06F9/30
Abstract: 本申请公开了掩码置换指令的装置和方法。描述了具有指令执行逻辑电路的装置。该指令执行逻辑电路具有输入向量元素路由电路,其用于针对三个不同指令中的每个指令执行以下操作:对于多个输出向量元素位置中的每一者,将来自可用于作为输出向量元素的源的多个输入向量元素位置之一的输入向量元素路由至输出向量元素位置。输出向量元素和每个输入向量元素位置为用于这三个不同指令的三个可用位宽之一。该装置还包括掩码层电路,其耦合至输入向量元素路由电路以对由输入向量路由元素电路所创建的数据结构进行掩码操作。掩码层电路被设计成以对应于这三个可用位宽的三个不同粒度级别进行掩码操作。
-
公开(公告)号:CN103946795B
公开(公告)日:2018-05-15
申请号:CN201180074918.5
申请日:2011-12-14
Applicant: 英特尔公司
Inventor: S·赛尔 , E·乌尔德-阿迈德-瓦尔
CPC classification number: G06F9/30065 , G06F9/30018 , G06F9/30036 , G06F9/30072 , G06F9/325 , G06F9/345 , G06F9/3824
Abstract: 循环对齐指令指示数组的基地址作为第一操作数、循环的迭代限制作为第二操作数以及目的地。循环包含迭代,且每一迭代包括该数组的一个数据元素。处理器接收循环对齐指令,解码该指令以便执行,并将执行的结果存储在目的地中。该结果指示在数组的开始处的将要与数组的剩余部分分离地处理的数据元素的数量,以使得数组的剩余部分的基地址与对齐宽度对齐。
-
公开(公告)号:CN107608716A
公开(公告)日:2018-01-19
申请号:CN201710936456.2
申请日:2011-09-30
Applicant: 英特尔公司
Inventor: R·C·凡伦天 , J·C·三额詹 , R·E·桑斯 , R·D·凯文 , B·L·托尔 , S·G·杜兰 , J·G·韦德梅耶 , S·萨姆德若拉 , M·B·吉尔卡尔 , E·T·格罗科斯基 , J·C·哈尔 , D·R·布拉德福德 , E·乌尔德-阿迈德-瓦尔 , J·C·阿贝尔 , M·查尼 , S·阿布拉罕 , S·赛尔 , A·T·福塞斯 , C·扬特 , L·吴
Abstract: 本申请公开了向量友好指令格式及其执行。根据本发明的一种实施例,一种处理器被配置为执行指令集。该指令集包括向量友好指令格式。该向量友好指令格式具有多个字段,多个字段包括基操作字段、修饰符字段、增加操作字段和数据元素宽度字段,其中,第一指令格式通过将不同的值放置在基操作字段、修饰符字段、α字段、β字段和数据元素宽度字段中来支持不同版本的基操作和不同的增加操作,且其中,在指令流中以第一指令格式的指令每次出现时,不同值中的仅一个可以被放置在基操作字段、修饰符字段、α字段、β字段和数据元素宽度字段中的每一个中。
-
公开(公告)号:CN104094221B
公开(公告)日:2017-09-05
申请号:CN201180076334.1
申请日:2011-12-30
Applicant: 英特尔公司
Inventor: E·乌尔德-阿迈德-瓦尔 , S·赛尔 , K·A·杜什 , C·R·扬特 , B·L·托尔
CPC classification number: G06F9/30018 , G06F9/30036 , H03M7/46
Abstract: 一种处理器核包括解码用于解压缩行程长度编码(RLE)的源数据元素集合的向量指令的硬件解码单元、以及执行经解码指令的执行单元。执行单元通过将源数据元素集合与零集合作比较来生成第一掩码并随后对该掩码中的尾随零进行计数。基于尾随零的计数制作第二掩码。执行单元随后使用第二掩码将源数据元素集合复制到缓冲器中并随后从源数据元素集合读取RLE零的数量。该缓冲器被移位并被复制到结果中,并且源数据元素集合向右移位。如果源数据元素集合中存在更多有效数据元素,则重复此举直至全部有效数据都被处理。
-
公开(公告)号:CN104094221A
公开(公告)日:2014-10-08
申请号:CN201180076334.1
申请日:2011-12-30
Applicant: 英特尔公司
Inventor: E·乌尔德-阿迈德-瓦尔 , S·赛尔 , K·A·杜什 , C·R·扬特 , B·L·托尔
CPC classification number: G06F9/30018 , G06F9/30036 , H03M7/46
Abstract: 一种处理器核包括解码用于解压缩行程长度编码(RLE)的源数据元素集合的向量指令的硬件解码单元、以及执行经解码指令的执行单元。执行单元通过将源数据元素集合与零集合作比较来生成第一掩码并随后对该掩码中的尾随零进行计数。基于尾随零的计数制作第二掩码。执行单元随后使用第二掩码将源数据元素集合复制到缓冲器中并随后从源数据元素集合读取RLE零的数量。该缓冲器被移位并被复制到结果中,并且源数据元素集合向右移位。如果源数据元素集合中存在更多有效数据元素,则重复此举直至全部有效数据都被处理。
-
公开(公告)号:CN103946795A
公开(公告)日:2014-07-23
申请号:CN201180074918.5
申请日:2011-12-14
Applicant: 英特尔公司
Inventor: S·赛尔 , E·乌尔德-阿迈德-瓦尔
CPC classification number: G06F9/30065 , G06F9/30018 , G06F9/30036 , G06F9/30072 , G06F9/325 , G06F9/345 , G06F9/3824
Abstract: 循环对齐指令指示数组的基地址作为第一操作数、循环的迭代限制作为第二操作数以及目的地。循环包含迭代,且每一迭代包括该数组的一个数据元素。处理器接收循环对齐指令,解码该指令以便执行,并将执行的结果存储在目的地中。该结果指示在数组的开始处的将要与数组的剩余部分分离地处理的数据元素的数量,以使得数组的剩余部分的基地址与对齐宽度对齐。
-
公开(公告)号:CN103827814A
公开(公告)日:2014-05-28
申请号:CN201180073690.8
申请日:2011-09-26
Applicant: 英特尔公司
Inventor: E·乌尔德-阿迈德-瓦尔 , K·A·杜什 , S·赛尔 , C·R·扬特
CPC classification number: G06F9/30043 , G06F9/30018 , G06F9/30036 , G06F9/3004 , G06F9/30101 , G06F9/3016 , G06F9/30185 , G06F9/3455 , G06F9/3808 , G06F9/3877 , G06F9/3887 , G06F15/8061
Abstract: 指令和逻辑提供利用跨越功能的向量加载操作和/或存储操作。在一些实施例中,响应于指定加载的集合、第二操作、目的地寄存器、操作数寄存器、存储器地址以及跨越长度的指令,执行单元读取掩码寄存器中的值,其中掩码寄存器中的字段对应于从该存储器地址到存储器中的数据元素的跨越长度倍数。第一掩码值指示该元素尚未从存储器中被加载,而第二值指示该元素无需被加载或已经被加载。对于具有第一值的每个数据元素,将该数据元素从存储器加载到相应的目的地寄存器位置中,并且将掩码寄存器中的相应值改成第二值。然后利用目的地和操作数寄存器中的相应数据来执行第二操作以产生结果。可在错误之后重启该指令。
-
公开(公告)号:CN103827813A
公开(公告)日:2014-05-28
申请号:CN201180073668.3
申请日:2011-09-26
Applicant: 英特尔公司
Inventor: E·乌尔德-阿迈德-瓦尔 , K·A·杜什 , C·R·扬特 , S·赛尔
CPC classification number: G06F9/3887 , G06F9/30018 , G06F9/30036 , G06F9/30043 , G06F9/30101 , G06F9/30105 , G06F9/30145 , G06F9/3836 , G06F15/8061
Abstract: 指令和逻辑提供向量分散操作和/或聚集操作功能。在一些实施例中,响应于指定聚集和第二操作、目的地寄存器、操作数寄存器以及存储器地址的指令,执行单元读取掩码寄存器中的值,其中掩码寄存器中的字段对应于存储器中的数据元素的索引寄存器中的偏移量索引。第一掩码值指示该元素尚未从存储器中被聚集,而第二值指示该元素无需被聚集或已经被聚集。对于具有第一值的每个数据元素,将该数据元素从存储器聚集到相应的目的地寄存器位置中,并且将掩码寄存器中的相应值改成第二值。当所有的掩码寄存器字段具有第二值时,利用目的地和操作数寄存器中的相应数据来执行第二操作以产生结果。
-
公开(公告)号:CN103502935A
公开(公告)日:2014-01-08
申请号:CN201180070598.6
申请日:2011-09-30
Applicant: 英特尔公司
Inventor: R·C·凡伦天 , J·C·三额詹 , R·E·桑斯 , R·D·凯文 , B·L·托尔 , S·G·杜兰 , J·G·韦德梅耶 , S·萨姆德若拉 , M·B·吉尔卡尔 , E·T·格罗科斯基 , J·C·哈尔 , D·R·布拉德福德 , E·乌尔德-阿迈德-瓦尔 , J·C·阿贝尔 , M·查尼 , S·阿布拉罕 , S·赛尔 , A·T·福塞斯 , C·扬特 , L·吴
CPC classification number: G06F9/30181 , G06F9/3001 , G06F9/30014 , G06F9/30018 , G06F9/30032 , G06F9/30036 , G06F9/30047 , G06F9/30145 , G06F9/30149 , G06F9/30185 , G06F9/30192 , G06F9/34
Abstract: 一种向量友好指令格式及其执行。根据本发明的一种实施例,一种处理器被配置为执行指令集。该指令集包括向量友好指令格式。该向量友好指令格式具有多个字段,多个字段包括基操作字段、修饰符字段、增加操作字段和数据元素宽度字段,其中,第一指令格式通过将不同的值放置在基操作字段、修饰符字段、α字段、β字段和数据元素宽度字段中来支持不同版本的基操作和不同的增加操作,且其中,在指令流中以第一指令格式的指令每次出现时,不同值中的仅一个可以被放置在基操作字段、修饰符字段、α字段、β字段和数据元素宽度字段中的每一个中。
-
公开(公告)号:CN108292252B
公开(公告)日:2022-09-20
申请号:CN201680070322.0
申请日:2016-12-29
Applicant: 英特尔公司
Inventor: E·乌尔德-阿迈德-瓦尔 , S·赛尔 , K·A·杜什 , C·R·扬特
Abstract: 描述了用于容错和检错的系统、方法和装置。例如,描述了一种装置,该装置包括:用于复制指令的输入源的电路;算术逻辑单元(ALU)电路,用于使用单指令多数据(SIMD)硬件、利用经复制的输入源来执行所述指令,以产生紧缩数据结果;以及比较电路,与所述ALU电路耦合,所述比较电路用于:评估所述紧缩数据结果,并且将单个数据结果输出到所述指令的目的地中。
-
-
-
-
-
-
-
-
-