-
公开(公告)号:CN113849768A
公开(公告)日:2021-12-28
申请号:CN202011523329.8
申请日:2020-12-21
Applicant: 英特尔公司
Inventor: M·阿德尔曼 , R·凡伦天 , G·斯塔普 , Y·波拉克 , A·格雷德斯廷 , S·卢巴诺维奇 , Z·斯波比尔 , M·J·查尼 , C·J·休斯 , A·F·海内克 , E·吉奥加纳斯
Abstract: 公开了用于伴随数据类型转换来加载和存储矩阵数据的实施例。在实施例中,处理器包括解码器和执行电路。解码器用于对指令解码,该指令具有包括操作码字段、第一目的地操作数字段和第一源操作数字段的格式,操作码字段用于指定操作码,第一目的地操作数字段用于指定第一目的地矩阵位置,第一源操作数字段用于指定第一源矩阵位置。执行电路用于响应于经解码的指令,以将来自由第一源矩阵位置指定的第一源矩阵的多个源元素位置的数据元素从第一数据类型转换为第二数据类型以生成多个经转换的数据元素,并将多个经转换的数据元素中的每一个存储在由第一目的地矩阵位置指定的第一目的地矩阵中的多个目的地元素位置中的一个中。
-
公开(公告)号:CN115878952A
公开(公告)日:2023-03-31
申请号:CN202211025708.3
申请日:2022-08-25
Applicant: 英特尔公司
Inventor: M·阿德尔曼 , R·凡伦天 , D·鲍姆 , A·格雷德斯廷 , S·卢巴诺维奇 , R·舍米 , Z·司珀勃 , A·海内克 , C·休斯 , E·吉奥加纳斯 , M·查尼 , A·纳尔基斯 , R·拉波波特 , B·济夫 , Y·波拉克 , N·贾殷 , Y·阿克豪里 , B·加内什 , R·普尔纳查得兰 , G·布杜赫
Abstract: 本申请公开了用于16比特浮点矩阵点积指令的装置、方法和系统。系统、方法和装置涉及基于稀疏度的FMA。在一些示例中,单个FMA指令的实例具有用于操作码的一个或多个字段、用于标识源/目的地矩阵操作对象的一个或多个字段、用于标识第一多个源矩阵操作对象的一个或多个字段、用于标识第二多个矩阵操作对象的一个或多个字段,其中,操作码用于指示出执行电路要进行:基于来自第二多个矩阵操作对象中的第一矩阵操作对象的稀疏度控制,从第一多个源矩阵操作对象选择数据元素的适当子集;以及执行FMA。
-