-
公开(公告)号:CN108734646A
公开(公告)日:2018-11-02
申请号:CN201810368865.1
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: A·R·阿普 , A·考克 , J·C·韦斯特 , M·B·麦克弗森 , D·金 , L·L·赫德 , S·S·巴格索克希 , J·E·高茨克里奇 , P·萨蒂 , C·萨科斯维尔 , J·雷
Abstract: 本申请公开了跨处理系统进行的高效数据共享和压缩扩展。描述了一种用于促进在自主机器处进行的数据共享和模型压缩扩展的机制。如本文所述的实施例的一种方法包括:检测第一处理器处理与第一计算装置处的神经网络相关的信息,其中,所述第一处理器包括第一图形处理器,并且所述第一计算装置包括第一自主机器。所述方法进一步包括:促进所述第一处理器将所述信息的一个或多个部分存储在数据库处的库中,其中,所述一个或多个部分可由计算装置的第二处理器访问。
-
公开(公告)号:CN108734642A
公开(公告)日:2018-11-02
申请号:CN201810367099.7
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: A·考克 , A·R·阿普 , K·辛哈 , J·雷 , B·文布 , E·乌尔德-阿迈德-瓦尔 , S·S·巴格索克希 , 姚安邦 , K·尼利斯 , 陈晓明 , J·C·韦斯特 , J·E·高茨克里奇 , P·萨蒂 , C·萨科斯维尔 , F·阿赫巴里 , N·R·萨蒂什 , 马立伟 , J·波特森 , E·努维塔蒂 , T·T·施吕斯列尔 , A·N·沙阿 , J·肯尼迪 , V·兰甘纳坦 , S·加哈吉达
CPC classification number: G06N3/08 , G06N3/0445 , G06N3/0454 , G06N3/0481 , G06N3/063 , G06N20/00 , G06T1/20 , G06F9/5027 , G06F9/5066
Abstract: 本申请公开了对机器学习模型的动态分布训练。在示例中,一种装置包括:多个执行单元,包括至少第一类型的执行单元和第二类型的执行单元,以及逻辑,该逻辑至少部分地包括硬件逻辑,用于对工作负荷进行分析并且将工作负荷分配给第一类型的执行单元或第二类型的执行单元中的一个。还公开并要求保护其他实施例。
-
公开(公告)号:CN104025022B
公开(公告)日:2017-09-19
申请号:CN201180075857.4
申请日:2011-12-23
Applicant: 英特尔公司
CPC classification number: G06F11/0751 , G06F9/30018 , G06F9/30036 , G06F9/30043
Abstract: 描述了用于检测处理器中的错误状况并对其作出响应的装置和方法。例如,方法的一个实施例包括:从第一向量寄存器连续读取每个有效元素,每个有效元素指定聚集或加载操作的地址;检测与一个或多个有效元素相关联的一个或多个错误状况;在检测到的除了第一有效元素之外的元素上的错误状况之前,对于连续读取的每个有效元素,将从与该有效元素相关联的地址加载的数据存储在第一输出向量寄存器中;并且对于与检测到的错误状况相关联的以及在检测到的错误状况之后的每个有效元素,设置输出掩码寄存器中的位以指示检测到的错误状况。
-
公开(公告)号:CN113705789B
公开(公告)日:2024-01-16
申请号:CN202111003293.5
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: P·萨蒂 , N·斯里尼瓦萨 , 陈峰 , J·雷 , B·J·阿什博 , N·C·加洛泊凡博列斯 , E·努维塔蒂 , B·文布 , T-H·林 , K·辛哈 , R·巴瑞克 , S·S·巴格索克希 , J·E·高茨施里奇 , A·考克 , N·R·萨蒂什 , F·阿赫巴里 , D·金 , W·付 , T·T·施吕斯列尔 , J·B·马斯特罗纳尔德 , L·L·赫德 , J·H·费特 , J·S·波尔斯 , A·T·莱克 , K·瓦德亚纳桑 , D·伯克 , S·马余兰 , A·R·阿普
IPC: G06N3/045 , G06N3/044 , G06N3/0464 , G06N3/0499 , G06N3/084 , G06N3/088 , G06N3/09 , G06T1/20
Abstract: 公开了一种用于促进计算优化的装置。该装置包括多个处理单元,该多个处理单元各自包括多个执行单元(EU),其中,该多个EU包括第一EU类型和第二EU类型。(56)对比文件刘金硕;刘天晓;吴慧;曾秋梅;任梦菲;顾宜淳.从图形处理器到基于GPU的通用计算.武汉大学学报(理学版).2013,(02),全文.
-
公开(公告)号:CN116362310A
公开(公告)日:2023-06-30
申请号:CN202310364303.0
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: A·R·阿普 , A·考克 , J·C·韦斯特 , M·B·麦克弗森 , L·L·赫德 , S·S·巴格索克希 , J·E·高茨施里奇 , P·萨蒂 , C·萨科斯维尔 , 马立伟 , E·乌尔德-阿迈德-瓦尔 , K·辛哈 , J·雷 , B·文布 , S·加哈吉达 , V·兰甘纳坦 , D·金
Abstract: 本申请公开了在推断期间中对图形处理器的协调和增加利用。描述一种用于促进自主机器处的机器学习的推断协调与处理利用的机制。如本文所描述,实施例的一种方法包括:在训练时根据与包括图形处理器的处理器相关的训练数据集来检测与将要执行的一个或多个任务相关的信息。所述方法还可以包括:分析所述信息以确定能够支持所述一个或多个任务的与所述处理器相关的硬件的一个或多个部分;以及将所述硬件配置成预先选择所述一个或多个部分来执行所述一个或多个任务,而所述硬件的其他部分保持可用于其他任务。
-
-
公开(公告)号:CN108734298A
公开(公告)日:2018-11-02
申请号:CN201810339294.9
申请日:2018-04-16
Applicant: 英特尔公司
Inventor: C·萨科斯维尔 , P·萨蒂 , J·C·韦斯特 , S·S·巴格索克希 , J·E·高茨克里奇 , A·R·阿普 , N·C·加洛泊凡博列斯 , J·雷 , N·斯里尼瓦萨 , 陈峰 , B·J·阿什博 , R·巴瑞克 , T-H·林 , K·辛哈 , E·努维塔蒂 , B·韦布 , A·考克
Abstract: 本申请公开了扩展GPU/CPU一致性到多GPU核。在示例中,一种装置,包括:多个处理单元核;多个高速缓存存储器模块,与多个处理单元核相关联;以及机器学习模型,通信地耦合至多个处理单元核,其中多个高速缓存存储器模块与机器学习模型共享高速缓存一致性数据。还公开并要求保护其他实施例。
-
公开(公告)号:CN108734274A
公开(公告)日:2018-11-02
申请号:CN201810368545.6
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: P·萨蒂 , N·斯里尼瓦萨 , 陈峰 , J·雷 , B·J·阿什博 , N·C·加洛泊凡博列斯 , E·努维塔蒂 , B·文布 , T-H·林 , K·辛哈 , R·巴瑞克 , S·S·巴格索克希 , J·E·高茨施里奇 , A·考克 , N·R·萨蒂什 , F·阿赫巴里 , D·金 , W·付 , T·T·施吕斯列尔 , J·B·马斯特罗纳尔德 , L·L·赫德 , J·H·费特 , J·S·波尔斯 , A·T·莱克 , K·瓦德亚纳桑 , D·伯克 , S·马余兰 , A·R·阿普
Abstract: 公开了一种用于促进计算优化的装置。该装置包括多个处理单元,该多个处理单元各自包括多个执行单元(EU),其中,该多个EU包括第一EU类型和第二EU类型。
-
公开(公告)号:CN104081336B
公开(公告)日:2018-10-23
申请号:CN201180075862.5
申请日:2011-12-23
Applicant: 英特尔公司
Abstract: 描述了用于标识向量寄存器中的相同元素的装置、系统和方法。例如,根据一个实施例的计算机实现方法包括以下操作:从第一向量寄存器读取每个活跃元素,每个活跃元素具有所述第一向量寄存器内的所定义比特位置;从第二向量寄存器读取每个元素,每个元素具有所述第二向量寄存器内与第一向量寄存器中的当前活跃元素的比特位置相对应的所定义比特位置;读取输入掩码寄存器,输入掩码寄存器标识第二向量寄存器中将针对其作出与第一向量寄存器中的值的比较的活跃比特位置,所述比较操作包括:将第二向量寄存器中的每个活跃元素与第一向量寄存器中比特位置在第二向量寄存器中的当前活跃元素的比特位置之前的元素作比较;以及如果第一向量寄存器中的所有在前比特位置等于第二向量寄存器中的当前活跃比特位置中的比特,则将输出掩码寄存器中的比特位置设为等于真值。
-
公开(公告)号:CN104025022A
公开(公告)日:2014-09-03
申请号:CN201180075857.4
申请日:2011-12-23
Applicant: 英特尔公司
CPC classification number: G06F11/0751 , G06F9/30018 , G06F9/30036 , G06F9/30043
Abstract: 描述了用于检测处理器中的错误状况并对其作出响应的装置和方法。例如,方法的一个实施例包括:从第一向量寄存器连续读取每个有效元素,每个有效元素指定聚集或加载操作的地址;检测与一个或多个有效元素相关联的一个或多个错误状况;在检测到的除了第一有效元素之外的元素上的错误状况之前,对于连续读取的每个有效元素,将从与该有效元素相关联的地址加载的数据存储在第一输出向量寄存器中;并且对于与检测到的错误状况相关联的以及在检测到的错误状况之后的每个有效元素,设置输出掩码寄存器中的位以指示检测到的错误状况。
-
-
-
-
-
-
-
-
-