-
公开(公告)号:CN105487634A
公开(公告)日:2016-04-13
申请号:CN201510828279.7
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
IPC: G06F1/32
CPC classification number: G06F1/3287
Abstract: 一种面向异构众核芯片的量化功耗控制方法,包括:获取异构众核芯片在每种状态下的基准功耗数据,建立外部的基础功耗数据表;获取异构众核芯片所支持的所有稳定运行频率的频率档次表;而且针对所有稳定运行频率建立不同频率下运行相同应用代码的芯片功耗存在关系,其中,频率越高,功耗越大,并且最低频率档次工作功耗一定小于最大稳定运行功耗;建立芯片的功耗管理策略作为功耗管理的依据;众核操作系统启动后,将功耗阈值寄存器、功耗预警寄存器均初始化为最大稳定运行功耗;众核芯片操作系统运行时,外部功耗管理系统启动功耗管理过程,将基础功耗表、频率档次表、功耗管理策略通知到各异构众核芯片的操作系统中。
-
公开(公告)号:CN102929373B
公开(公告)日:2015-04-08
申请号:CN201210398111.3
申请日:2012-10-18
Applicant: 无锡江南计算技术研究所
IPC: G06F1/24
Abstract: 本发明提供了一种多核处理器复位方法,所述方法包括:读取复位信息;根据所述复位信息对多个处理器核进行复位操作,如果所述多个处理器核没有全部复位成功,则在预定次数内对所述多个处理器核重复执行所述复位操作,直至所述多个处理器核全部复位成功;以及如果经过所述预定次数的复位操作后,所述多个处理器核仍没有全部复位成功,则对所述多个处理器核中经过所述预定次数的复位操作后仍复位失败的处理器核进行临时隔离,并对所述多个处理器核中未隔离的处理器核进行再次复位操作。所述方法可以避免对处理器核进行错误的故障判断,从而避免可用处理器核因偶然失败而闲置。
-
公开(公告)号:CN114219065A
公开(公告)日:2022-03-22
申请号:CN202110349448.4
申请日:2021-03-31
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种面向异构众核平台的Im2col加速方法,C*H*W的张量经过Im2col变换后的矩阵形状为(C*Kh*Kw)*(Ho*Wo),其中C是通道数,H和W分别为输入的高度和宽度,Kh和Kw为卷积核大小,Ho和Wo为输出张量的高度和宽度;根据C*Kh的大小选择不同的算法:当C*Kh大于等于64时,从变换后的矩阵出发,按照C*Kh进行任务划分;当C*Kh小于64时,从变换前的矩阵出发,按照C*H进行任务划分。本发明有效提高了Im2col变换的运算效率,作为卷积计算的前处理过程,有效保障了卷积算子和卷积神经网络的高效运行。
-
公开(公告)号:CN114218146A
公开(公告)日:2022-03-22
申请号:CN202110452650.X
申请日:2021-04-26
Applicant: 无锡江南计算技术研究所
IPC: G06F15/163 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种针对大规模系统深度学习数据并行的分级通信优化方法,S1、根据所需计算节点总数,从若干个超节点中选择相同数量的计算节点,将计算节点按超节点进行分组;S2、每个计算节点计算出模型参数的梯度后,在分组内部进行MPI_Allreduce通信,计算出分组内的平均梯度;S3、各分组内的通信节点采用Ring_Allreduce算法进行梯度的Allreduce操作,计算出所有计算节点的平均梯度;S4、通信节点在分组内部进行Broadcast操作,完成所有计算节点的梯度更新。本发明在大规模分布式深度学习应用中的梯度更新过程中,减少了高延迟通信次数,充分利用了高速网络的通信性能,提高了通信效率。
-
公开(公告)号:CN114217765A
公开(公告)日:2022-03-22
申请号:CN202110480219.6
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种半精度浮点矩阵乘累加误差的优化方法,针对半精度浮点矩阵乘的分块运算,在进行分块结果累加计算时,先进行各分块内部累加,再进行分块间累加,具体包括以下步骤:S1、两个形状为M*K和K*N的矩阵进行半精度矩阵乘法时,如果K大于64,则将矩阵数据按kernel(M*N*K为8*32*32)进行分块;S2、每组分块中,对矩阵乘法的结果进行内部累加;S3、将S2中获得的每组分块的结果进行块间累加。本发明有效缓解了由于半精度类型数据表示范围较小导致的计算结果误差较大的问题。
-
公开(公告)号:CN112732630A
公开(公告)日:2021-04-30
申请号:CN201910975075.4
申请日:2019-10-14
Applicant: 无锡江南计算技术研究所
IPC: G06F15/173 , G06F17/16 , G06F7/523 , G06F7/57 , G06F9/54
Abstract: 本发明公开一种针对深度学习的浮点矩阵乘算子众核并行优化方法,包括将输入矩阵和输出矩阵进行扩展和在从核阵列上基于分块矩阵乘法进行计算;所述将输入矩阵和输出矩阵进行扩展包括以下步骤:S1、预申请扩展矩阵的空间;S2、在预申请空间上对输入矩阵和输出矩阵进行排布;S3、对于行方向M不整除情况,行数小于M的部分,按行读入N个数据,并对非整除列赋零后扩展为N_size个数据,写回扩展矩阵的对应位置;S4、对于列方向N不整除部分,首先从原始矩阵跨步读入右侧N不整除部分数据到局存,倒序扩展第N+1到N_size列为0。发明既可以减少访存的开销,又可以使算法的适用范围得到扩展,对于任意维度都有很好的支持。
-
公开(公告)号:CN112445676A
公开(公告)日:2021-03-05
申请号:CN201910832296.6
申请日:2019-09-04
Applicant: 无锡江南计算技术研究所
IPC: G06F11/30
Abstract: 本发明公开一种基于带时间标签多序列的故障预测方法,包括以下步骤:从故障数据采样中获取故障类型列表;以故障类型列表作为候选序列;获得时间序列数据库;将N的初始值赋为1;计算出N项候选场景在第1条时间序列上逗留的窗口数;得到N项候选场景的支持度,比较N项候选场景的支持度与支持度阀值,删除小于支持度阀值的N项候选场景;找出所有的频繁N项场景;将所有生成的频繁场景组合成一个频繁场景集合S;计算获得置信度,比较置信度与置信度阈值,大于置信度阈值的第i个场景的真子场景与第i个场景产生形如X—>Y的规则并保存至规则列表;输出规则列表中的所有规则。本发明可以分析出可信的故障预测模型,提前感知故障,为故障前瞻处理提供重要的保证。
-
公开(公告)号:CN112445635A
公开(公告)日:2021-03-05
申请号:CN201910831840.5
申请日:2019-09-04
Applicant: 无锡江南计算技术研究所
IPC: G06F11/07
Abstract: 本发明公开一种数据驱动的自适应检查点优化方法,包括以下步骤:以故障历史库中的故障数据作为样本,采用最大似然估计法,计算CPU节点失效分布;根据CPU节点失效分布,建立应用失效分布模型;根据失效分布模型,计算获得最优化检查点间隔;以最优化检查点间隔指导系统进行检查点;当有新故障发生时,更新相关的CPU节点失效分布;跳转至步骤二。本发明通过真实故障数据及自适应分布模型优化算法,动态更新作业级失效分布模型及其参数,不断优化并设定作业检查点间隔,自适应动态调节检查点间隔,实现对检查点容错模型的优化完善,尽量使检查点达到最优化,从而降低基于检查点的容错开销,极大提升系统可用性水平。
-
公开(公告)号:CN105487634B
公开(公告)日:2018-04-10
申请号:CN201510828279.7
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
IPC: G06F1/32
Abstract: 一种面向异构众核芯片的量化功耗控制方法,包括:获取异构众核芯片在每种状态下的基准功耗数据,建立外部的基础功耗数据表;获取异构众核芯片所支持的所有稳定运行频率的频率档次表;而且针对所有稳定运行频率建立不同频率下运行相同应用代码的芯片功耗存在关系,其中,频率越高,功耗越大,并且最低频率档次工作功耗一定小于最大稳定运行功耗;建立芯片的功耗管理策略作为功耗管理的依据;众核操作系统启动后,将功耗阈值寄存器、功耗预警寄存器均初始化为最大稳定运行功耗;众核芯片操作系统运行时,外部功耗管理系统启动功耗管理过程,将基础功耗表、频率档次表、功耗管理策略通知到各异构众核芯片的操作系统中。
-
公开(公告)号:CN105468456A
公开(公告)日:2016-04-06
申请号:CN201510828332.3
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
CPC classification number: G06F9/5005
Abstract: 一种基于可变网络拓扑的并行作业资源调度方法,包括:通过系统计算网络的网络监控发现系统网络拓扑发生变化;网络监控向作业资源调度服务推送网络拓扑变化信息,包括最新的网络拓扑;作业资源调度收到网络拓扑变化信息,对最新的拓扑信息进行预处理,依据网络各节点的拓扑关系形成临时计算资源池信息;与当前计算资源池匹配是否需要进行计算资源池重构,如果需要进行计算资源池重构则冻结作业资源调度服务,暂停系统的作业资源调度,保证系统服务数据的一致性;启动快速计算资源池重构,使用临时计算资源池替换正式计算资源池;形成新的计算资源池;随后解冻作业资源调度服务,利用新的计算资源池继续响应系统的各种作业资源调度请求。
-
-
-
-
-
-
-
-
-