-
公开(公告)号:CN112559032B
公开(公告)日:2023-06-13
申请号:CN201910910103.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于循环段的众核程序重构方法,包括基于循环段拆分的重构算法和基于循环段合并的重构算法,其中,所述基于循环段拆分的重构算法包括基于主从协同任务的循环段拆分和基于空间压缩的循环段拆分,所述基于循环段合并的重构算法包括基于相似结构的循环段合并和基于增加循环量的循环段合并。本发明根据异构系统的结构特点和性能指标,优化循环段的层次结构和顺序,充分发挥系统的性能优势,从而最大程序提高应用软件的计算性能。
-
公开(公告)号:CN112445603A
公开(公告)日:2021-03-05
申请号:CN201910799247.7
申请日:2019-08-28
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种非结构网格主从动态并行预处理方法,基于由多个物理块构成的千万及以上量级规模的网格,包括以下步骤:S1、主进程按照物理块顺序分配任务,将每个物理块的网格信息分发至各从进程;S2、从进程接收来自主进程的任务,并对每个物理块内的网格单元进行预处理;S3、从进程将预处理结果发回至主进程,并向主进程申请下一组网格进行预处理;S4、主进程将所有网格组分发完后,向从进程发送结束信号;S5、从进程收到结束信号后,从进程结束。本发明能满足千万及以上量级网格规模的数值模拟需求,解决大规模非结构网格预处理内存需求过大和效率低的问题。
-
-
公开(公告)号:CN102929724A
公开(公告)日:2013-02-13
申请号:CN201210441328.8
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开了一种基于异构众核处理器的多级访存方法及离散访存方法。所述多级访存方法包括:从核读入第一次计算所需的数据;除第一次之外,从核在进行本次数据计算的同时,读入下一次计算所需的数据;除最后一次之外,从核在进行本次数据计算的同时,写回上一次计算结果数据;从核写回最后一次计算结果数据。所述离散访存方法包括:在从核上调整数组的存储顺序,将离散存储的数组调整为连续存储的数组;从核以多级访存方法,对所述数组进行通信读入数据、计算和通信写回数据。本发明实现了有效计算开销和多级存储资源访问开销之间最大限度的隐藏,提高了多级访存效率,充分发挥了从核的性能效率,从而提高科学计算课题的计算效率。
-
公开(公告)号:CN114218737A
公开(公告)日:2022-03-22
申请号:CN202110481531.7
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F30/20 , G06F15/16 , G06F111/10
Abstract: 本发明公开一种基于国产众核架构的POM海洋模式众核优化方法,S1、分析源码,确定循环层数和每层循环量大小,并通过将小循环合并为大循环或者判断外移的方法将源代码修改成更适合众核化的代码;S2、更改众核代码;S3、用魔方旋转算法化多维stencil计算的跨步访存为连续访存;S4、对于不存在跨步访存且各维循环之间无相关性的代码,运用多维循环合并方法提高并行效率;S5、修改众核代码并验证正确性。本发明在众核架构计算机上充分利用众核的优势,提升不同大小规模数据的计算效率。
-
公开(公告)号:CN112559031A
公开(公告)日:2021-03-26
申请号:CN201910910099.1
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于数据结构的众核程序重构方法,包括基于提取基本类型数据结构的重构方法、基于数组降维的空间压缩的重构方法、基于增大传输字长的空间压缩的重构方法。本发明主要针对多级异构众核并行计算问题中多样化的数据结构,提供高效的数据结构重构方法,提高异构并行程序的计算效率。
-
公开(公告)号:CN112540718A
公开(公告)日:2021-03-23
申请号:CN201910898286.2
申请日:2019-09-23
Applicant: 无锡江南计算技术研究所
IPC: G06F3/06
Abstract: 本发明公开一种面向申威众核架构的稀疏矩阵存储方法,所述众核处理器由4个异构群构成,每个异构群包括一个主核、64个从核构成的从核簇、异构群接口和存储控制器,整芯片有260个计算核心;所述稀疏矩阵存储格式包括以下步骤:S1、将稀疏矩阵按行在申威众核处理器的核组阵列上分组,每个从核分到的若干行为一组,将64个从核分为64组;S2、对每组内的稀疏矩阵非零元素按列压缩存储,通过保存稀疏矩阵每列包含的非零元数量而对列坐标进行压缩,需要保存列索引、行坐标和非零元值,完成存储。本发明能够为应用软件基于众核处理器的全过程求解提供一种统一的数据组织形式,从而提高该类问题对申威众核架构适应性。
-
公开(公告)号:CN109656890A
公开(公告)日:2019-04-19
申请号:CN201811583516.8
申请日:2018-12-24
Applicant: 无锡江南计算技术研究所
IPC: G06F16/172 , G06F11/14
Abstract: 本发明公开一种安全快速的大规模并行计算输入输出实现方法,该方法建立双备份安全目录机制;采用断点文件的分层目录结构管理;根据底层网络带宽和计算节点主核数选择输出因子。本发明解决了超大规模断点文件的安全性问题,解决了超大规模断点文件的高效输出输入问题,是一种安全可靠、效率高的写断点文件方法,解决CFD领域大规模安全可靠的并行计算问题。
-
公开(公告)号:CN112559952B
公开(公告)日:2023-07-07
申请号:CN201910918627.8
申请日:2019-09-26
Applicant: 无锡江南计算技术研究所
IPC: G06F17/14
Abstract: 本发明公开一种基于序列分层的异构众核快速傅里叶变换方法,包括以下步骤:S1、将待转序列按FFT运算层序进行分块,分块大小为当前运算层一次基本运算的子序列大小,即第1次分块时,每个分块的大小为2,即将输入序列分成大小为2的若干个小块;第2次分块时,每个分块的大小为4,即将输入序列分成大小为4的若干个小块;以此类推,第n次分块时,每个分块的大小为2n,即将输入序列分成大小为2n的若干个小块;一直分到每个分块的大小与输入序列的长度相同为止;S2、将每一层的分块并行地利用异构众核架构进行加速运算,通过片上网络实现分块内部的众核加速。本发明提高大规模数据的FFT算法性能。
-
公开(公告)号:CN114217936A
公开(公告)日:2022-03-22
申请号:CN202110209594.7
申请日:2021-02-25
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种高效大气模式物理过程任务划分算法,包括以下步骤:S1、获取大气模式中各进程所在的超节点编号;S2、根据S1中获取的超节点编号信息,对大气模式中的各进程进行分组,将具有相同超节点编号的进程分到同一个组;S3、第一级任务划分,采用与动力框架采用相同的网格划分方式,保证同一组进程中大气模式动力框架与物理过程具有相同的网格;S4、第二级任务划分,调整大气模式物理过程中组内进程间网格划分,将网格重分配到组内进程中。本发明既能使大气模式物理过程计算任务相对平衡,又能减少大气模式与动力框架耦合时的通信开销,可显著提高大气模式大规模并行时的整体性能。
-
-
-
-
-
-
-
-
-