非结构网格主从动态并行预处理方法

    公开(公告)号:CN112445603A

    公开(公告)日:2021-03-05

    申请号:CN201910799247.7

    申请日:2019-08-28

    Abstract: 本发明公开一种非结构网格主从动态并行预处理方法,基于由多个物理块构成的千万及以上量级规模的网格,包括以下步骤:S1、主进程按照物理块顺序分配任务,将每个物理块的网格信息分发至各从进程;S2、从进程接收来自主进程的任务,并对每个物理块内的网格单元进行预处理;S3、从进程将预处理结果发回至主进程,并向主进程申请下一组网格进行预处理;S4、主进程将所有网格组分发完后,向从进程发送结束信号;S5、从进程收到结束信号后,从进程结束。本发明能满足千万及以上量级网格规模的数值模拟需求,解决大规模非结构网格预处理内存需求过大和效率低的问题。

    基于异构众核处理器的多级访存方法、离散访存方法

    公开(公告)号:CN102929724A

    公开(公告)日:2013-02-13

    申请号:CN201210441328.8

    申请日:2012-11-06

    Abstract: 本发明公开了一种基于异构众核处理器的多级访存方法及离散访存方法。所述多级访存方法包括:从核读入第一次计算所需的数据;除第一次之外,从核在进行本次数据计算的同时,读入下一次计算所需的数据;除最后一次之外,从核在进行本次数据计算的同时,写回上一次计算结果数据;从核写回最后一次计算结果数据。所述离散访存方法包括:在从核上调整数组的存储顺序,将离散存储的数组调整为连续存储的数组;从核以多级访存方法,对所述数组进行通信读入数据、计算和通信写回数据。本发明实现了有效计算开销和多级存储资源访问开销之间最大限度的隐藏,提高了多级访存效率,充分发挥了从核的性能效率,从而提高科学计算课题的计算效率。

    面向申威众核架构的稀疏矩阵存储方法

    公开(公告)号:CN112540718A

    公开(公告)日:2021-03-23

    申请号:CN201910898286.2

    申请日:2019-09-23

    Abstract: 本发明公开一种面向申威众核架构的稀疏矩阵存储方法,所述众核处理器由4个异构群构成,每个异构群包括一个主核、64个从核构成的从核簇、异构群接口和存储控制器,整芯片有260个计算核心;所述稀疏矩阵存储格式包括以下步骤:S1、将稀疏矩阵按行在申威众核处理器的核组阵列上分组,每个从核分到的若干行为一组,将64个从核分为64组;S2、对每组内的稀疏矩阵非零元素按列压缩存储,通过保存稀疏矩阵每列包含的非零元数量而对列坐标进行压缩,需要保存列索引、行坐标和非零元值,完成存储。本发明能够为应用软件基于众核处理器的全过程求解提供一种统一的数据组织形式,从而提高该类问题对申威众核架构适应性。

    基于序列分层的异构众核快速傅里叶变换方法

    公开(公告)号:CN112559952B

    公开(公告)日:2023-07-07

    申请号:CN201910918627.8

    申请日:2019-09-26

    Abstract: 本发明公开一种基于序列分层的异构众核快速傅里叶变换方法,包括以下步骤:S1、将待转序列按FFT运算层序进行分块,分块大小为当前运算层一次基本运算的子序列大小,即第1次分块时,每个分块的大小为2,即将输入序列分成大小为2的若干个小块;第2次分块时,每个分块的大小为4,即将输入序列分成大小为4的若干个小块;以此类推,第n次分块时,每个分块的大小为2n,即将输入序列分成大小为2n的若干个小块;一直分到每个分块的大小与输入序列的长度相同为止;S2、将每一层的分块并行地利用异构众核架构进行加速运算,通过片上网络实现分块内部的众核加速。本发明提高大规模数据的FFT算法性能。

    一种高效大气模式物理过程任务划分算法

    公开(公告)号:CN114217936A

    公开(公告)日:2022-03-22

    申请号:CN202110209594.7

    申请日:2021-02-25

    Abstract: 本发明公开一种高效大气模式物理过程任务划分算法,包括以下步骤:S1、获取大气模式中各进程所在的超节点编号;S2、根据S1中获取的超节点编号信息,对大气模式中的各进程进行分组,将具有相同超节点编号的进程分到同一个组;S3、第一级任务划分,采用与动力框架采用相同的网格划分方式,保证同一组进程中大气模式动力框架与物理过程具有相同的网格;S4、第二级任务划分,调整大气模式物理过程中组内进程间网格划分,将网格重分配到组内进程中。本发明既能使大气模式物理过程计算任务相对平衡,又能减少大气模式与动力框架耦合时的通信开销,可显著提高大气模式大规模并行时的整体性能。

Patent Agency Ranking