-
公开(公告)号:CN112560356A
公开(公告)日:2021-03-26
申请号:CN201910919675.9
申请日:2019-09-26
Applicant: 无锡江南计算技术研究所
IPC: G06F30/28 , G06F113/08 , G06F119/14
Abstract: 本发明公开了种面向众核架构的稀疏矩阵向量乘众核优化方法,包括以下步骤:S1、已知:行数为m,列数为n的稀疏矩阵A,长为n的向量x;求解长度为m的向量y,y=Ax为稀疏矩阵A与向量x的点积;S1、定义x向量块大小blk_x_size,根据x向量元素下标对x向量元素进行分块将x向量进行分块;S2、根据x向量的分块信息,即S1中求解得到的x向量元素所在的x向量块编号信息,统计原始稀疏矩阵即稀疏矩阵A中每一行非零元所在列号对应的x向量块的编号,由此统计出稀疏矩阵向量乘时稀疏矩阵每一行所需要的x向量块的编号信息。本发明提高了整体众核加速性能,提高数据访问的局部性,对非结构网格CFD应用的优化作用明显。
-
公开(公告)号:CN112559032A
公开(公告)日:2021-03-26
申请号:CN201910910103.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于循环段的众核程序重构方法,包括基于循环段拆分的重构算法和基于循环段合并的重构算法,其中,所述基于循环段拆分的重构算法包括基于主从协同任务的循环段拆分和基于空间压缩的循环段拆分,所述基于循环段合并的重构算法包括基于相似结构的循环段合并和基于增加循环量的循环段合并。本发明根据异构系统的结构特点和性能指标,优化循环段的层次结构和顺序,充分发挥系统的性能优势,从而最大程序提高应用软件的计算性能。
-
-
公开(公告)号:CN117992714A
公开(公告)日:2024-05-07
申请号:CN202410173427.5
申请日:2024-02-07
Applicant: 无锡江南计算技术研究所
Abstract: 本申请实施例公开了基于局部采样的众核架构半精度稠密矩阵乘方法及装置。该方法包括:从至少两个目标矩阵中分别取目标子矩阵,并将至少两个目标子矩阵进行相乘得到目标子乘积矩阵;根据所述目标子乘积矩阵中元素的最值以及预设阈值,确定是否需要对目标矩阵进行缩放处理;若是,则基于众核架构根据预设缩放比例对所述目标矩阵进行缩放处理,并进行乘积运算。上述方案能够通过局部采样的方式获取目标矩阵中的目标子矩阵,进而根据目标子矩阵的乘积的元素最值判断是否需要对目标矩阵进行缩放,从而有效降低计算量,提高判断效率,实现了高效率的半精度矩阵乘计算。
-
公开(公告)号:CN117350196A
公开(公告)日:2024-01-05
申请号:CN202311316066.7
申请日:2023-10-11
Applicant: 无锡江南计算技术研究所
IPC: G06F30/28 , G06F113/08 , G06F119/14
Abstract: 本发明实施例公开了一种面向流体力学的性能/精度耦合分析方法、装置及设备。该方法包括:获取流体力学在湍流模拟过程中采用的目标数据精度,确定计算机数值计算能力、数据类型值和目标数据精度下单个网格单次迭代的平均时间、访存系数、单次梯度计算单个网格需要访问的邻居数、硬件离散访存带宽,确定单次梯度计算复杂度与稀疏线性方程组单次迭代计算复杂度之间的比例系数,基于比例系数、求解N‑S方程和湍流模型中梯度计算次数和稀疏线性方程组的迭代次数、网格数量和目标数据精度下单个网格单次迭代的平均时间,确定在目标数据精度下湍流模拟的复杂度。本发明实施例提供的技术方案,以确定混合精度对流体力学模拟过程中性能的影响。
-
公开(公告)号:CN112559031B
公开(公告)日:2022-10-04
申请号:CN201910910099.1
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于数据结构的众核程序重构方法,包括基于提取基本类型数据结构的重构方法、基于数组降维的空间压缩的重构方法、基于增大传输字长的空间压缩的重构方法。本发明主要针对多级异构众核并行计算问题中多样化的数据结构,提供高效的数据结构重构方法,提高异构并行程序的计算效率。
-
公开(公告)号:CN114218736A
公开(公告)日:2022-03-22
申请号:CN202110453194.0
申请日:2021-04-26
Applicant: 无锡江南计算技术研究所
IPC: G06F30/20 , G06F15/16 , G06F119/08
Abstract: 本发明公开一种针对海洋模式ROMS众核优化的方法,包括以下步骤:S1、查找、确认并分析海洋模式中的热点函数,找出热点函数的特点;S2、根据S1中的分析结果,找出排名前三的热点函数都是属于计算密集型、不涉及数据相关性、但存在跨步访存问题的函数;S3、对S2中获得的热点函数的计算部分,利用循环段程序重构,将跨步访存变为连续访存;S4、利用编译指示语句对循环段进行众核优化,将循环段计算任务分发到不用的众核上;S5、对编译指示语句进行调优,通过多轮对比测试,作为最终的优化版本,可供模式其他算例使用。本发明在提升主核访存性能的同时,也有利于从核进行灵活的分块和合并等操作,还可以达到众核加速的效果。
-
公开(公告)号:CN114217935A
公开(公告)日:2022-03-22
申请号:CN202110209591.3
申请日:2021-02-25
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50 , G06F17/18 , G06F12/0884
Abstract: 本发明公开一种解决耦合器插值计算的众核并行优化算法,包括以下步骤:S1、运行插值计算程序,并根据插值计算程序的运行结果获取插值计算中的核心代码;S2、针对S1中获取的核心代码,逐行进行分析,获取核心代码中作为输入输出变量的全局变量;S3、对S2中获取的全局变量,按照数据结构复杂度分为基础数据类型变量与复杂数据类型变量两类;S4、分析通过S3分类获得的每个复杂数据类型变量;S5、将通过S3分类获得的复杂数据类型变量进行数据结构优化;S6、使用按照上述步骤编写的代码替换插值计算程序中相对应的代码,重新进行程序的编译和运行。本发明能够大幅度减少从核的离散访存开销,极大程度的提高众核并行程序的运算速度,最终提高地球系统模式的性能。
-
公开(公告)号:CN109684061A
公开(公告)日:2019-04-26
申请号:CN201811583475.2
申请日:2018-12-24
Applicant: 无锡江南计算技术研究所
CPC classification number: G06F9/4881 , G06F9/5066 , G06F9/5083 , G06F2209/5018
Abstract: 本发明公开一种非结构网格众核粗粒度并行计算方法,该方法在第一级非结构网格的区域分解的基础上增加了第二级的线程级区域分解,每个从核求解各自的独立计算区域,保证从核核心计算任务的数据命中率,实现MPI进程级的粗粒度并行和从核线程级的粗粒度并行。本发明能够解决一般非结构网格应用在多态异构处理器上的适应性问题,根据非结构网格数据规模自动完成二级负载平衡和计算核心的粗粒度众核并行,提高了异构体系结构上非结构网格数值模拟的计算效率和并行效率。
-
公开(公告)号:CN117992715A
公开(公告)日:2024-05-07
申请号:CN202410173432.6
申请日:2024-02-07
Applicant: 无锡江南计算技术研究所
Abstract: 本申请实施例公开了一种基于异构众核的对界融合批量浮点精度转换方法。该方法包括:将目标矩阵数据中同一预设维度的数据作为一个子矩阵数据;其中,预设维度为行或者列;根据所述子矩阵数据的数据量以及所述计算核心的局部存储空间,确定需要所述计算核心处理的目标子矩阵数据以及处理方式;通过所述计算核心基于所述处理方式对所述目标子矩阵数据进行处理。上述方案能够解决目前遍历目标矩阵数据进行精度转换过程中,数据访问量大、效率低的问题,从而通过异构众核结构对目标矩阵数据进行处理,提高同时处理的数据量,提高数据处理效率。
-
-
-
-
-
-
-
-
-