-
公开(公告)号:CN118747260A
公开(公告)日:2024-10-08
申请号:CN202410885260.5
申请日:2024-07-03
Applicant: 电子科技大学
IPC: G06F17/16
Abstract: 本发明涉及高性能计算领域,公开了一种对称矩阵特征值分解中使用双块ZY表示的矩阵条带化方法,包括:步骤A、将对称矩阵A中的第t个积攒块进行QR分解积攒得到矩阵组Z和矩阵组Y;步骤B、使用积攒得到的矩阵组Z和矩阵组Y对矩阵A的尾矩阵进行更新,所述尾矩阵为所述矩阵A中第(Q+1)行至第n行的以及第(Q+1)列至第n列的方形块;步骤C、判断t是否大于T,若是,则跳转至步骤D,否则,令矩阵组Z和矩阵组Y为空,令t=t+1,j=1,最后返回步骤A;步骤D、利用对称性,将所述对称矩阵A的下三角部分拷贝到所述对称矩阵A的上三角部分,得到所述对称矩阵A的条带化变换形式。本发明提升了效率。
-
公开(公告)号:CN118917994A
公开(公告)日:2024-11-08
申请号:CN202411397918.4
申请日:2024-10-09
Applicant: 电子科技大学
IPC: G06T1/20
Abstract: 本发明提供了一种基于GPU并行加速的对称条带矩阵三对角化变换方法,属于高性能计算技术领域。该方法通过基于GPU创建多个线程块,线程块中的线程并行处理凸块追逐;同时通过在GPU上创建全局数据存储待变换矩阵条带化数据,既减少数据存储量增加数据局部性,又用于线程块之间进行数据同步;待所有线程块都完成自己的凸块追逐,再将全局数组中变换后的数据分别复制回矩阵A主对角线、上次对角线与下次对角线相应位置,得到三条带化矩阵,完成整个凸块追逐过程。该方法首次在GPU上实现凸块追逐,并实现了并行加速,与现有的对称条带矩阵三对角化方法相比,能够大幅提升GPU处理性能。
-
公开(公告)号:CN118917994B
公开(公告)日:2025-01-24
申请号:CN202411397918.4
申请日:2024-10-09
Applicant: 电子科技大学
IPC: G06F30/20
Abstract: 本发明提供了一种基于GPU并行加速的对称条带矩阵三对角化变换方法,属于高性能计算技术领域。该方法通过基于GPU创建多个线程块,线程块中的线程并行处理凸块追逐;同时通过在GPU上创建全局数据存储待变换矩阵条带化数据,既减少数据存储量增加数据局部性,又用于线程块之间进行数据同步;待所有线程块都完成自己的凸块追逐,再将全局数组中变换后的数据分别复制回矩阵A主对角线、上次对角线与下次对角线相应位置,得到三条带化矩阵,完成整个凸块追逐过程。该方法首次在GPU上实现凸块追逐,并实现了并行加速,与现有的对称条带矩阵三对角化方法相比,能够大幅提升GPU处理性能。
-
-