-
公开(公告)号:CN114217943A
公开(公告)日:2022-03-22
申请号:CN202110398330.0
申请日:2021-04-14
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种通信支撑环境的初始化方法,包括以下步骤:S1、调用作业管理接口,解析本道作业的资源总数tasksize、各进程在作业中的初始资源序号Sid、资源名列表nodeidlist、资源片内唯一标识mpeidlist、pid列表pidlist、网络设备标识列表guidlist,并按资源列表自然序排列;S2、根据各进程的初始资源序号Sid计算Sid%cg_per_process,从作业系统返回信息中提取满足模cg_per_process为0的进程的相关信息。本发明有助于支撑用户求解更大的问题规模、追求更高的性能,且实现简便,不影响消息性能,用户调用消息接口时无额外开销。
-
公开(公告)号:CN114217915A
公开(公告)日:2022-03-22
申请号:CN202110398335.3
申请日:2021-04-14
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种异构众核上基于主‑从模型的轻量级多线程机制,设置四种线程状态,分别为初始化、等待任务、任务完成和线程退出;在共享内存上开辟长整形数组;在共享内存上开辟数组,用于线程组内主线程向从属线程传递参数;根据主线程及其从属线程核组号,设置每个线程组的掩码cgmask,掩码有CG_NUM位;使用共享模式运行并行程序,每个核组为一个进程;当需要退出线程状态时,主线程调用Master_leave接口;执行完毕后,各核组恢复进程状态,可以根据进程号继续执行任务。本发明为用户提供了方便使用、更加灵活、开销更低的片内多线程解决方案。
-
公开(公告)号:CN114217686A
公开(公告)日:2022-03-22
申请号:CN202110453264.2
申请日:2021-04-26
Applicant: 无锡江南计算技术研究所
IPC: G06F1/3234 , G06F7/483 , G06F17/15
Abstract: 本发明公开一种稠密卷积运算核心的低功耗方法,包括以下步骤:S1、分析平台指令特点,得到指令流数据重用高的数据存储格式P;S2、判断卷积输入数据是否为P存储格式,如果是,则跳转到S3;S3、将输入数据整理成P存储格式;S4、在指令级通过数据重用调用P存储格式的运算核心进行运算。本发明在不损失高功耗课题效率的同时,显著降低了对存储部件的数据访存频次,从而降低存储部件数据访问的功耗,进而显著降低高功耗课题的CPU运行功耗,缓解功耗墙难题、节约能耗。
-
公开(公告)号:CN117394863A
公开(公告)日:2024-01-12
申请号:CN202311403458.7
申请日:2023-10-26
Applicant: 无锡江南计算技术研究所
Abstract: 本申请涉及一种面向众核处理器的压缩感知稀疏重构加速方法。所述方法包括:获取待采样数据的待采样信号,并确定待采样信号的初始稀疏向量;当对待采样信号进行压缩感知时,从内存读取第一测量矩阵和第二测量矩阵,对第一测量矩阵和第二测量矩阵进行张量积运算,生成测量矩阵,其中,测量矩阵为克罗内克结构;根据生成的测量矩阵对初始稀疏向量进行迭代更新,直至满足终止阈值条件,得到目标稀疏向量,以实现待采样信号的压缩感知稀疏重构。采用本方法可以减轻信号处理过程中内存的负担,提高压缩感知的运行效率和数据处理速率,灵活处理数据,具有可扩展性。
-
公开(公告)号:CN114253705A
公开(公告)日:2022-03-29
申请号:CN202110381442.5
申请日:2021-04-09
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种处理器性能筛选方法,包括以下步骤:将待筛选的处理器划分为n个子集;判断性能筛选是否完成;将处理器Pij的性能记为Aij;将子集i内所有处理器的性能值收集到根节点r,作为待分类的样本;选取分类数k,设置分类终止条件为k_thres;对于每个样本Aij,计算其到每个初始质心的欧式距离;S8、对于每个类别t,重新计算属于该类别的样本S[t]的平均值;对于每个类别t,将经过本轮筛选后剩余的处理器作为待筛选处理器,累加筛选总时间或筛选轮次,回到S1。本发明灵活性强、鲁棒性好,显著减少人为干预、利于筛片自动化,降低筛片人员工作负担和误操作可能,有助于提高筛片效率和效果。
-
公开(公告)号:CN114217916A
公开(公告)日:2022-03-22
申请号:CN202110453158.4
申请日:2021-04-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种DNN算子库动态数据分块方法,包括以下步骤:S1、用户调用所需算子,并传入一组由多个整数组成的参数,作为S2的输入;S2、根据S1中获取的参数大小和算法的参数适用范围,将一组参数划分为多组参数,并为各组参数选择不同的算法进行处理;S3、从S2获得参数,根据算法特点,为参数中各个维度[N,H,W,C]的数据设置优先级;S4、在保证内存充裕的前提下,将[N,H,W,C]按照参数中各个数据的优先级从高到低的顺序,依次增加其分块的大小;S5、将动态选择好的数据分块传递给对应的算法,调用算法,得出结果。本发明保证了算子性能的最佳发挥,不需要用户担忧众多算法如何抉择的问题,具有良好的用户体验。
-
公开(公告)号:CN114218521A
公开(公告)日:2022-03-22
申请号:CN202110452546.0
申请日:2021-04-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种异构众核架构上基于膨胀取数的卷积运算方法,包括以下步骤:S1、输入input、权重weight、跨步stride,其中input为Hi*Wi,weight为K*K,根据input和weight的形状计算输出output的形状,得到Ho*Wo;S2、根据output的形状,在Ho、Wo维度上,根据每个核的逻辑编号,将卷积计算任务平均分配给众核;S3、每个核根据自己任务大小;S4、每个核通过得到的input(Hi_BLOCK*Wo_BLOCK)和weight,进行卷积计算;S5、重复S3和S4,直到计算完毕。本发明节约了内存带宽资源,同时能够充分运用众核的计算资源。
-
-
-
-
-
-