一种Cache一致性极限测试方法

    公开(公告)号:CN105446840B

    公开(公告)日:2019-02-12

    申请号:CN201510827235.2

    申请日:2015-11-24

    Abstract: 本发明提供了一种Cache一致性极限测试方法,包括:执行Cache的规模和结构配置,其中根据Cache大小、Cache行长度、相连路组的数量以及一致性策略,确定Cache一致性极限测试的粒度、访存顺序和访存的Cache入口地址,而不遍历整个Cache;设置用于精确错误定位的初始值和数据还原运算,其中采用地址作为初始值,数据还原操作采用拍数最少的移位运算;设置多粒度高密度访存方式,其中使得Cache的操作以Cache行为单位,不同的处理器以并行进程同时或交替对同一个Cache行进行访存;设置与系统相关的Cache协议验证。

    一种低延迟旁路的消息优化方法

    公开(公告)号:CN109117288A

    公开(公告)日:2019-01-01

    申请号:CN201810928707.7

    申请日:2018-08-15

    Abstract: 本发明公开一种低延迟旁路的消息优化方法,该方法采用旁路方式,对于满足一定长度要求的用户消息请求,采用快速旁路方式处理,减少用户函数到底层消息操作的调用层次;同时,不在通信支撑环境中对用户消息数据以及包头进行组包操作,而是将这些信息直接写入网络接口芯片的短快消息通路条目中,减少硬件读取描述符并访问用户数据的传输启动开销。本发明能够充分利用底层硬件的短快消息通路,在降低硬件处理开销的同时,从软件层面尽量减少消息数据的启动和处理开销,有效降低短消息通信延迟。

    一种Cache一致性极限测试方法

    公开(公告)号:CN105446840A

    公开(公告)日:2016-03-30

    申请号:CN201510827235.2

    申请日:2015-11-24

    CPC classification number: G06F11/2205 G06F11/2247 G06F11/2294 G06F11/263

    Abstract: 本发明提供了一种Cache一致性极限测试方法,包括:执行Cache的规模和结构配置,其中根据Cache大小、Cache行长度、相连路组的数量以及一致性策略,确定Cache一致性极限测试的粒度、访存顺序和访存的Cache入口地址,而不遍历整个Cache;设置用于精确错误定位的初始值和数据还原运算,其中采用地址作为初始值,数据还原操作采用拍数最少的移位运算;设置多粒度高密度访存方式,其中使得Cache的操作以Cache行为单位,不同的处理器以并行进程同时或交替对同一个Cache行进行访存;设置与系统相关的Cache协议验证。

    一种处理器性能筛选方法
    24.
    发明公开

    公开(公告)号:CN114253705A

    公开(公告)日:2022-03-29

    申请号:CN202110381442.5

    申请日:2021-04-09

    Abstract: 本发明公开一种处理器性能筛选方法,包括以下步骤:将待筛选的处理器划分为n个子集;判断性能筛选是否完成;将处理器Pij的性能记为Aij;将子集i内所有处理器的性能值收集到根节点r,作为待分类的样本;选取分类数k,设置分类终止条件为k_thres;对于每个样本Aij,计算其到每个初始质心的欧式距离;S8、对于每个类别t,重新计算属于该类别的样本S[t]的平均值;对于每个类别t,将经过本轮筛选后剩余的处理器作为待筛选处理器,累加筛选总时间或筛选轮次,回到S1。本发明灵活性强、鲁棒性好,显著减少人为干预、利于筛片自动化,降低筛片人员工作负担和误操作可能,有助于提高筛片效率和效果。

    异步通信优化方法
    25.
    发明公开

    公开(公告)号:CN114217939A

    公开(公告)日:2022-03-22

    申请号:CN202110381609.8

    申请日:2021-04-09

    Abstract: 本发明公开一种异步通信优化方法,S1、判断物理资源是否满足大于等于用户程序所需进程数2倍的条件;S2、为用户程序的各个进程间隔分配控制核心作为进程控制核心,并在每个用户进程之间启用一个空闲的控制核心作为专用控制核心,所述进程控制核心与所述专用控制核心组成与用户进程一一对应的异步控制核心;S3、实现单个进程控制核心与多个运算核心阵列的逻辑组合;S6、当位于进程控制核心的用户程序进程(主线程)进行与位于专用控制核心的通信探查服务关键互斥操作时,对线程信号量置1,以主动抢锁并进行关键互斥操作,抢锁成功后信号量置0,允许通信探查服务继续竞争线程锁。本发明可有效提升通信密集型大规模并发应用的整体性能。

    一种DNN算子库动态数据分块方法
    26.
    发明公开

    公开(公告)号:CN114217916A

    公开(公告)日:2022-03-22

    申请号:CN202110453158.4

    申请日:2021-04-26

    Abstract: 本发明公开一种DNN算子库动态数据分块方法,包括以下步骤:S1、用户调用所需算子,并传入一组由多个整数组成的参数,作为S2的输入;S2、根据S1中获取的参数大小和算法的参数适用范围,将一组参数划分为多组参数,并为各组参数选择不同的算法进行处理;S3、从S2获得参数,根据算法特点,为参数中各个维度[N,H,W,C]的数据设置优先级;S4、在保证内存充裕的前提下,将[N,H,W,C]按照参数中各个数据的优先级从高到低的顺序,依次增加其分块的大小;S5、将动态选择好的数据分块传递给对应的算法,调用算法,得出结果。本发明保证了算子性能的最佳发挥,不需要用户担忧众多算法如何抉择的问题,具有良好的用户体验。

    基于异构众核处理器的卷积计算数据重用方法

    公开(公告)号:CN112559197A

    公开(公告)日:2021-03-26

    申请号:CN201910852525.0

    申请日:2019-09-10

    Abstract: 本发明公开一种基于异构众核处理器的卷积计算数据重用方法,CPU通过数据块A和数据块B完成数据块C的卷积计算,包括以下步骤:S1、根据异构众核处理器的内核数,二维映射成N*N个,将数据块A、数据块B、数据块C划分为N*N块,第(i,j)号内核将第(j,i)块数据从内存读取到自己的片上存储器内,数据块C(i,j)的卷积计算需要数据块A(i,k)和数据块B(k,j),其中k=1,2,……,N;S2、进入循环k,循环次数从1到N,共N次,利用得到的数据块A、数据块B完成数据块C的第K次卷积计算。本发明显著降低卷积计算在异构众核处理器上的内存访存需求,充分发挥众核计算能力,从而实现卷积计算高性能,提升其在异构众核处理器上的计算性能。

    基于序列号机制的消息保序方法

    公开(公告)号:CN112448898A

    公开(公告)日:2021-03-05

    申请号:CN201910799268.9

    申请日:2019-08-28

    Abstract: 本发明公开一种基于序列号机制的消息保序方法,包括以下步骤:S1、每进行一次异步消息发送操作时,发送端将当前的发送序列号打包入包头,并将发送序列号加1;S2、接收端每成功接收一次异步消息,将当前的接收序列号和包头中携带的发送序列号进行比对;S3、成功处理按序到达的消息请求后,将接收端的消息序列号生成器的值加1,并对乱序到达队列内的元素查找是否有匹配当前接收序列号的元素;S4、如果认定为一次异步消息的乱序到达,将该次接收完成的消息缓冲区加入乱序到达队列,待后续消息到达并更新接收序列号后进行处理。本发明既可以有效保证通信通路的并发,也可以有效解决底层互连架构带来的消息序问题,同时序列号生成及匹配对于性能的影响非常小。

    一种异构众核系统上的流水式通信并行方法

    公开(公告)号:CN105528253A

    公开(公告)日:2016-04-27

    申请号:CN201510831794.0

    申请日:2015-11-24

    CPC classification number: G06F9/546

    Abstract: 本发明提供了一种异构众核系统上的流水式通信并行方法,包括:分析并行应用的数据,把逻辑上有关联的数据划分为一块;确定一块数据上的相关性顺序。在该块数据上的相关性顺序是先通信后计算的情况下,每个处理器上的进程首先由控制核心启动对该块数据的通信处理,计算核心等待控制核心对该块数据的通信完成;计算核心收到控制核心针对该块数据通信完成的标志后开始该块数据的计算,同时控制核心开始下一块数据的通信;按照这个步骤的处理以此类推,直到所有的数据块都完成计算和通信。

Patent Agency Ranking