-
公开(公告)号:CN117874241B
公开(公告)日:2024-05-17
申请号:CN202410278591.2
申请日:2024-03-12
Applicant: 北京大学
Abstract: 本发明公布了一种基于DRAM‑PIM查表式神经网络推理与调优的文本分类方法及系统,包括宿主处理器、控制器和存内计算PIM模块;基于DRAM存内计算架构,通过设计查表式神经网络LUT‑NN算法的算子,实现算法的高效推理,进一步通过自动调优算法获得查表式神经网络在不同场景部署时的最优数据流参数,实现推理参数的高效调优;再通过神经网络推理得到文本分类结果。采用本发明的技术方案,能够发挥硬件平台执行基于LUT‑NN的文本分类任务的能力,提升对不同文本分类场景的兼容性。
-
公开(公告)号:CN111966497B
公开(公告)日:2023-02-24
申请号:CN202010861083.9
申请日:2020-08-25
Applicant: 北京大学
IPC: G06F9/50
Abstract: 本发明公布了一种广域网环境中分布式系统的计算任务分配方法,系统包括多个数据源节点、数据汇节点、数据源节点与数据汇节点之间的中间节点;系统中由数据汇节点发起新任务;数据流由数据源节点产生,在中间节点完成计算,最后流入到数据汇节点;通过对相邻节点的计算任务进行调整与分配,使得数据流中各个数据条目从生成到完成使用的计算时间尽可能接近,动态分配各个节点所承载的计算量。采用本发明技术方案,无需引入中心化调度节点,而通过相邻计算节点之间的任务交换,自动调节系统中各个节点的任务量分配,可避免因少数调度节点故障而导致的系统整体不可用问题,同时提高广域网环境的分布式计算系统的可扩展性。
-
公开(公告)号:CN113568845A
公开(公告)日:2021-10-29
申请号:CN202110862708.8
申请日:2021-07-29
Applicant: 北京大学
Abstract: 本发明公布了一种基于强化学习的内存地址映射方法,建立基于地址映射矩阵BIM交换的强化学习神经网络模型,并使用策略梯度的方法有效地训练模型,通过强化学习对不同的程序自动找到内存地址映射。采用本发明提供方法,可以对不同的程序自动找到最合适的映射方法,能够克服现有方法不能根据不同的程序自动做出调整,且需要依靠专业人士的经验来设计,不能达到自动的效果的不足。
-
公开(公告)号:CN105426316B
公开(公告)日:2018-02-13
申请号:CN201510782745.2
申请日:2015-11-09
Applicant: 北京大学
Abstract: 本发明公开了一种基于配额控制温度的赛道存储芯片及其控制方法。本发明的赛道存储芯片包括:衬底、赛道存储条、填充层和散热装置;本发明在一个程序运行区间内设置移动配额,从而从时间上进行热点分散;并且,将一个数据块存储在互不相邻的多个赛道存储条上,从空间上进行热点分散。本发明提供了一套赛道存储器因为移动操作而导致温度上升的控制方法;综合考虑了时间、空间上的热点分散的方法,可以尽最大可能的减小芯片的温度升高;模拟显示,本发明的方法导致的性能损失平均只有5%。
-
公开(公告)号:CN105426316A
公开(公告)日:2016-03-23
申请号:CN201510782745.2
申请日:2015-11-09
Applicant: 北京大学
CPC classification number: G06F12/0246 , G06F2212/7201 , G06F2212/7209 , G11B33/1406
Abstract: 本发明公开了一种基于配额控制温度的赛道存储芯片及其控制方法。本发明的赛道存储芯片包括:衬底、赛道存储条、填充层和散热装置;本发明在一个程序运行区间内设置移动配额,从而从时间上进行热点分散;并且,将一个数据块存储在互不相邻的多个赛道存储条上,从空间上进行热点分散。本发明提供了一套赛道存储器因为移动操作而导致温度上升的控制方法;综合考虑了时间、空间上的热点分散的方法,可以尽最大可能的减小芯片的温度升高;模拟显示,本发明的方法导致的性能损失平均只有5%。
-
公开(公告)号:CN117574976A
公开(公告)日:2024-02-20
申请号:CN202410058901.X
申请日:2024-01-16
Applicant: 北京大学
IPC: G06N3/063 , G06N3/042 , G06N5/04 , G06N3/0455 , G06N3/048 , G06N3/08 , G06F16/35 , G06F16/33 , G06F18/2433
Abstract: 本发明公布了一种大语言模型软硬件协同量化加速计算方法及系统,采用以通道为粒度处理大语言模型中的离群值,将存在大量离群值的通道整体以高精度进行存储,通过自适应量化过程、编译优化过程和硬件实现过程,实现大语言模型软硬件协同推理加速,保证了数据编码的灵活性和规整性,同时易于在系统和硬件上进行实现和部署;可重构加速器系统包括:运算模块、累加模块、解码模块、控制模块、片上缓存和主存。采用本发明,既能够有效保持量化后模型的精度,又能实现硬件高效的推理计算。
-
公开(公告)号:CN112131032B
公开(公告)日:2022-02-11
申请号:CN202010887119.0
申请日:2020-08-28
Applicant: 北京大学
Abstract: 本发明公布了一种基于混合内存系统的故障快速恢复方法,混合内存系统为动态随机存取存储器DRAM和非易失性存储器NVM的混合内存系统;在混合内存系统的DRAM和NVM中各自维护一个进程栈空间;设定新的函数限定符,针对使用该新的函数限定符的应用程序实现基于混合内存系统的故障快速恢复。本发明在DRAM和NVM混合内存系统中使用双栈结构运行进程的方法,减轻现有的日志和检查点技术中存在的由于引入大量额外NVM写入从而降低系统性能和设备寿命的问题,并实现系统故障后的快速恢复。
-
公开(公告)号:CN108388498A
公开(公告)日:2018-08-10
申请号:CN201810145805.3
申请日:2018-02-12
Applicant: 北京大学
Abstract: 本发明公布了内存中计算的功率建模方法及功率管理方法,首先建立BP模型,采用每功率带宽BP表示内存中计算PIM中的带宽和功率之间的关系;功率管理方法包括功率监控子任务限制PAST、处理单元加速PUB和功率冲刺PS;当功率供应超过功率需求时,采用PAST管理PIM内功率消耗;当需要采用动态调整功率模式时采用PUB方法;当需要短时间的功率过载时,采用PS方法提高功率仲裁器的功率上限值;实现内存中计算的功率管理。采用本发明的BP模型得到的功率和实测相符,其中PAST方法能成功限制PIM的功率,PUB能成功提升芯片的性能;同时采用PAST、PUB和PS方法,能够产生更有效的能源系统,合理配置功率管理方案,进一步提升PIM的性能。
-
公开(公告)号:CN104658601A
公开(公告)日:2015-05-27
申请号:CN201510031305.3
申请日:2015-01-22
Applicant: 北京大学
Abstract: 本发明公布了一种利用自旋矩传输随机读写器(STT-RAM)存储单元错误率分布的物理不可克隆认证方法,包括预处理阶段、注册阶段和验证阶段,包括步骤:首先在预处理阶段记录STT-RAM阵列中所有EDP的位置,然后在注册阶段输入若干EDP位置,芯片电路利用这些EDP内两个单元错误率相对大小来输出参考输出,在验证阶段再次重现注册阶段,最后根据验证阶段和注册阶段的输出验证给定设备与注册阶段的设备是否相同,从而认证芯片真假。本发明提供方法在很小的硬件代价以及时间代价下,解决设备认证的问题,提高认证的可靠性。
-
公开(公告)号:CN104505124A
公开(公告)日:2015-04-08
申请号:CN201510003797.5
申请日:2015-01-06
Applicant: 北京大学
IPC: G11C19/08
Abstract: 本发明公布了一种基于亚阈值电流的磁畴壁移动控制方法及其电路,该方法将小于阈值的电流称为亚阈值电流,通过所述亚阈值电流推动磁畴壁在锚定区域外移动,作为控制磁畴壁移动位置的补充;包括单步移动模式和多步移动模式,依次包括步骤:设定锚定位,准备移动长度和所需电压;利用高阈值电流驱动磁畴壁一段时间;利用亚阈值电流再驱动磁畴壁一段时间;判断移动距离总和是否达到磁畴壁需要移动的距离,直到磁畴壁停靠在锚定位。本发明提高了赛道存储磁畴壁移动的精确性,保证了磁畴壁移动可以较快速的完成,防止了磁畴壁随机移动可能引入的问题,从而提高赛道存储的可靠性与稳定性。
-
-
-
-
-
-
-
-
-