-
公开(公告)号:CN115576643A
公开(公告)日:2023-01-06
申请号:CN202211197732.5
申请日:2022-09-29
Applicant: 北京大学
IPC: G06F9/455
Abstract: 本发明涉及一种基于PML的虚拟机页表追踪方法和系统。该方法包括:在虚拟机中,通过扫描驻留集大于1GB的进程获取虚拟机负载使用的页表页并将其传输回Hypervisor以获取监控目标;周期性地对虚拟机页表页清除EPT中的Dirty bit及其包含的虚拟机页表项清除Access bit和Dirty bit,利用Intel PML技术高效获取发生写操作的页表页条目,进一步扫描其中的虚拟机页表项从而获取本周期内发生读写操作的页面;提出多级队列算法以加速追踪效率。本发明所提出的方案充分利用Intel PML的硬件特性追踪客户机被使用的页表,缓解了传统页表扫描方法需要遍历虚拟机所有页表的开销;使用多级队列算法对追踪页面进行筛选,极大的降低了需要置位页面的数量,进一步降低了整体追踪的开销。
-
公开(公告)号:CN110287014B
公开(公告)日:2022-12-09
申请号:CN201910566072.5
申请日:2019-06-27
Applicant: 北京大学深圳研究生院 , 鹏城实验室
Abstract: 本发明涉及数据处理技术领域,具体涉及一种计算机系统内存带宽调度方法、系统及存储介质,其中方法包括:获取当前系统物理核上运行的每个程序的性能信息和其所占用的初始带宽;对所有程序按照其所占用的初始带宽的大小进行聚类处理,将其分成带宽污染型和带宽敏感型,对带宽污染型中的至少部分程序进行限流处理,判断限流处理后系统整体的性能是否提高,若否则结束调度;若限流处理后系统整体的性能有提高,则对带宽敏感型中所有程序重新进行聚类处理,重复上述步骤,直到结束调度。本申请的内存带宽调度方法优先对占用内存带宽较大的程序进行限流,保证了多核计算机系统可以同时部署多个程序,且提高了系统整体的性能。
-
公开(公告)号:CN114840299A
公开(公告)日:2022-08-02
申请号:CN202110144319.1
申请日:2021-02-02
Applicant: 北京大学
IPC: G06F9/455 , G06F12/1009
Abstract: 本发明涉及一种申威架构下的改进嵌套页表内存虚拟化方法与系统。该方法包括:在查询TLB发生TLB未命中时,MMU访问四级客户机进程页表进行页表查询,在每一级的访问中,都需要首先访问NPT MMU进行嵌套页表查询,通过平滑嵌套页表将客户机物理地址转换为宿主机物理地址;在嵌套页表查询出现映射缺失时,CPU切换客户机上下文到宿主机上下文中以进行嵌套页表缺页中断处理。本发明所提出的方案基于申威架构特点尤其是可编程接口的特性,继承了传统嵌套页表模型复杂度低、页表同步开销小的优势并且消除了传统嵌套页表模型因多次页表查询而产生的访存开销;不需要复杂的硬件支持,也不会和影子页表模型一样引入额外的页表同步开销。
-
公开(公告)号:CN112363960B
公开(公告)日:2022-07-22
申请号:CN202011085016.9
申请日:2020-10-12
IPC: G06F12/1009 , G06F9/455 , G06F9/50
Abstract: 本发明涉及一种新型基于影子页表机制的内存虚拟化方法与系统。该方法的步骤包括:捕获客户机操作系统发出的TLB刷新指令,并解码TLB刷新指令,以相同的粒度使相应的影子页表项无效;当CPU访问TLB发生TLB未命中时,内存管理单元查询影子页表,在发现相应的影子页表项无效后,进行缺页处理来修正影子页表;利用缺页处理后的影子页表完成客户机虚拟地址到宿主机物理地址的地址转换。本发明利用TLB与影子页表同时刷新的方式来同步影子页表与客户机进程页表,从根本上消除了传统影子页表的写保护同步开销大的弊端,同时相较于硬件辅助虚拟化技术,无需引入额外的页表查询开销,显著提高了内存虚拟化效率。
-
公开(公告)号:CN111258927B
公开(公告)日:2022-05-03
申请号:CN201911309038.6
申请日:2019-12-18
IPC: G06F12/0802 , G06F12/0893
Abstract: 本发明提出一种基于采样的应用程序CPU末级高速缓存缺失率曲线的预测方法,属于计算机体系结构领域,包括以下步骤:让目标程序在处理器上运行,设计一组访存模式可控的微程序来访问指定末级高速缓存LLC组,与目标程序在指定LLC组发生资源竞争;通过采样收集一段时间内不同LLC组上的缓存缺失数量;通过控制微程序的访存模式改变它所占用的缓存块数量,改变目标程序所在指定LLC组上占用的缓存大小;计算未被微程序影响的LLC组上的缓存缺失数与受影响的组上缓存缺失数之差,据此得到目标程序的缺失率曲线。本方法既能消除事离线探测方法的局限性,又能避免在线预测方法对程序性能的干扰。
-
公开(公告)号:CN110865869B
公开(公告)日:2022-05-03
申请号:CN201911070571.1
申请日:2019-11-05
Applicant: 北京大学
IPC: G06F9/455 , G06F11/30 , G06F11/32 , G06F11/34 , G06F12/1027 , G06F12/123
Abstract: 本发明公开了一种申威架构上的虚拟机访存特征提取方法及系统,其通过“热页集”机制、“置位‑中断”方法和“访存失效率曲线”构建方法,获取虚拟机访存序列的重用距离分布、内存缺页率、访内存缺页率曲线,得到虚拟机工作集大小。本发明在申威平台上首次实现了动态访存特征提取提取技术,成功地绘制高精度的内存缺失率曲线并计算出准确的工作集大小,为下一步根据工作集大小进行有效的多虚拟机内存动态调配以提高内存利用率提供基础条件。
-
公开(公告)号:CN112817722A
公开(公告)日:2021-05-18
申请号:CN202110141136.4
申请日:2021-02-01
Abstract: 本发明公开了一种基于优先级的分时调度方法、终端及存储介质,方法包括:确定各个待调度任务的所属用户;获取第一预设时长内各个用户已运行任务的时长,根据各个用户已运行任务的时长在各个待调度任务中确定目标任务;为目标任务分配运行资源。本发明在对各个用户的任务进行调度时,根据一定时长内各个用户已经运行任务的时长确定当前需要被分配运行资源的任务,可以实现各个用户的任务完成进度更平均。
-
公开(公告)号:CN108241472B
公开(公告)日:2021-03-12
申请号:CN201711250255.3
申请日:2017-12-01
Applicant: 北京大学
Abstract: 本发明涉及一种支持局部性表达函数的大数据处理方法和系统。该方法包括以下步骤:1)发掘大数据处理系统中所处理的数据的局部性,形成局部性表达函数;2)将局部性表达函数部署在大数据处理系统中;3)大数据处理系统按照局部性表达函数分配工作任务。所述大数据处理系统采用分布式存储方式或集中式存储方式;所述局部性表达函数在在大数据处理系统中的部署方式分为两种类型:内置式冷启动模式、外置式热插拔模式。本发明通过发掘数据中隐藏的局部性,并且使用自定义的局部性函数表达出来,最终被大数据处理系统识别,按照局部性来分配机器执行任务,从而达到优化处理效率。
-
公开(公告)号:CN112363824A
公开(公告)日:2021-02-12
申请号:CN202011084199.2
申请日:2020-10-12
IPC: G06F9/50 , G06F12/1009 , G06F9/455
Abstract: 本发明涉及一种申威架构下的内存虚拟化方法与系统。该方法包括:建立存储影子页表基地址的缓冲区;当CPU查询TLB发生TLB未命中时,CPU访问所述缓冲区获取当前进程的影子页表基地址,将影子页表基地址加载进入内存管理单元,开始页表查询;当页表查询中出现映射缺失时,CPU切换客户机上下文到宿主机上下文中以进行缺页中断处理;将缺页中断处理后获得的虚实地址转换映射直接填入相应的TLB,实现TLB预取;CPU再次查询TLB,完成客户机虚拟地址到宿主机物理地址的地址转换。本发明基于申威架构软件管理的TLB特性,实现了影子页表和TLB的同时刷新,从而实现了影子页表和客户机进程页表的同步。
-
公开(公告)号:CN111783976A
公开(公告)日:2020-10-16
申请号:CN202010317078.1
申请日:2020-04-21
Abstract: 本发明涉及一种基于窗口梯度更新的神经网络训练过程中间值存储压缩方法和装置。该方法在神经网络训练的前向传播过程中,选择部分通道的输入激活值保存在内存中;在神经网络训练的反向传播过程中,利用保存的部分通道的输入激活值计算梯度,以更新神经网络的权重参数。通过窗口选择所述部分通道,通过超参数网络稠密度决定窗口大小,即窗口内包含的通道数占总通道数的比例。通过窗口选择所述部分通道的步骤包括:确定窗口的起始位置;根据网络稠密度确定窗口大小。本发明对神经网络训练时需要保存的激活值进行存储优化,能够大幅降低内存成本,提高训练深度更深、规模更大的神经网络的能力,同时也可以在内存受限的设备上在线训练网络。
-
-
-
-
-
-
-
-
-