一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法

    公开(公告)号:CN114219083A

    公开(公告)日:2022-03-22

    申请号:CN202110452694.2

    申请日:2021-04-26

    Abstract: 本发明公开一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法,包括以下步骤:S1、ONNX文件向Caffe2文件的映射,得到Caffe2格式的前向传播网络,S2、根据S1中获得的前向传播网络的信息,自动生成求梯度算子,得到反向传播网络,S3、根据满足生成完整反向传播网络的需要,设计用户配置信息格式,将配置信息融入上步骤的模型定义文件中。本发明可以自动产生包括正向传播神经网络、反向传播神经网络、运行控制块和辅助算子的模型文件,从而进行训练任务。

    基于序列模式的DRAM故障关联分析方法

    公开(公告)号:CN112445636A

    公开(公告)日:2021-03-05

    申请号:CN201910832284.3

    申请日:2019-09-04

    Abstract: 本发明公开一种基于序列模式的DRAM故障关联分析方法,包括以下步骤:对故障数据库中的非DRAM故障进行过滤,获得所需的DRAM故障数据;获得DRAM故障序列数据库;建立序列DRAM故障序列数据库;采用GSP算法,设定支持度,扫描序列DRAM故障序列数据库,获取所有满足支持度要求的DRAM故障序列的支持度;筛选出DRAM严重故障与DRAM严重故障、DRAM非严重故障与DRAM严重故障的序列规则,并计算其置信度;筛选出置信度大于60%的序列规则;如果出现反映DRAM严重故障与DRAM严重故障的序列规则,则表明DRAM严重故障与DRAM严重故障存在关联性;如果未出现反映DRAM非严重故障与DRAM严重故障关联的序列规则,则表明DRAM非严重故障不会导致DRAM严重故障。本发明解决了故障分析与预测关心的预测预警问题,具备高可信性和通用性,优化了分析执行效率。

    大规模异构环境下资源环境动态部署方法

    公开(公告)号:CN112445493A

    公开(公告)日:2021-03-05

    申请号:CN201910800979.3

    申请日:2019-08-28

    Abstract: 本发明公开一种大规模异构环境下资源环境动态部署方法,包括以下步骤:S1、镜像管理系统生成若干基础镜像模板;S2、资源管理系统在物理节点上运行精简操作系统;S3、资源管理系统将资源环境需求发送给精简操作系统;S4、精简操作系统将该资源环境需求规格化为相应的配置文件和配置脚本;S5、精简操作系统在物理节点上按配置文件快速部署所需资源环境的镜像;S6、精简操作系统中获取对应的配置脚本;S7、运行配置脚本,完成对资源管理系统需求的资源环境的部署;S8、当资源管理系统的资源环境需求发生改变时,转到S3执行。本发明解决了传统大规模异构环境下节点资源启动时间长、用户运行环境需求多样从而导致的用户资源环境繁琐复杂、重构时间过长的问题。

    一种基于差异识别的并行系统局部迁移容错方法

    公开(公告)号:CN105468457A

    公开(公告)日:2016-04-06

    申请号:CN201510830319.1

    申请日:2015-11-24

    CPC classification number: G06F9/5016 G06F11/203

    Abstract: 一种基于差异识别的并行系统局部迁移容错方法包括:系统启动并行作业迁移容错并申请新的资源用于作业迁移;作业管理进行迁移前准备;并行文件系统进行飞行数据驱赶及状态保留;并行语言库进行消息驱赶及任务同步;并行语言库提取出需要迁移的关键信息,并通知到系统核心,并通知作业管理作业任务已经做好迁移准备;作业管理调用系统核心接口进行作业任务迁移,系统核心仅仅将系统核心状态与作业任务进程信息传送到目标节点,并恢复包含关键信息的作业任务进程;在目标节点,并行文件系统根据迁移前记录的描述符再次打开对应的文件,恢复文件环境,并行语言根据系统核心恢复的关键信息,恢复作业运行环境;作业管理重构作业,恢复作业的继续运行。

    一种针对深度学习半精度算子数据访存对界处理方法

    公开(公告)号:CN114218141B

    公开(公告)日:2024-02-02

    申请号:CN202110479722.X

    申请日:2021-04-30

    Abstract: 本发明公开一种针对深度学习半精度算子数据访存对界处理方法,针对深度学习中算子的计算特点和张量空间分布,对多维张量的特定维度做4B对界处理,将四维张量的输入数据按照实际参与计算的维度分为不同的类,分别使用不同的半精度数据对界处理方法;具体为,根据输入的算子类型和输入数据的计算维度,选择不同的对界方法。本发明解决了异构众核平台上半精度算子DMA访存的不对界问题,且不仅能降低内存空间的占用,还能有效减少对界处理的时间,提升对界处理的性能。

    深度神经网络模型并行模式选择方法

    公开(公告)号:CN112541584B

    公开(公告)日:2022-10-04

    申请号:CN201910897718.8

    申请日:2019-09-23

    Abstract: 本发明公开一种深度神经网络模型并行模式选择方法,包括以下步骤:S1、测算整个神经网络模型的总数据量;S2、判断S1中获得的神经网络模型的总数据量是否超过进行训练的单个计算节点的可用内存总量,如果不超过,执行S3,如果超过,执行S4;S3、选择数据并行模式;S4、将神经网络模型的网络层进行切分,根据切分的结果,得到神经网络模型所需要分布的计算节点数量,如果输入参数中的计算节点数量不足模型切分所需节点数量两倍以上,执行S5,否则执行S6;S5、选择模型并行模式;S6、选择包括数据并行和模型并行的混合并行模式。本发明通过对模型参数、超参数和数据量的信息采集和分析,实现分布式扩展并行模式的自动选择,并且保证较高的并行性能。

    众核实现的超越函数处理方法
    27.
    发明公开

    公开(公告)号:CN114564973A

    公开(公告)日:2022-05-31

    申请号:CN202210197587.4

    申请日:2022-03-02

    Abstract: 本发明公开一种众核实现的超越函数处理方法,包括以下步骤:步骤1、通过一定的数学变换,将超越函数转换为常用的基本函数的复合运算实现;步骤2、利用数学函数的性质,将经过步骤1转换后的超越函数按照多项式的形式展开计算,获得相应的多项式函数实现;步骤3、结合函数特性,将超越函数的输入区间分解为若干个收敛区间,采用近似多项式逼近的方式,将步骤2中生成的无穷多项式系数降低到有限数量的多项式系数,在每个收敛区间中用近似多项式函数来拟合步骤2中得到的超越函数展开的多项式函数,通过误差逼近来获得收敛区间的范围以及对应的近似多项式函数的系数。本发明可以在处理器上实现不同精度的超越函数计算。

    一种针对深度学习半精度算子数据访存对界处理方法

    公开(公告)号:CN114218141A

    公开(公告)日:2022-03-22

    申请号:CN202110479722.X

    申请日:2021-04-30

    Abstract: 本发明公开一种针对深度学习半精度算子数据访存对界处理方法,针对深度学习中算子的计算特点和张量空间分布,对多维张量的特定维度做4B对界处理,将四维张量的输入数据按照实际参与计算的维度分为不同的类,分别使用不同的半精度数据对界处理方法;具体为,根据输入的算子类型和输入数据的计算维度,选择不同的对界方法。本发明解决了异构众核平台上半精度算子DMA访存的不对界问题,且不仅能降低内存空间的占用,还能有效减少对界处理的时间,提升对界处理的性能。

    异构众核处理器温度报警的多级处理方法

    公开(公告)号:CN112445154B

    公开(公告)日:2021-09-17

    申请号:CN201910794749.0

    申请日:2019-08-27

    Abstract: 本发明公开一种异构众核处理器温度报警的多级处理方法,包括以下步骤:处理器的监测系统通过温度传感器实时检测处理器的温度信息,并将检测到的温度信息传输至监测系统;当监测系统接收到的温度信息的数值高于设定的温度阈值时,发出报警信息,并对出现预警的处理器节点的主核和从核进行降频降压操作,并在降频降压操作过程中跟踪记录相应处理器节点的温度信息;在设定的时间区间内,比较处理器节点的温度信息和设定的温度阈值,如果处理器节点的温度信息的数值低于设定的温度阈值,则将处理器恢复至正常运行状态,否则,执行下一步。本发明采用多级处理方法避免了过早采取开销较大的控制手段,兼顾了有效性和开销。

Patent Agency Ranking