-
公开(公告)号:CN113706366B
公开(公告)日:2024-02-27
申请号:CN202110873716.2
申请日:2021-07-30
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06T1/20 , G06F9/30 , G06F9/38 , G06N3/0464 , G06N3/063
Abstract: 本申请提供一种图像特征数据的提取方法,包括:获取图像特征数据,并确定相应的并行通道数;将所述并行通道数作为所述图像特征数据的深度,增大所述图像特征数据的高度;利用FPGA的预设数量个RAM作为DDR的第一级缓存进行数据复用;在所述第一级缓存后端配置与卷积核相对应的寄存器,利用所述寄存器逐行输出所述图像特征数据。本申请能最大限度提高DDR的读写效率,实现流水线不间断数据输出,同时降低了DDR的数据读取压力,能满足后端高带宽卷积计算单元的输入需求。本申请还提供一种图像特征数据的提取系统、计算机可读存储介质和电子设备,具有上述有益效果。
-
公开(公告)号:CN113726741B
公开(公告)日:2024-01-19
申请号:CN202110856493.9
申请日:2021-07-28
Applicant: 浪潮电子信息产业股份有限公司
Abstract: 本申请公开了一种加速卡数据下载方法,包括:CPLD从数据发送装置接收加密信息;基于本地的解密算法对所述加密信息进行解密,得到唯一识别码;判断所述唯一识别码与加速卡的存储器中的识别码是否相同;若是,则在所述加速卡与所述数据发送装置之间建立硬件物理连接,以便所述数据发送装置通过所述硬件物理连接将数据发送至所述加速卡,以提高FPGA中的程序的安全性,避免FPGA中程序的泄漏。本申请还公开了一种加速卡数据下载装置,服务器以及计算机可读存储介质,具有以上有益效果。
-
公开(公告)号:CN116167425B
公开(公告)日:2023-08-04
申请号:CN202310458254.7
申请日:2023-04-26
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06N3/063
Abstract: 本申请公开了一种神经网络加速方法、装置、设备及介质,应用于深度学习技术领域,包括:从神经网络的目标特征数据中确定有效数据矩阵;所述有效特征矩阵中包含至少一个有效特征数据;将所述有效数据矩阵中的有效特征数据,以及权重矩阵中与所述有效特征数据对应的权重数据进行分组,以得到数据组;将所述数据组输入预设计算引擎阵列,并利用所述预设计算引擎阵列对所述数据组进行运算,得到卷积结果。这样,能够避免无效数据引起延时的情况下,兼容稀疏和稠密数据,从而实现神经网络加速的优化。
-
公开(公告)号:CN114140618A
公开(公告)日:2022-03-04
申请号:CN202111276841.1
申请日:2021-10-29
Applicant: 浪潮电子信息产业股份有限公司
Abstract: 本申请公开了一种卷积特征缓存方法、装置、电子设备及计算机可读存储介质,该方法包括:获取多个卷积特征,并将卷积特征写入缓存空间;其中,缓存空间包括多个缓存单元,各个缓存单元呈二维矩阵排布,每个缓存单元用于存储一个卷积特征;若检测到缓存空间被读取,则按照横向循环方向,对各个矩阵行中的卷积特征进行横向偏移;若检测到横向偏移次数处于第一区间,则按照纵向循环方向,对各个矩阵列中的卷积特征进行纵向偏移,并将横向偏移次数清零;若检测到纵向偏移次数处于第二区间,则确定数据调用完毕;可以无需频繁地从外部存储介质中获取卷积特征,一次缓存较多卷积特征,并将其最大化利用,高效地提供大量用于卷积计算的卷积特征。
-
公开(公告)号:CN111723906A
公开(公告)日:2020-09-29
申请号:CN202010476888.1
申请日:2020-05-29
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06N3/04
Abstract: 本申请提供一种循环神经网络的加速计算方法,包括:获取所述循环神经网络的参数矩阵乘式;对所述参数矩阵乘式中的乘数和被乘数进行分割,得到二维矩阵;将所述二维矩阵按照预设顺序输入至三维脉动阵列;根据所述三维脉动阵列确定所述参数矩阵乘式的输出结果。本申请大大缩短了大尺寸矩阵相乘的计算时间,缩减了计算所需的硬件资源。本申请还提供一种循环神经网络的加速计算系统、计算机可读存储介质和终端,具有上述有益效果。
-
公开(公告)号:CN119719595A
公开(公告)日:2025-03-28
申请号:CN202510245690.5
申请日:2025-03-04
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F17/15 , G06N3/092 , G06N3/063 , G06N3/0464 , G06F17/16
Abstract: 本发明公开了一种数据处理方法、电子设备、介质及计算机程序产品,涉及计算机技术领域,包括:首先以批次为要素排列特征数据块,以输出通道为要素排列权重数据块,可在卷积计算能更有序访问特征数据和权重数据,然后通过判断网络数据规模与设定阈值大小,选择合适存储模式;数据规模小于设定阈值时用片上存储模式加载数据后进行卷积计算,能减少数据读取延迟,提升计算响应速度;数据规模大时采用片外访存模式边加载数据边卷积计算,避免因等待数据全部加载完成而造成的计算资源闲置。这样能够将强化学习前端进行特征提取的卷积计算部分协同部署到分块矩阵计算架构上,实现资源复用,有效降低硬件实现的复杂度和硬件资源的消耗。
-
公开(公告)号:CN119646525A
公开(公告)日:2025-03-18
申请号:CN202510162788.4
申请日:2025-02-14
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F18/214 , G06F18/25 , G06N3/042 , G06N3/08
Abstract: 本发明公开了一种应用于人工智能技术中的数据关联关系确定方法、系统、设备、介质及程序产品,方法包括将数据关联任务的待关联数据和关联数据信息中的各源数据作为节点特征,输入至关联关系识别模型。对关联关系识别模型进行图采样,基于目标多项式对各采样节点及其相邻邻居节点的特征信息进行聚合,并根据当前聚合特征确定当前图采样对应的各采样节点之间的关联关系识别结果;根据各关联关系识别结果,为待关联数据在关联数据信息中确定具有关联关系的目标数据。本发明可以解决相关技术任务精度和任务执行效率无法兼顾的问题,在提高数据关联关系确定任务执行效率的基础上,确保输出高精度的数据关联结果。
-
公开(公告)号:CN114862683B
公开(公告)日:2022-12-09
申请号:CN202210791426.8
申请日:2022-07-07
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06T3/40 , G06T7/11 , G06V10/774
Abstract: 本申请涉及大场景超分辨率图像目标检测技术领域,公开了一种模型生成方法、目标检测方法、装置、设备及介质,模型生成方法包括:利用各超分辨率图像的真实框构成各图像的样本集合;从样本集合中选择一真实框,根据选择的真实框对超分辨率图像裁切,得到裁切图像;从超分辨率图像的样本集合中删除裁切图像包含的真实框,返回执行从样本集合中选择一真实框的步骤,直至样本集合为空集;利用各超分辨率图像的裁切图像及其包含的真实框作为第一训练集,对第一模型进行训练,得到第一目标检测模型。本申请公开的技术方案,通过每次从样本集合中删除裁切图像包含的真实框及重复执行至样本集合为空集解决过采样和欠采样问题,提高模型性能。
-
公开(公告)号:CN111723913A
公开(公告)日:2020-09-29
申请号:CN202010567702.3
申请日:2020-06-19
Applicant: 浪潮电子信息产业股份有限公司
Abstract: 本发明公开了一种数据处理方法、装置、设备及可读存储介质,该方法包括:获取待处理的媒体对象,并将媒体对象输入至LSTM网络;获取LSTM网络处理媒体对象过程中,所产生的需利用门结构处理的目标数据;利用FPGA的并行度参数,对目标数据进行重新排列,得到并行数据;利用FPGA中的矩阵向量乘法单元组,对并行数据进行矩阵向量乘处理,得到处理结果;将处理结果反馈给LSTM网络继续处理,得到媒体对象的输出结果。该方法能够利用FPGA对LSTM网络加速,使得LSTM网络能够被应用在嵌入式设备中对媒体对象进行处理,增强嵌入式设备的服务功能。
-
公开(公告)号:CN114021708B
公开(公告)日:2023-08-01
申请号:CN202111165135.X
申请日:2021-09-30
Applicant: 浪潮电子信息产业股份有限公司
Abstract: 本申请公开了一种数据处理方法、装置、系统、电子设备及计算机可读存储介质,该方法包括:获取设置指令,并根据设置指令设置计算网络;设置指令用于设置计算网络中各个计算核之间的数据流向;获取至少一个特征值,并将至少一个特征值分别输入计算网络中的至少一个起始计算核;以起始计算核为起点,按照数据流向传输特征值;利用各个计算核,基于特征值和对应的权重值生成计算结果;该方法通过设置指令设置计算网络中各个计算核之间的数据流向,使得数据在不同级之间流动,或者在同级之间流动,使得整个计算网络无论在处理什么形状的网络模型时,都能够被百分百全面利用。
-
-
-
-
-
-
-
-
-