-
公开(公告)号:CN115935888A
公开(公告)日:2023-04-07
申请号:CN202211552350.X
申请日:2022-12-05
Applicant: 北京航天自动控制研究所
Inventor: 周辉 , 王晓峰 , 谢宇嘉 , 李悦 , 赵雄波 , 吴松龄 , 盖一帆 , 路坤峰 , 李晓敏 , 张隽 , 弭寒光 , 董文杰 , 靳蕊溪 , 吴敏 , 赵冠杰 , 阳徽 , 费亚男 , 李洋 , 赵伟
IPC: G06F30/392 , G06N3/0464 , G06N3/063
Abstract: 本公开属于专用算法硬件电路设计技术领域,具体而言涉及一种神经网络加速系统包括:信息配置模块;和池化加速单元包括:控制模块,控制模块根据信息配置模块的参数信息得到张量块的信息以及地址信息;输入张量缓存模块,与控制模块相连,根据由控制模块得到的输入张量块地址信息缓存从外部存储模块的输入张量块;过程张量缓存模块,与控制模块相连,根据由控制模块得到的输出张量块地址信息缓存沿宽度方向池化的输出张量块,并提供沿高度方向池化的输入数据;池化器阵列模块,分别与输入张量缓存模块和过程张量缓存模块相连,进行宽度方向的池化和高度方向的池化,并沿通道方向进行并行计算,以缩短池化耗时。
-
公开(公告)号:CN115906972A
公开(公告)日:2023-04-04
申请号:CN202211551893.X
申请日:2022-12-05
Applicant: 北京航天自动控制研究所
Inventor: 周辉 , 谢宇嘉 , 王晓峰 , 李悦 , 赵雄波 , 吴松龄 , 盖一帆 , 路坤峰 , 李晓敏 , 张隽 , 弭寒光 , 董文杰 , 靳蕊溪 , 吴敏 , 赵冠杰 , 阳徽 , 费亚男 , 李洋 , 赵伟
IPC: G06N3/063 , G06N3/0464
Abstract: 本公开属于神经网络技术领域,具体而言涉及一种神经网络池化层加速方法,包括:获取配置参数信息;根据所述配置参数信息得到张量块的信息数据;所述张量块包括输入张量块和输出张量块,所述信息数据包括张量块的缓存地址;基于所述缓存地址获取输入数据;根据所述配置参数信息对所述输入数据进行宽度方向的池化,并将过程数据缓存;基于所述过程数据进行高度方向的池化;重复池化步骤,直至遍历所有输入张量块。以缩短池化运算的耗时。
-
公开(公告)号:CN115809691A
公开(公告)日:2023-03-17
申请号:CN202211585769.5
申请日:2022-12-10
Applicant: 北京航天自动控制研究所
Inventor: 王晓峰 , 李晓敏 , 周辉 , 赵雄波 , 盖一帆 , 蒋彭龙 , 路坤锋 , 李超然 , 谢宇嘉 , 吴敏 , 林平 , 董文杰 , 吴松龄 , 弥寒光 , 黄鹂 , 赵冠杰 , 林玉野 , 李杨珺 , 王森 , 李杰 , 杨庆军 , 靳蕊溪
IPC: G06N3/063 , G06F17/16 , G06N3/0464
Abstract: 本公开属于神经网络加速计算技术领域,具体而言涉及一种基于Winograd的相关算法加速器计算方法,包括:获取基准张量块和实时张量块;通过Winograd变换由基准张量块得到第一张量块,由实时张量块得到第二张量块;通过张量块逐点相乘由第一张量块和第二张量块得到第三张量块;沿通道方向累加所述第三张量块,得到第一矩阵;通过Winograd反变换由第一矩阵得到第二矩阵;逐点相加第二矩阵和偏执矩阵,得到过程矩阵;将所述过程矩阵输入至过程张量缓存中,遍历结束后输出。上述过程提高计算速率和计算连续性。
-
公开(公告)号:CN115759220A
公开(公告)日:2023-03-07
申请号:CN202211584828.7
申请日:2022-12-10
Applicant: 北京航天自动控制研究所
Inventor: 王晓峰 , 周辉 , 赵雄波 , 盖一帆 , 蒋彭龙 , 路坤锋 , 李晓敏 , 李超然 , 谢宇嘉 , 林平 , 董文杰 , 吴松龄 , 弥寒光 , 黄鹂 , 吴敏 , 赵冠杰 , 李杨珺 , 王森 , 李杰 , 徐天运 , 靳蕊溪 , 林玉野
Abstract: 本公开属于人工智能处理器技术领域,具体而言涉及一种基于Winograd的深度学习处理系统,包括:输入通道,与外部设备通信;输入特征加载器,与所述输入通道相连;路由模块,与所述输入层加载器相连;卷积加速器核心模块,与路由模块相连,所述卷积核加速器核心模块包括至少两个并行设置的卷积核加速器子核心模块;通道累加器,与卷积加速器核心模块相连,用于累加并行的卷积核加速器子核心模块的输出数据;特征卸载器,与通道累加器相连,将所述通道累加器的输出数据传输至处理系统外。通过多尺寸Wino‑DPU混合架构,通过核间算力的最优分配,实现Wino‑DPU灵活性和高效性的全面提升,进而有效提升深度学习算法的计算效率。
-
公开(公告)号:CN106547601A
公开(公告)日:2017-03-29
申请号:CN201611103447.7
申请日:2016-12-05
Applicant: 北京航天自动控制研究所
IPC: G06F9/445
Abstract: 本发明涉及一种在线软件烧写装置及方法,所述装置包括箭上控制设备、综合测控设备以及地面测试设备;综合测控设备包括板卡以及耦合器;耦合器通过总线以及第五连接器与地面测试设备相连,且耦合器将总线分为两束,其中一束通过第一连接器与箭上控制设备的通讯接口相连,另一束与板卡相连;所述装置还包括与箭上控制设备的允许烧写端口相连的第二连接器,以及与第二连接器依次相连的第三连接器、第四连接器。本发明的装置结构简单、容易操作、制造成本低、在各系统之间具有很强的通用性,发明的方法可以实现远程嵌入式程序更新下载,并可以降低系统升级成本,优化研制流程,可广泛应用于各种远程嵌入式程序更新领域中,具有广泛的借鉴意义。
-
公开(公告)号:CN119580068A
公开(公告)日:2025-03-07
申请号:CN202411674703.2
申请日:2024-11-21
Applicant: 北京航天自动控制研究所
Inventor: 谢宇嘉 , 周辉 , 王晓峰 , 盖一帆 , 赵雄波 , 李超然 , 吴松龄 , 董文杰 , 弭寒光 , 王云龙 , 李然 , 路坤锋 , 李晓敏 , 靳蕊溪 , 杨立波 , 高琪 , 康旭冰
IPC: G06V10/82 , G06V20/17 , G06N3/048 , G06N3/0495
Abstract: 本发明提供了一种图像目标识别方法,包括:将图像集中的图像输入训练后的浮点数深度神经网络模型,获取浮点数深度神经网络模型各隐藏层输出浮点数的取值范围;根据浮点数深度神经网络模型各隐藏层输出浮点数的取值范围,结合量化后定点数的目标位宽值,确定每个隐藏层的输出浮点数与定点数非对称量化关系式中的参数;确定每个隐藏层的输出浮点数与定点数非对称量化关系式为:#imgabs0#在浮点数深度神经网络模型的各隐藏层后,分别采用各隐藏层对应的输出浮点数与定点数非对称量化关系式取代ReLU函数,获得定点数神经网络模型;向定点数神经网络模型中输入待测图像,定点数神经网络模型中各隐藏层输出的浮点数转化为定点数,并完成图像目标识别。
-
公开(公告)号:CN117826591A
公开(公告)日:2024-04-05
申请号:CN202311808632.6
申请日:2023-12-26
Applicant: 北京航天自动控制研究所
IPC: G05B13/04
Abstract: 本发明一种基于长短期记忆网络的控制律自动设计方法,借鉴深度学习中网络架构搜索方法经验,利用循环神经网络在时序关联性发掘方面的优势,将控制律结构设计问题转化为有向无环图拓扑关系自动搜索问题,实现飞行控制律控制结构的自动生成,并基于遗传算法实现给定控制律结构下参数的自动整定,目的在于克服当前控制律自动优化只能针对已知控制器结构利用启发式算法对控制器参数进行自动整定的局限,降低了人工设计工作量,提升了复杂设计输入条件下的控制效果。
-
公开(公告)号:CN116048782A
公开(公告)日:2023-05-02
申请号:CN202211589824.8
申请日:2022-12-10
Applicant: 北京航天自动控制研究所
Inventor: 王晓峰 , 路坤锋 , 周辉 , 谢宇嘉 , 赵雄波 , 盖一帆 , 蒋彭龙 , 李晓敏 , 李超然 , 吴松龄 , 林平 , 董文杰 , 弥寒光 , 黄鹂 , 吴敏 , 赵冠杰 , 李杰 , 李杨珺 , 王森 , 杨庆军 , 靳蕊溪 , 林玉野 , 徐天运
IPC: G06F9/50 , G06N3/063 , G06N3/0464
Abstract: 本公开属于人工智能处理器技术领域,具体而言涉及一种基于Winograd的深度学习处理器核心模组,包括:控制模块,接收外部控制单元传递的指令,并产生控制信号;d‑Buffer模块,缓存来及外部的输入特征,所述d‑Buffer模块与所述控制模块相连,所述控制模块控制d‑Buffer模块每个时钟周期的动作;和PE阵列,包括n个独立的计算单元,每个计算单元与d‑Buffer模块相连,所述计算单元计算每个输出通道的卷积,PE阵列进行n个输出通道的并行计算,所述控制模块控制PE阵列每个时钟周期的动作。本公开通过Winograd快速卷积方法解决基于FPGA的深度学习处理器的性能普遍受限于FPGA片上DSP资源数量的限制的问题,降低DSP数量对深度学习处理器性能的限制。
-
公开(公告)号:CN115906956A
公开(公告)日:2023-04-04
申请号:CN202211539304.6
申请日:2022-12-01
Applicant: 北京航天自动控制研究所
Inventor: 谢宇嘉 , 王晓峰 , 李悦 , 周辉 , 赵雄波 , 张辉 , 吴松龄 , 李晓敏 , 杨钧宇 , 路坤峰 , 张隽 , 丛龙剑 , 盖一帆 , 李山山 , 吴敏 , 林玉野 , 靳蕊溪
IPC: G06N3/0495 , G06N3/063 , G06F15/78
Abstract: 本公开涉及一种基于FPGA的神经网络模型轻量化方法,所述方法包括:步骤一、对需要计算的数据集进行预处理获得数据的最大值rmax、数据的最小值rmin、数据的均值m和方差σ2;步骤二、计算截断范围;步骤三、计算量化参数;计算量化所需参数量化步长s和量化零点z;步骤四、根据确定的参数进行量化计算。采用如上技术方案,将神经网络进行了适用于FPGA硬件的量化操作,减小了计算量,提高了计算效率。
-
公开(公告)号:CN115878956A
公开(公告)日:2023-03-31
申请号:CN202211584551.8
申请日:2022-12-10
Applicant: 北京航天自动控制研究所
Inventor: 王晓峰 , 盖一帆 , 周辉 , 赵雄波 , 路坤锋 , 蒋彭龙 , 李晓敏 , 李超然 , 谢宇嘉 , 赵冠杰 , 林平 , 董文杰 , 吴松龄 , 弥寒光 , 黄鹂 , 吴敏 , 靳蕊溪 , 李杨珺 , 王森 , 李杰 , 杨庆军 , 林玉野
Abstract: 本公开属于专用算法硬件电路技术领域,具体而言涉及一种基于Winograd的相关算法加速器计算系统,包括:张量变换单元,包括基准图变换单元,对基准图张量块进行Winograd变换,得到第一张量块;实时图变换单元,对实时图张量块进行Winograd变换,得到第二张量块;和结果变换单元,对第一矩阵进行Winograd反变换,得到第二矩阵;逐点相乘单元,将所述第一张量块和所述第二张量块进行逐点相乘,得到第三张量块;通道累加单元,将所述第三张量块沿通道方向进行累加,得到第一矩阵;以及偏置累加单元,将所述第二矩阵与偏置矩阵逐点相加,得到过程矩阵。通过上述设置以提高计算速率和计算连续性。
-
-
-
-
-
-
-
-
-