-
公开(公告)号:CN114266351A
公开(公告)日:2022-04-01
申请号:CN202111537939.8
申请日:2021-12-15
Applicant: 南京大学
Abstract: 本发明提供了一种基于无监督学习时间编码的脉冲神经网络训练方法及系统。方法步骤如下:步骤1、根据与输入像素强度相关的特定编码方案生成脉冲序列,将输入图像编码为脉冲时间向量;步骤2、将输入图像编码的脉冲时间向量从小到大排序;步骤3、排序后的向量用于生成每个神经元的输出脉冲时间;步骤4、更新首脉冲神经元的突触权重;步骤5、每个神经元在训练完成后根据其对十类数字的最早反应分配一类,这些神经元用于在测试集上测量网络的分类精度。本方法使用脉冲时间依赖可塑性(STDP)训练网络,只更新连接到首脉冲神经元的权重,显著降低了突触权重更新的频率,可以减少计算的冗余,降低功耗和面积开销。
-
公开(公告)号:CN119474007A
公开(公告)日:2025-02-18
申请号:CN202411555390.9
申请日:2024-11-04
Applicant: 南京大学
Abstract: 本发明公开了可重构计算阵列、重构控制器架构、芯片及重构计算方法,包括主控模块、状态机模块、计算译码器模块、访存资源控制器模块、重构控制器模块、可重构计算阵列、输入缓冲区模块和输出缓冲区模块;状态机模块通过状态切换,控制整个重构计算过程;重构控制器模块根据计算译码器模块的译码结果配置可重构计算阵列中PE单元的连接方式,实现多种计算功能以完成不同类型的数据计算任务。本发明通过对可重构计算阵列中多个计算单元进行动态配置,使得硬件架构能够根据不同的算法需求进行实时调整,对可重构计算阵列进行精准配置以完成不同的计算任务,而无需为每种任务设计专用的硬件,从而提高芯片配置的灵活性并提高资源利用率。
-
公开(公告)号:CN115374924A
公开(公告)日:2022-11-22
申请号:CN202211029242.4
申请日:2022-08-26
Applicant: 南京大学
Abstract: 本发明提供了一种基于三值脉冲的脉冲神经网络的优化方法及硬件加速器。步骤如下:在每个时间步长内设置一个采样窗口,在采样窗口内使用泊松分布生成与输入图像对应的二值脉冲序列;将采样窗口的每个二值脉冲序列累加,根据累加结果生成三值脉冲,将所有时间步长内的三值脉冲集合,生成与输入图像对应的三值脉冲序列;对神经元设置双膜阈值电压,根据双膜阈值电压,神经元输出相应的三值脉冲;前向传播结束后,使用梯度替代的反向传播算法更新权重;训练完成后,使用硬件加速器对训练好的网络进行推理。本方法显著提高了脉冲的信息携带能力,大大缩短了训练及推理所需的时间窗口长度,保持硬件控制逻辑简单的同时进一步增大了网络的吞吐率。
-
公开(公告)号:CN119441699A
公开(公告)日:2025-02-14
申请号:CN202411555384.3
申请日:2024-11-04
Applicant: 南京大学
IPC: G06F17/16
Abstract: 本申请公开了一种基于Cholesky分解的迭代计算矩阵求逆方法及系统,涉及DSP系统优化技术领域,该方法包括获取目标源矩阵;基于Cholesky分解,对目标源矩阵进行第一迭代处理,生成上三角矩阵;对上三角矩阵进行第二迭代处理,生成上三角矩阵的逆矩阵;对上三角矩阵的逆矩阵进行共轭转置处理,生成下三角矩阵;其中,下三角矩阵以整列存储的形式进行存放;将上三角矩阵的逆矩阵的存放方式转换为顺序存储的形式;对上三角矩阵的逆矩阵以及下三角矩阵进行矩阵乘法处理,生成目标源矩阵的逆矩阵。本申请通过迭代替代累加求和,采用复数乘加优化计算,支持多并行度操作,并行化处理补零操作,可适配一般矩阵乘法模块,降低计算时间和面积开销。
-
公开(公告)号:CN119441130A
公开(公告)日:2025-02-14
申请号:CN202411555385.8
申请日:2024-11-04
Applicant: 南京大学
Abstract: 本发明公开了一种三维可重构硬件加速核芯片,属于芯片技术领域,其技术方案要点是三维可重构硬件加速核芯片包括:可重构运算阵列用于提供至少一个单元级计算单元和至少一个算法级计算单元;存储阵列用于存储经AXI总线输入与可重构运算阵列输出的运算数据;控制器集合用于控制至少一个单元级计算单元和至少一个算法级计算单元,以分别实现单元级计算操作和算法级计算操作,以及控制存储阵列的运算数据存储,本发明通过独立的控制体系管理配置译码、重构控制、计算控制、数据分发与存储控制等调度功能,构建了基于静态调度、静态数据流模型的三维可重构硬件加速核芯片,该芯片通过存算解耦,实现了空间维度、时间维度、资源维度的多维可重构。
-
公开(公告)号:CN117195977A
公开(公告)日:2023-12-08
申请号:CN202311353936.8
申请日:2023-10-19
Applicant: 南京大学
Abstract: 本发明公开了一种基于线性STDP的时间编码脉冲神经网络训练方法及系统,包括对输入图像的像素进行归一化处理;采用首脉冲时间编码方案,将归一化后的输入图像像素转换为输入脉冲时间,对所述输入脉冲时间进行排序;运用脉冲响应神经元模型,根据排序后的输入脉冲时间计算输出脉冲时间;采用适应性膜阈值技术,根据输出脉冲时间更新首脉冲神经元膜阈值;采用线性STDP学习规则,根据输入脉冲时间、输出脉冲时间和首脉冲神经元膜阈值更新连接到首脉冲神经元的权重。本发明的计算复杂度显著降低,计算成本低,功耗和面积开销降低,硬件实现更加友好。
-
公开(公告)号:CN115440226A
公开(公告)日:2022-12-06
申请号:CN202211144916.5
申请日:2022-09-20
Applicant: 南京大学
Abstract: 本发明的基于脉冲神经网络的应用于语音关键字识别的低功耗系统包括:外部存储、上位机和脉冲神经网络硬件加速器,其中脉冲神经网络硬件加速器包括存储模块、控制器、调度器以及计算阵列;本发明提出了一种二维坐标存储结构存储脉冲神经元状态,一方面可以跳过神经元的无效状态,避免无效计算,基于脉冲神经网络的稀疏性,可以大幅降低计算量,另一方面可以降低检测有效状态的延时,有效提高资源利用率;提出了卷积直通池化,并行执行的方案,避免了传统设计中将中间卷积结果写回存储的环节,卷积结果存入FIFO后与下行结果直接两两池化,有效降低了存储访问次数,存储功耗也得以降低。设计了8路并行的计算架构,可以有效减少计算延时,补偿脉冲神经网络多步长的缺陷;经验证,本发明的语音关键词识别系统能够在保证较高准确率的前提下,同时具有功耗低、面积小的特点,适用于嵌入式、物联网等诸多应用领域,能够高效完成语音关键词识别任务。
-
公开(公告)号:CN114676831A
公开(公告)日:2022-06-28
申请号:CN202210317373.6
申请日:2022-03-29
Applicant: 南京大学
Abstract: 本发明公开了一种基于时间编码的低功耗脉冲神经网络片上学习系统,包括排序模块和计算模块,排序模块用于接收已进行时间编码的若干组输入数据,并将所述输入数据升序或降序排列;计算模块用于接收所述输入数据和预存储的与输入数据匹配的权重数据;基于预定规则将所述输入数据量化为预设常数,获得量化输入数据;基于权重数据判断神经元是否会激发,若激发,则采用所述量化输入数据和权重数据计算输出脉冲时间,并采用线性化规则更新权重数据。通过将输入数据量化降低硬件运算难度,采用优化的权重更新规则以便于硬件设计,减少运算量,具有功耗低、面积小速度快的优点;提升了脉冲经网络运算速度,且能够在硬件上实现片上学习。
-
公开(公告)号:CN119558360A
公开(公告)日:2025-03-04
申请号:CN202411607181.4
申请日:2024-11-12
Applicant: 南京大学
IPC: G06N3/049 , G06N3/0464 , G06N3/063
Abstract: 本发明涉及神经网络技术领域,是一种基于四进制脉冲的脉冲神经网络加速器及其计算方法,具体方法包括:构建神经元模型,预设三个膜阈值,根据神经元实时膜电位和三个膜阈值进行四进制脉冲生成触发判断,同时在四进制脉冲生成过程中执行零跳过策略,筛选获得有效四进制脉冲;当所述神经元模型中的神经元生成并发放有效四进制脉冲完成后,通过膜电位重置策略对神经元的膜电位进行重置处理;同步使用带有四进制脉冲的输入数据对带有四进制脉冲的深度残差脉冲神经网络进行训练,并通过额外的加法器生成最终的输出膜电位和四进制脉冲;本发明显著缩短了SNN的处理时间窗口,提高了计算效率和能效,适用于各种神经网络计算任务。
-
公开(公告)号:CN119523414A
公开(公告)日:2025-02-28
申请号:CN202411507881.6
申请日:2024-10-28
Applicant: 南京大学
Abstract: 本发明涉及癫痫预测技术领域,是一种基于可调节抑制发射的脉冲神经网络的癫痫预测系统,具体包括:数据预处理模块、脉冲神经网络模块、神经网络优化模块、发射模式判断模块和加速器模块;通过数据预处理模块得到可以供给神经网络训练和测试的数据集,然后通过脉冲神经网络模块、神经网络优化模块和发射模式判断模块对脉冲神经网络进行软件优化和硬件优化,最后通过加速器模块实现所述基于可调节抑制发射的脉冲神经网络的癫痫预测系统,本发明解决了现有技术中,脉冲神经网络的计算量庞大,功耗消耗也大导致计算速度慢且无法满足可穿戴设备需求的问题。
-
-
-
-
-
-
-
-
-