基于FPGA的可重构线性方程组求解加速器

    公开(公告)号:CN108763653B

    公开(公告)日:2022-04-22

    申请号:CN201810412917.0

    申请日:2018-04-30

    Applicant: 南京大学

    Abstract: 本发明提供了的基于FPGA的可重构线性方程组求解加速器,包括:数据分配模块,用于将内部存储器中的数据分配给计算阵列模块,根据输入系数矩阵的规模和类型,在主控制模块的控制下调整数据分配的方式;主程序控制模块,用于控制数据分配模块、重构控制模块和计算阵列模块的运行以及各模块之间的通信;重构控制模块,用于根据系数矩阵的规模和类型重新设置计算方式;内部存储器模块,用于存储系数矩阵和向量数据;计算阵列模块,用于计算线性方程组的解。发明设计的重构方法可以同时调整数据的存储和传输方式,在对运算资源和运算精度不同需求的场景下可采用不同的运算模式,相比于现有的线性方程组求解加速器,具有更好的通用性。

    用于BNN硬件加速器的双向并行处理卷积加速系统

    公开(公告)号:CN108665063B

    公开(公告)日:2022-03-18

    申请号:CN201810480881.X

    申请日:2018-05-18

    Applicant: 南京大学

    Abstract: 本发明提供了一种用于BNN硬件加速器的双向数据级并行处理卷积加速系统包括:存储单元,用于存储输入的激励数据、卷积核参数以及该层卷积运算结束后的结果;运算控制器,控制各个卷积层之间数据的传递、激励的输入与读取卷积核参数的读取、参数运算以及计算结果的存储;卷积运算模块,根据所述控制器指令,读取缓冲单元里的数据和参数,完成卷积操作;数据搬运模块,根据运算控制器的配置信息,将所有参数与激励数据从片外DDR搬运至片上存储器。通过增加运算资源和数据存储资源的开销,大大提高了运算吞吐率。

    一种基于余数系统的同态乘法硬件计算系统及计算方法

    公开(公告)号:CN113986199A

    公开(公告)日:2022-01-28

    申请号:CN202111262134.7

    申请日:2021-10-28

    Applicant: 南京大学

    Abstract: 本发明提供了一种基于余数系统的同态乘法硬件计算系统。该系统包括:控制器控制整个运算流程;读写地址生成模块生成存储的读写地址;数据存储模块用于存储密文源数据和预计算参数;密文基扩展模块实现密文的多项式系数在基础基的余数表示形式与扩展基的余数表示形式之间相互扩展;对位相乘模块和密文缩放模块实现密文在NTT域的对位相乘,并通过缩放与基扩展得到三项同态乘法结果;重线性化模块将三项结果缩减为两项;输出模块输出同态乘积密文。本发明旨在克服同态运算中模数过大导致的运算复杂度高、运算速度慢等困难,利用余数系统的无权性、并行性,实现范围更广、深度更深、速度更快的同态乘法运算。

    一种基于CORDIC的可重构计算引擎
    24.
    发明公开

    公开(公告)号:CN113885832A

    公开(公告)日:2022-01-04

    申请号:CN202111158887.3

    申请日:2021-09-30

    Applicant: 南京大学

    Abstract: 本发明提出了一种基于CORDIC的可重构计算引擎,属于SoC架构下的IP核设计领域。针对目前5G通信、人工智能加速领域对复杂函数的需求,本发明提供了一种基于CORDIC的可重构计算引擎,通过分析复杂函数的数学特征及表达式转换,并利用各种CORDIC算子的特性,将29种复杂数学函数高效映射到10个CORDIC算子上。重构控制器通过指令接口接受配置指令,为不同的复杂函数重构特定的数据通路,并控制数据的流水化计算,最终输出相应复杂函数计算的结果。本发明提出的基于CORDIC的可重构计算引擎具有硬件资源利用率高、配置简易灵活、主频高、面积小及功耗低等优点。

    一种基于长短时记忆神经网络的三维多核芯片温度预测方法及系统

    公开(公告)号:CN113760660A

    公开(公告)日:2021-12-07

    申请号:CN202111043131.4

    申请日:2021-09-07

    Applicant: 南京大学

    Abstract: 本发明提出了一种基于长短时记忆神经网络的三维多核芯片温度预测方法及系统,其中所述方法采用的模型通过长短时记忆神经网络层与全连接层相结合实现,其中长短时记忆神经网络层接收历史温度信息作为输入;全连接层输出多个时间长度后的预测温度信息。本发明提出的方法可为多核芯片中动态温度管理模型提供时间与空间的热分析:即预测节点的温度变化和三维多核芯片的温度分布。本发明通过神经网络对三维多核芯片中温度变化模式的学习能确定潜在热点的位置,较为准确地对每个节点进行多步长温度预测,从而便于动态温度管理模型对芯片整体温度分布情况的掌握,进一步提前进行温度调控,避免热点的产生。

    一种可重构CNN高并发卷积加速器

    公开(公告)号:CN108805266B

    公开(公告)日:2021-10-26

    申请号:CN201810497967.3

    申请日:2018-05-21

    Applicant: 南京大学

    Abstract: 本发明提供了一种可重构CNN高并发卷积加速器,包括:权重地址生成单元,生成卷积核数据在缓存中的地址;结果地址生成单元,生成结果数据在缓存中的地址;可重构计算单元,可将计算阵列重构为两种不同粒度的乘累加树电路;特征图地址生成单元,生成特征图数据在缓存中的地址;主控制器,生成与地址同步的累加器清零信号,选通可重构计算单元中对应的电路,产生整个运算结束的中断信号;存储交换单元,将有效的特征图读地址、权重读地址转换为对存储单元的读操作,将有效的结果写地址和数据转换为对存储单元的写操作。有益效果:简化控制部分,极大地提高多通道二维卷积运算并行度和对存储访问的效率,减少占用的资源。

    一种基于极化码的自适应堆栈译码方法及系统

    公开(公告)号:CN109450456B

    公开(公告)日:2021-09-28

    申请号:CN201811284264.9

    申请日:2018-10-30

    Applicant: 南京大学

    Abstract: 本发明涉及基于极化码的自适应堆栈译码方法及系统,该系统包括:控制单元,路径计算单元,决策单元,堆栈排序单元。所述的控制单元为整个译码过程提供了控制信息;所述的路径计算单元计算出每条路径的转移概率;所述的决策单元通过两种配合使用的自适应策略来限制搜索宽度和存储堆栈深度;所述的堆栈排序单元对所有的候选路径按转移概率从大到小进行排序。有益效果:本发明提出了两种自适应策略,新增了决策单元,通过路径剪枝操作,大大降低了算法的计算复杂度和空间复杂度,并保证了译码性能,适用于各种信道场景。

    一种应用于格密码的串行参数可配快速数论变换硬件加速器

    公开(公告)号:CN113342310A

    公开(公告)日:2021-09-03

    申请号:CN202110679777.5

    申请日:2021-06-18

    Applicant: 南京大学

    Abstract: 本发明提出了一种应用于格密码的串行参数可配快速数论变换硬件加速器,包括顶层控制模块、数据索引模块、单位根幂次模块、蝶形运算单元模块及蒙哥马利模块。顶层控制模块控制状态转换,数据索引模块对数据存储器进行寻址,单位根幂次模块对单位根的幂次进行存储地址计算,蝶形运算单元模块接收来自存储的数据进行蝶形运算,蒙哥马利模块负责将输入数据转换为蒙哥马利形式以加速后续计算,并将结果转换为正常形式避免发生错误。另外,本发明还可以根据实际需求增加随机数发生器进行冗余运算以防御侧信道攻击。与现有技术相比,本发明运算速度大幅度提高,且参数可配置提高了硬件资源的利用率,同时在保证高性能的基础上兼具了一定的通用性。

    一种基于脉冲神经网络的无乘法卷积调度器及其硬件实现方法

    公开(公告)号:CN113128675A

    公开(公告)日:2021-07-16

    申请号:CN202110431741.5

    申请日:2021-04-21

    Applicant: 南京大学

    Abstract: 本发明提出一种基于脉冲神经网络的无乘法卷积调度器及其硬件实现方法,利用SNN基于事件驱动的特性,通过硬件来实现SNN中的卷积计算,为图像分割中的SNN提出了一种有效的卷积调度方法;该方法通过FIFO缓存输入的神经元状态,并送入“1”过滤器实现有效状态的过滤,避免无效状态参与计算,提高计算效率,且无需乘法计算;根据数据流特点,特殊考虑并行存储结构,使用较少的存储资源达到并行存储,以适配计算单元的高并行算力;计算过程中每个time step的结果原位存回,提高存储资源利用率;最终可实现基于脉冲神经网络任意规格输入的3×3卷积计算,支持64路并行计算;该方法提高了神经网络中卷积计算的性能,降低计算复杂度和功耗,同时具有较高灵活性。

    一种粗粒度动态可重构处理器及其数据处理方法

    公开(公告)号:CN112732639B

    公开(公告)日:2021-06-25

    申请号:CN202110355308.8

    申请日:2021-04-01

    Applicant: 南京大学

    Abstract: 本发明涉及一种粗粒度动态可重构处理器及其数据处理方法,包括用于解析配置信息的控制单元;用于接收来自所述控制单元解析得到的配置信息的可重构控制单元;由多个片上存储块组成的片上存储池;产生所述片上存储块访存地址的无冲突地址生成器;直接存储器访问模块;以及位于所述直接存储器访问模块与存储池之间的数据分发模块。本发明通过两阶段配置、配置信息预取、第二阶段部分配置等方式,可实现下一个算子与当前算子的快速动态切换;同时,通过优化设计的可重构计算阵列、无冲突地址生成器等方式,可实现高性能、高能效的算子实现。

Patent Agency Ranking