-
公开(公告)号:CN106951394A
公开(公告)日:2017-07-14
申请号:CN201710189440.X
申请日:2017-03-27
Applicant: 南京大学
CPC classification number: G06F17/142 , G06F7/57
Abstract: 本发明提供了一种可重构定浮点通用FFT处理器,既可以实现18位的定点FFT运算,也可以实现32位的单精度浮点FFT运算。所述处理器将定点运算器(包括乘法器和加法器)与主体结构相分离,定点运算器可重构为单精度浮点运算器。处理器主体通过调用定点运算器或重构而成的单精度浮点运算器来完成定点或浮点FFT运算。所述处理器采用混合基流水结构,不仅支持定浮点计算还支持可配置的计算点数,在保证精确度和数据吞吐率的情况下,有效的提高了处理器的通用性。
-
公开(公告)号:CN118627565B
公开(公告)日:2025-01-03
申请号:CN202411105645.1
申请日:2024-08-13
Applicant: 南京大学
IPC: G06N3/065 , G06N3/0464 , G06F9/30
Abstract: 本发明公开了一种基于脉动阵列的可配置卷积运算加速装置及方法,属于超大规模集成电路的神经网络硬件加速技术领域。本发明方案针对现有卷积运算加速装置存在的问题,提出一种改进运算方式的脉动阵列,即采用行方向上广播、列方向上脉动的运算方式,将中间计算结果固定在PE中,无需停止运算以更新权重,大大提高了PE利用率,使得实际算力接近理论峰值算力,而且由于采用了行方向上广播的方式,每行PE工作状态相同,从而使得每个周期需要输出运算结果的PE数量相同,有效保证了输入输出数据吞吐率的稳定,充分利用输出通道的数据带宽。
-
公开(公告)号:CN119094703A
公开(公告)日:2024-12-06
申请号:CN202411224700.9
申请日:2024-09-03
Applicant: 南京大学
IPC: H04N7/18 , H04N23/81 , H04N21/2343 , H04N21/643
Abstract: 本发明公开一种用于夜视场景的图像传输系统及其方法。该图像传输系统包括:图像采集推流设备,用于采集较暗场景下图像数据、预处理采集图像、编码图像数据以及推流编码后的图像;图像处理设备,用于拉流所述图像采集推流设备所推流图像、对所拉流数据进行解码操作、对于所解码数据进行预处理、对预处理后数据进行夜视增强并显示夜视增强后的图像数据。本发明拓宽了夜视产品的使用场景,使得图像采集与图像处理分离,可在后端算力更强的设备上使用效果更好的夜视处理程序进行图像处理。
-
公开(公告)号:CN118627566B
公开(公告)日:2024-11-12
申请号:CN202411104910.4
申请日:2024-08-13
Applicant: 南京大学
IPC: G06N3/067 , G06N3/065 , G06N3/045 , G06F18/25 , G06F18/2415 , G06F18/2431
Abstract: 本发明公开了一种加速ViT神经网络的异构存算装置及方法,属于硬件加速神经网络的领域。所述方法针对加速ViT神经网络的计算,利用光电存算一体器件阵列实现ViT神经网络中的固定数值的存储与运算,利用DRAM存算一体器件实现ViT神经网络中的不断变化的权重值的存储与运算,结合二者执行密集型矩阵向量乘运算的优势,减小器件面积的同时,还大幅缩减了运算单元反复访问片外存储导致的时间及功耗开销,从而加速了ViT神经网络的推理过程。
-
公开(公告)号:CN113641605B
公开(公告)日:2024-10-01
申请号:CN202110804144.2
申请日:2021-07-16
Applicant: 南京大学
IPC: G06F13/362
Abstract: 本发明公开了一种适用于异步电路的轮询仲裁器及其方法。该轮询仲裁器包括仲裁部分、互斥锁部分和多路选择部分;其中,仲裁部分由多级仲裁单元级联而成,仲裁部分的输入为请求信号以及各请求的权值信息,仲裁部分的输出为反应仲裁结果的响应信号;互斥锁部分由多级互斥单元级联而成,互斥锁部分的输入为从仲裁部分输出的响应信号以及从后级流水线结构输出的握手信号,互斥锁部分的输出为选通信号以及向前级流水线结构传递的握手信号;多路选择部分的输入为互斥锁部分输出的选通信号以及输入数据,多路选择部分的输出为仲裁优先级最高的有效数据。本发明的轮询仲裁器适用于异步电路,取消对于全局时钟的依赖。
-
公开(公告)号:CN118468954A
公开(公告)日:2024-08-09
申请号:CN202410495923.2
申请日:2024-04-24
Applicant: 南京大学
IPC: G06N3/067 , G06N3/0455 , G06N3/0464 , G06F17/16 , G06V10/764 , G06V10/82 , G06V10/94
Abstract: 本发明提供一种基于光电存算一体器件的U‑Net深度学习网络加速装置及方法。该装置包括:编码混合层模块,用于对特征图执行卷积、归一化以及下采样操作,并将结果输出给双卷积层模块;双卷积层模块,用于对特征图执行双卷积和归一化操作,并将生成的特征图输出给解码混合层模块;解码混合层模块,用于对特征图执行上采样、卷积以及归一化操作,并将结果输出给分类输出模块;分类输出模块,用于对特征图执行卷积操作,并输出分类预测的结果。本发明实现了对U‑Net深度学习网络在硬件层面上的加速,依托光电存算一体器件降低中间片上缓存带来的带宽压力,实现资源消耗和计算性能的兼顾。
-
公开(公告)号:CN118098311A
公开(公告)日:2024-05-28
申请号:CN202410521087.0
申请日:2024-04-28
Applicant: 南京大学
Abstract: 本发明公开了一种基于光电存算单元阵列的字线驱动电路,属于模拟集成电路领域。该字线驱动电路包括工作模式切换电路和工作状态切换电路,基于模式切换电路和状态切换电路实现输出电压的切换,在满足光电存算阵列多种模式工作电压切换功能的基础上,按照状态切换控制信号HV_EN的切换高速驱动光电存算阵列的字线为HV/0V,以避免字线处于浮空状态的不确定电势,实现了神经网络权重的精准存储,满足光电存算阵列高精度的编程、复位以及高速高精度的数字型激励读出推理需求。
-
公开(公告)号:CN116681636B
公开(公告)日:2023-12-12
申请号:CN202310924379.4
申请日:2023-07-26
Applicant: 南京大学
Abstract: 算量小、推理速度快的轻量化卷积神经网络,适本发明公开了基于卷积神经网络的轻量化 合部署到资源受限的嵌入式设备。红外与可见光图像融合方法,属于图像处理和计算机视觉领域。本发明方法先进行图像配准,然后根据可见光图像的平均亮度是否低于某阈值来判断是否进行增强网络EnhanceNet处理,再将可见光Y分量与灰度图格式的红外图像分别输入到融合网络FusionNet中得到融合结果Y’,再进行格式转化得到最终融合图像。本发明将低光照
-
公开(公告)号:CN112230709B
公开(公告)日:2023-12-12
申请号:CN202011112962.8
申请日:2020-10-16
Applicant: 南京大学
Abstract: 本发明公开了一种可实现高精度光输入的光电计算装置及校准方法。其装置包括发光阵列、光电计算阵列和光学调制机构,发光阵列由多个发光单元周期性排列组成,光电计算阵列由多个光电计算单元周期性排列组成,光学调制机构用于对发光单元发出的光子进行调制;光电计算装置还包括辅助对准机构,辅助对准机构使得发光单元发出的光子经过光学调制机构后能够入射在计算关系上与发光单元相对应的光电计算单元中;辅助对准机构包括至少一个可成像阵列,可成像阵列与发光阵列或光电计算阵列二者之一在整个装置的光路中相对于另一者具有对易性。本发明不仅可以提高光输入的精度,而且可以方便地进行现场校准或调焦。
-
公开(公告)号:CN116978976A
公开(公告)日:2023-10-31
申请号:CN202311148404.0
申请日:2023-09-06
Applicant: 南京大学
IPC: H01L31/113 , H01L31/0224 , H01L31/0352 , H01L31/18 , G06E3/00
Abstract: 本发明公开了一种高光电转换效率的光电计算单元,光电计算组件及光电计算单元的制备方法。所述的光电计算单元进行了大间距的源端和漏端设计,并使源端和漏端分别与栅极区域之间具有小梯度的离子掺杂浓度分布,使装置实现高水平的光输入效率。
-
-
-
-
-
-
-
-
-