-
公开(公告)号:CN102495721A
公开(公告)日:2012-06-13
申请号:CN201110393712.0
申请日:2011-12-02
Applicant: 南京大学
IPC: G06F9/34
Abstract: 本发明公开了一种支持FFT加速的SIMD向量处理器。包括控制单元、计算单元、存储子系统、存储交织单元和地址产生单元:计算单元支持各种向量运算的快速处理;存储器子系统包括三个存储器组,每个存储器组包括四个存储体且存储器组内的单个存储体的位宽为一个复数字,支持4路数据并行的复数向量运算和8路数据并行的实数向量运算;计算单元、地址产生单元和存储交织单元均与控制单元连接;地址产生单元产生所需的操作数地址序列、系数地址序列、结果地址序列;存储交织单元与地址产生单元和计算单元连接,并实现存储体的地址映射。本发明对FFT/IFFT运算的加速效率和专用硬件加速器相当,却避免了使用专用硬件加速器所带来的巨大的额外开销,适用于具有大量长向量运算的实时信号处理系统中。
-
公开(公告)号:CN103729867A
公开(公告)日:2014-04-16
申请号:CN201410005665.1
申请日:2014-01-07
Applicant: 南京大学 , 中国电子科技集团公司第十四研究所
IPC: G06T11/00
Abstract: 本发明涉及一种基于BP反投影成像算法的硬件加速器,包括脉冲存储器,用于存储大量的脉冲数据;图像数据存储模块,包括至少两个连续的图像数据存储器,用于存储每次反投影运算前后的源数据和结果数据;反向投影运算单元,用于进行反投影运算,实现时延调整和相干累加功能;以及AHB接口,用于集成所述脉冲存储器、图像数据存储器以及反向投影运算单元,完成三者与AHB总线之间的信息交互。有益效果为:1)采用合适位宽的定点数代替一般使用的双精度浮点数来进行计算,这样做减小了运算误差以及逻辑资源的使用。其相位误差由11.25°减小到1.4°。(2)提出了反投影成像数据处理方法,实现各级流水线无缝对接,获得较高的数据吞吐率,有效实现算法的并行化。
-
公开(公告)号:CN102075578A
公开(公告)日:2011-05-25
申请号:CN201110021693.9
申请日:2011-01-19
Applicant: 南京大学
IPC: H04L29/08
Abstract: 本发明公开了一种基于分布式存储单元的层次化片上网络架构,该层次化片上网络架构顶层采用二维网格架构集成运算簇及全局共享存储单元;在运算簇内部采用由簇内总线和私有总线构成的层次化总线架构,且簇内总线和私有总线通过总线桥通讯;所述簇内总线上集成网络接口和簇内共享存储单元;所述私有总线上集成私有存储单元和处理器核。本发明中存储系统分为三级:单核私有存储单元,簇内共享存储单元和全局共享存储单元。本发明采用层次化总线及网络架构混合互连方式构建整个NoC通信系统,同时将存储单元也划分到各个层次,有效提高系统通信性能,缓解访存压力,改善片上网络整体通讯性能。
-
-