-
公开(公告)号:CN118036519B
公开(公告)日:2025-03-07
申请号:CN202410001890.1
申请日:2024-01-02
Applicant: 哈尔滨工业大学
IPC: G06F30/33 , G06F30/392 , G06F30/394 , G06F17/18
Abstract: 本发明提供了一种基于启动间隔预测的CGRA映射加速方法,包括:步骤1:获取目标CGRA的架构信息;步骤2:基于目标CGRA的架构信息完成Offline建模;步骤3:根据实际采用的CGRA形状和Offline建模完成Online预测,得到启动间隔;步骤4:根据启动间隔,可开展CDFG到实际采用的CGRA形状上的高速映射。本发明在Offline建模中,仅需要进行少量映射,并借助Excel对映射结果开展线性回归,即可得到相对精确的模型参数k和b,经验丰富的操作人员可在5分钟内完成单个CDFG的Offline建模,人工代价和时间成本可忽略不计,同时本发明方法相比于原始映射方法,可实现1~3.9倍、平均1.58倍的CGRA映射加速。
-
公开(公告)号:CN118036519A
公开(公告)日:2024-05-14
申请号:CN202410001890.1
申请日:2024-01-02
Applicant: 哈尔滨工业大学
IPC: G06F30/33 , G06F30/392 , G06F30/394 , G06F17/18
Abstract: 本发明提供了一种基于启动间隔预测的CGRA映射加速方法,包括:步骤1:获取目标CGRA的架构信息;步骤2:基于目标CGRA的架构信息完成Offline建模;步骤3:根据实际采用的CGRA形状和Offline建模完成Online预测,得到启动间隔;步骤4:根据启动间隔,可开展CDFG到实际采用的CGRA形状上的高速映射。本发明在Offline建模中,仅需要进行少量映射,并借助Excel对映射结果开展线性回归,即可得到相对精确的模型参数k和b,经验丰富的操作人员可在5分钟内完成单个CDFG的Offline建模,人工代价和时间成本可忽略不计,同时本发明方法相比于原始映射方法,可实现1~3.9倍、平均1.58倍的CGRA映射加速。
-
公开(公告)号:CN117370705A
公开(公告)日:2024-01-09
申请号:CN202311170950.4
申请日:2023-09-12
Applicant: 哈尔滨工业大学
Abstract: 波形计算功能系统、子线程运行方法、波形计算方法、具有波形计算系统的存储记录仪,涉及波形计算技术领域。解决现有存储记录仪的波形计算功能无法国产化且功能单一的问题。系统包括表示层、业务逻辑层和数据访问层;表示层用于采集功能控制信息选择计算通道并配置计算公式,并将上述的数据ID信息发送给业务逻辑层;业务逻辑层同步表示层的设置,还用于采集数据访问层的计算数据,并将采集的计算数据进行波形计算后,将波形计算结果发送给表示层进行展示。子线程运行方法嵌入在业务逻辑层中,波形计算方法嵌入在波形计算组件中,具有波形计算系统的存储记录仪采用波形计算功能系统实现。本发明适用于存储记录仪的波形计算。
-
公开(公告)号:CN117349221A
公开(公告)日:2024-01-05
申请号:CN202311248543.0
申请日:2023-09-26
Applicant: 哈尔滨工业大学
Abstract: 本发明是一种基于FPGA阵列与DSP的压缩数据处理系统。本发明涉及压缩数据处理技术领域,本发明为了能够在数据中心出现压缩数据堆积情况时,对压缩数据进行边缘端在线处理。本发明通过FPGA阵列与DSP结合的方式,为压缩数据的边缘端处理提供丰富的逻辑和计算资源,从而满足多通道压缩数据同时解压缩、以及对解压缩数据进行后续处理的需求。
-
公开(公告)号:CN117579805A
公开(公告)日:2024-02-20
申请号:CN202311530099.1
申请日:2023-11-16
IPC: H04N13/161 , H04N13/296 , H04N13/383 , H04N13/398
Abstract: 本申请提供了一种基于Unity3D的联合聚焦渲染方法、系统以及电子设备,涉及渲染技术领域,缓解了通过现有框架渲染出的最终呈现给用户的画面质量较低的技术问题。该方法包括:移动端将相机位置、旋转参数以及眼动仪捕捉数据通过局域网发送到云端;云端基于相机位置、旋转参数以及眼动仪捕捉数据渲染图像外围层,得到外围层渲染结果,并对外围层渲染结果进行编码,得到外围层编码结果,将外围层编码结果通过局域网发送至移动端;移动端基于眼动仪捕捉数据渲染图像聚焦层,得到聚焦层渲染结果,对接收到的外围层编码结果进行解码,得到外围层解码结果,基于外围层解码结果和聚焦层渲染结果进行拼接,生成并展示图像拼接结果。
-
公开(公告)号:CN117992216A
公开(公告)日:2024-05-07
申请号:CN202410001779.2
申请日:2024-01-02
Applicant: 哈尔滨工业大学
IPC: G06F9/50 , G06F30/392
Abstract: 本发明公开了一种CGRA多任务动态资源分配的映射系统及映射方法,包括:CGRA处理架构、直接存储器访问单元、片外存储器和CPU处理器;CPU处理器与直接存储器访问单元均与CGRA处理架构信号连接;CGRA处理架构集成有片上储存器、处理单元阵列、动态映射器和映射结果广播器;片上储存器、动态映射器和映射结果广播器均与直接存储器访问单元双向信号连接;片上储存器还连接至处理单元阵列;动态映射器包括:II预测模块、轻量化布局推荐模块、布局布线模块和配置生成模块。本发明技术方案可以实现CGRA多任务资源分配后的自动映射,无需软件人员编程,同时具有高映射速度和高映射质量的特点。
-
公开(公告)号:CN119336699A
公开(公告)日:2025-01-21
申请号:CN202411253926.1
申请日:2024-09-09
Applicant: 哈尔滨工业大学
IPC: G06F15/78 , G06F13/16 , G06F13/376 , G06F9/448
Abstract: 本发明提出面向语境切换的粗粒度可重构架构CTMA及运行方法,其中粗粒度可重构架构CTMA包括:独立路由网络、CTMA命令接收器模块和全局CTMA控制器模块;全局CTMA控制器模块用于迭代地为每个操作生成跨Tile内存访问命令,并通过顺序连接每个Tile的链总线发送到对应Tiles中;CTMA命令接收器模块用于寄存传入的CTMA命令,并检查接收CTMA命令和已有CTMA命令之间的路由合法性,对发生的冲突进行处理,并对CTMA命令进行本地缓存;独立路由网络用于在本地缓冲的CTMA命令控制下直接执行跨Tile内存访问。本发明实验任务在语境切换后可以直接访问语境切换前的内存分布,无需数据迁移,避免动态资源分配对任务吞吐率的负面影响。
-
公开(公告)号:CN119336670A
公开(公告)日:2025-01-21
申请号:CN202411253760.3
申请日:2024-09-09
Applicant: 哈尔滨工业大学
Abstract: 本发明提出一种面向语境切换的嵌入式CGRA二级内存设计方法,包括:步骤1:根据实际多任务需求,确定基础CGRA硬件架构;步骤2:利用开源CGRA建模工具OpenCGRA,在选取的基础CGRA硬件架构基础上,通过PyMTL3语言对CGRA硬件架构进行描述;步骤3:修改OpenCGRA提供的基础组件库Mem,通过PyMTL3语言添加组件,完成每个Tile中数据内存的二级化设计,得到嵌入式CGRA;步骤4:针对二级内存中的有限状态机的所有工作状态进行状态转移、状态输出的时序逻辑设计和状态切换的组合逻辑设计,并用PyMTL3语言进行描述;步骤5:利用OpenCGRA生成可综合的Verilog代码。本发明能够避免任务在语境切换时发生停滞,从而提升任务吞吐率。
-
-
-
-
-
-
-