针对DRAM存内计算的大规模数据搜索方法、装置、存储器、可读存储介质和程序产品

    公开(公告)号:CN119576997A

    公开(公告)日:2025-03-07

    申请号:CN202411556495.6

    申请日:2024-11-04

    Abstract: 本申请涉及一种针对DRAM存内计算的大规模数据搜索方法、装置、存储器、可读存储介质和程序产品。应用于存储器,所述方法包括:在接收到外部设备发送的携带查询向量的查询事务请求后,从多个计算单元中确定目标计算单元;利用目标计算单元基于查询向量从多个存储单元中的第一映射表中查询到多个目标聚类中心向量;利用目标计算单元计算查询向量与各目标聚类中心向量的距离得到多个距离值;并基于多个距离值和多个目标聚类中心向量构建第二映射表,将第二映射表存储至多个存储单元;利用多个存储单元和目标计算单元基于各基向量和第二映射表查询得到与查询向量相似的R个目标基向量;并将R个目标基向量发送至外部设备。采用本方法能够降低搜索延迟。

    基于玻璃转接板的光电共封装结构

    公开(公告)号:CN118938408A

    公开(公告)日:2024-11-12

    申请号:CN202411022911.4

    申请日:2024-07-29

    Applicant: 清华大学

    Abstract: 本发明实施例公开了一种基于玻璃转接板的光电共封装结构,该光电共封装结构包括:玻璃转接板、光子集成芯片和电子集成芯片;所述光子集成芯片和所述电子集成芯片分别嵌入所述玻璃转接板的两侧;所述光子集成芯片和所述电子集成芯片通过玻璃通孔实现垂直互连。本发明提出了一种基于玻璃转接板的光电共封装结构,与硅基转接板相比,玻璃转接板优势在于:大尺寸超薄玻璃转接板制备工艺流程简单,成本低,热和机械稳定性好,具备优良的电学和光学特性,由此,本发明基于玻璃转接板的光电共封装结构解决了目前光电共封装采用硅转接板存在的制备工艺复杂、制备成本高、大面积制备时良率降低、电学性能差等问题,有助于提高光电共封装结构的性能。

    基于强化学习的晶圆级架构任务映射方法、装置及存储介质

    公开(公告)号:CN117591255A

    公开(公告)日:2024-02-23

    申请号:CN202311357080.1

    申请日:2023-10-19

    Abstract: 本发明涉及一种基于强化学习的晶圆级架构任务映射方法、装置及存储介质,其中方法包括:将计算任务转换为计算图;基于计算图的每个节点的邻接矩阵和每个节点的信息,提取每个节点的特征向量得到计算图的特征表示;构建强化学习网络:将映射策略作为强化学习状态,将映射策略对应的代价作为强化学习奖励,将基于映射策略生成的中间状态向量作为强化学习状态,其中,映射策略表征计算图的各节点所分配的硬件资源;训练构建的强化学习网络;基于训练好的强化学习网络,输入需要进行任务映射的计算图,得到任务映射方案。与现有技术相比,本发明将晶圆级架构任务映射问题转化为强化学习问题,从而可以利用强化学习方法进行求解。

    基于重叠加法的定浮点混合计算架构

    公开(公告)号:CN117472324A

    公开(公告)日:2024-01-30

    申请号:CN202311345018.0

    申请日:2023-10-17

    Applicant: 清华大学

    Abstract: 本申请涉及一种基于重叠加法的定浮点混合计算架构,所述架构包括处理单元和计算设备,所述处理单元包括可重构单元、三个定点乘法器、至多三个加法器、至多三个移位器和指数处理单元;所述计算设备,用于根据所述处理单元的精度类型和所述精度类型对应的精度模式,确定所述可重构单元的工作模式;所述处理单元,用于基于所述可重构单元的工作模式、各所述定点乘法器、各所述加法器、各所述移位器以及所述指数处理单元,对输入数据进行混合计算得到计算结果;所述输入数据包括定点数据及浮点数据,各所述加法器及所述指数处理单元是基于重叠加法进行计算的。采用该架构可对不同精度的定点数据、浮点数据进行混合计算。

    一种晶圆级架构AI加速芯片的任务调度方法及介质

    公开(公告)号:CN117193988A

    公开(公告)日:2023-12-08

    申请号:CN202311343576.3

    申请日:2023-10-17

    Abstract: 本发明公开一种晶圆级架构AI加速芯片的任务调度方法,其将计算任务转换为计算图,并进行切分,以获取至少一个切分方案,每个切分方案包括切分得到的至少一个计算子图,同时对芯片的计算资源进行划分,以获取至少一个计算资源划分方案,每个计算资源划分方案包括划分得到的至少一个子网格,且每个子网格包括至少一个计算核,然后将切分方案与计算资源划分方案进行匹配,以获取至少一个匹配方案,每个匹配方案包括一个切分方案中的各个计算子图及其对应的子网格,最后根据代价模块,获取一个效率最优的匹配方案。其每个步骤均具有寻优的空间,考虑的优化空间更大更全面,从而能够有效地提高晶圆级架构AI加速芯片的硬件利用效率。

    面向人工智能芯片的混合引擎智能计算方法和装置

    公开(公告)号:CN116402091A

    公开(公告)日:2023-07-07

    申请号:CN202310323922.5

    申请日:2023-03-29

    Applicant: 清华大学

    Abstract: 本申请涉及一种面向人工智能芯片的混合引擎智能计算方法和装置。该数据处理方法应用于处理芯片,处理芯片包括标量处理单元和计算单元;该方法包括:在接收到处理指令的情况下,从标量处理单元和计算单元中确定处理处理指令的第一目标处理单元;处理指令用于指示运行目标神经网络模型;利用第一目标处理单元对处理指令进行处理,得到处理指令对应的处理信息;处理信息包括控制信息和数据信息;利用第二目标处理单元和处理信息运行目标神经网络模型,得到目标神经网络模型的运行结果;第二目标处理单元包括第一目标处理单元。本申请可以改善人工智能芯片在运行神经网络模型的过程中容易产生过热等问题。

    面向人工智能芯片的标量引擎处理方法和装置

    公开(公告)号:CN116400926A

    公开(公告)日:2023-07-07

    申请号:CN202310319068.5

    申请日:2023-03-29

    Applicant: 清华大学

    Abstract: 本申请涉及一种面向人工智能芯片的标量引擎处理方法和装置。所述方法包括:芯片中的上层模块获取待部署于芯片中的人工神经网络模型;上层模块基于芯片中的标量引擎所内置的指令集,对人工神经网络模型进行转换处理,得到人工神经网络模型对应的多个目标指令,并将多个目标指令发送至标量引擎;标量引擎执行多个目标指令,以在芯片内实现人工神经网络模型对应的编译处理。采用本方法能够提升人工智能芯片对人工神经网络模型的片内编译处理灵活性。

    一种具有癌细胞靶向识别功能的聚合物纳米球及其制备方法

    公开(公告)号:CN106924756A

    公开(公告)日:2017-07-07

    申请号:CN201710156668.9

    申请日:2017-03-16

    Applicant: 清华大学

    Abstract: 本发明公开了一种具有癌细胞靶向识别功能的聚合物纳米球及其制备方法。该具有癌细胞靶向识别功能的聚合物纳米球由表面含有胺基的聚合物纳米球和氨基化的癌细胞靶向介导分子构成,所述氨基化的癌细胞靶向介导分子通过所述氨基化的癌细胞靶向介导分子中的氨基与所述含有胺基的聚合物纳米球中的胺基之间形成的氢键固定在所述含有胺基的聚合物纳米球的表面。本发明制备的具有癌细胞靶向识别功能的聚合物纳米球可以作为药物载体包覆抗癌药物,纳米球载体本身不具有细胞毒性。纳米球表面通过氢键作用固定了癌细胞靶向介导分子,通过静脉注射或者口服的方式送入体内后,纳米球载体可在癌细胞附近靶向聚集并进行药物释放,提高了癌细胞局部区域的药物浓度,达到靶向杀死癌细胞的目的。

    卷对卷制作扇出型封装结构的方法和扇出型封装结构

    公开(公告)号:CN106847713A

    公开(公告)日:2017-06-13

    申请号:CN201611249701.4

    申请日:2016-12-29

    Applicant: 清华大学

    CPC classification number: H01L2224/50 H01L21/561 H01L23/14 H01L23/31

    Abstract: 本公开涉及一种卷对卷制作扇出型封装结构的方法和扇出型封装结构,该方法包括:a、将芯片通过粘结层粘结在柔性封装基板的底面;其中,所述柔性封装基板卷紧在两根卷轴上,所述柔性封装基板包括紧贴所述卷轴的金属布线层和位于所述金属布线层上方的柔性材料层,所述金属布线层上布设有第一焊盘和引线,所述柔性材料层开设有第二通孔,所述粘结层开设有位于所述引线下方的窗口,所述芯片的顶面所述窗口的下方设有第二焊盘;b、将所述引线穿过所述窗口与所述芯片顶面的第二焊盘电连接;c、在所述第一通孔中形成与所述第一焊盘电连接的焊球。与现有技术相比,本公开提供的方法和采用本公开方法所制作的封装结构的翘曲显著降低。

Patent Agency Ranking