-
公开(公告)号:CN221960554U
公开(公告)日:2024-11-05
申请号:CN202322826485.7
申请日:2023-10-20
Applicant: D-梅崔克斯公司
Inventor: 伊利亚·索洛维奇克 , 伊利亚·柳博米尔斯基
Abstract: 本实用新型涉及用于AI加速器集成电路的矩阵乘法计算装置及AI加速器装置。用于在计算加速器中压缩神经网络权重块的装置,提供了一种矩阵乘法计算装置。该装置包括存储器,存储器配置为以第一格式存储权重矩阵元素,第一格式包括比例因子和尾数块的列。第一寄存器配置为通过耦合到存储器的横杆设备接收每个权重矩阵列的比例因子,转换器配置为使用列的比例因子确定最大指数,并且第二寄存器配置为存储最大指数。此外,第一寄存器配置为接收列的尾数块,并且转换器配置为使用所有的比例因子和尾数块确定转换块。权重缓冲器接收转换块和最大指数作为第二格式的元素,第二格式被计算设备使用以确定矩阵乘法输出,这些输出被存储在输出缓冲器中。
-
公开(公告)号:CN119919836A
公开(公告)日:2025-05-02
申请号:CN202510101054.5
申请日:2025-01-22
Applicant: 杭州电子科技大学
IPC: G06V20/17 , G06V10/25 , G06V10/774 , G06V10/44 , G06V10/80 , G06N3/0464 , G06N3/048 , G06N3/0495 , G06N3/082 , G06N3/0442 , G06N3/084
Abstract: 本发明公开了一种基于SCGD‑YOLO网络的无人机视角下的小目标检测方法,包括以下步骤:获取无人机视角下小目标的开源数据集,并将数据集划分为训练集、验证集和测试集,数据集包含十种类别,主要类别以小目标为主;并配置网络模型所需的网络环境;构建SCGD‑YOLO网络模型,SCGD‑YOLO网络模型包含骨干网络、颈部网络、检测头;将训练数据集的图片与标签送入构建的SCGD‑YOLO网络模型进行训练,并根据验证集的结果调整相应超参数获得最佳训练结果;最后将测试集中待检测的图片送入训练好的SCGD‑YOLO网络模型中进行小目标检测,并输出检测结果,本发明解决了无人机在高空拍摄时小目标分辨率较低、检测精度下降的问题,不仅提高了对小目标的检测精度,还降低了模型的参数量。
-
公开(公告)号:CN119919648A
公开(公告)日:2025-05-02
申请号:CN202510413765.6
申请日:2025-04-03
Applicant: 西北工业大学
IPC: G06V10/25 , G06N3/0442 , G06N3/0495 , G06V10/44 , G06V10/80 , G06V10/82 , G06V10/98
Abstract: 本发明公开了一种基于在轨适配的大视场图像空间碎片检测方法,包括:获取待检测的大视场星空图像,将大视场星空图像输入到训练好的空间碎片检测模型中,得到针对大视场星空图像的目标检测结果;所述空间碎片检测模型包括耦合因素评估模块、稀疏混合专家处理模块、知识精确修正模块与检测结果输出模块;本发明通过多个模块的协同工作,利用多种不同层次的图像降质评估指标控制不同领域的专家模型以实现不同因素的有效应对,同时引入知识精确修正模块,实现更加精细的自适应处理。本发明显著提高了在复杂空间环境下的大视场探测图像的目标检测性能。
-
公开(公告)号:CN119918622A
公开(公告)日:2025-05-02
申请号:CN202510416611.2
申请日:2025-04-03
Applicant: 湖南先汇智能科技有限公司
IPC: G06N3/098 , G06N3/082 , G06N3/0495 , G06N3/0442 , G06N3/0455 , G06N5/01 , G06F9/50
Abstract: 本发明适用于大语言模型技术领域,尤其涉及一种用于边缘设备的大语言模型优化方法和系统,所述方法包括:构建边缘设备网络;对边缘设备进行划分,得到多个边缘设备集群,提取各个边缘设备的设备参数信息;进行剪枝处理,得到压缩模型,对边缘设备集群进行资源划分,得到固定资源和动态资源;对压缩模型进行拆分和加载,对数据处理任务进行处理,进行动态局域重复加载,完成对后续任务的处理。本发明根据不同的边缘设备进行不同比例的压缩,将压缩模型拆分后加载在各个边缘设备上,并通过边缘设备对部分压缩模型进行重复加载,以保证数据处理的均衡度,提高数据处理速度,使得性能较低的边缘设备也能够运行大语言模型。
-
公开(公告)号:CN119918607A
公开(公告)日:2025-05-02
申请号:CN202411845983.9
申请日:2024-12-16
Applicant: 广州览讯科技开发有限公司
Inventor: 贺颂钧
IPC: G06N3/082 , G06N3/0495 , G06F18/10 , G06F18/214 , G06N3/0464 , G06N3/084 , G06F123/02
Abstract: 本发明公开了一种基于区块链的数据处理及数据分析系统及方法,包括如下步骤:S1:实时获取时序数据,针对所述时序数据进行数据预处理,得到训练样本;S2:将所述训练样本输入神经网络中进行训练,输出携带时序数据信息的卷积核;S3:构建剪枝模型,根据修剪规则对卷积核进行修剪,输出结果;S4:将输出的结果与所述时序数据对比,若正确,则修剪成功,若错误,重复步骤S2‑S4;本申请采用剪枝模型对神经网络中的数据进行压缩,因为剪枝模型可以同时减少数据的体积和数据的训练量,并且剪枝模型也更容易和其他数据压缩方法相结合,实现对时序数据的压缩,以实现减少时序数据的存储空间。
-
公开(公告)号:CN119918580A
公开(公告)日:2025-05-02
申请号:CN202510090129.4
申请日:2025-01-21
Applicant: 中国人民解放军91776部队
IPC: G06N3/045 , G06F18/23213 , G06N3/0495
Abstract: 本发明提出了一种基于CK‑means++的稀疏注意力机制方法,运用于大语言模型训练时所需要针对稀疏注意力矩阵进行聚类的情况。本发明采用Canopy聚类和均值计方法对transformer注意力层的查询(Query)向量和键(Key)向量进行处理以确定聚类集群个数,根据集群个数采用轮盘法迭代计算确定各集群的初始中心点,然后依据聚类集群个数和各集群的初始中心点进行K‑means聚类收敛计算,最终求得与各查询(Query)向量相似度高的键(Key)向量,以此Query‑Key对计算注意力矩阵。本发明能自动计算集群个数和初始聚类中心点,缓解了聚类对人工选取这两个值的敏感问题,执行速度快,并且能避免因空间位置编码的各种组合而带来的大语言模型高复杂性,具有更好的灵活性、计算量小、鲁棒性强的优点。
-
公开(公告)号:CN116797910B
公开(公告)日:2025-05-02
申请号:CN202310825192.9
申请日:2023-07-05
Applicant: 江苏金海星导航科技有限公司
IPC: G06V10/82 , G06V10/80 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/0495 , G06N3/082
Abstract: 本发明公开一种基于分组快速空间金字塔池化的轻量化YOLO模型,包括如下步骤:步骤1)利用跨阶段局部网络和分组卷积,构建分组快速空间金字塔池化结构GFSPP;步骤2)利用通道空间意力模块(CBAM)和GFSPP结构,构建基于分组快速空间金字塔池化结构的主干网络模块GFSPP‑Backbone;步骤3)利用幻影卷积结构,构建轻型颈部网络模块Ghost‑Slim‑Neck;步骤4)按照主干网络模块GFSPP‑Backbone、颈部网络模块Ghost‑Slim‑Neck、检测头网络模块的顺序,将步骤2)、步骤3)以及检测头网络模块依次串联成为轻量化目标检测模型GFSPP‑YOLO。本发明的方法能够大幅度提升主干网络模块特征提取能力的同时,显著降低颈部网络模块的计算量。
-
公开(公告)号:CN114723633B
公开(公告)日:2025-05-02
申请号:CN202210357313.7
申请日:2022-04-02
Applicant: 北京理工大学
IPC: G06T5/90 , G06T5/60 , G06N3/0475 , G06N3/0464 , G06N3/045 , G06N3/0495 , G06N3/094 , G06N3/096 , G06N3/084 , G06V10/44 , G06V10/82
Abstract: 内镜图像偏色失真颜色实时补偿方法及装置,能够压缩GAN生成器且保证较大尺寸内窥镜图像的生成细节,在没有额外增加生成器结构的情况下提升了压缩模型生成图像的质量。该方法使用GAN compression based network作为标准网络,其包括:(1)预训练一个添加了多尺度判别器的cycle GAN网络,得到教师生成器和判别器;(2)对教师生成器使用知识蒸馏和神经元结构搜索手段进行压缩,并继承多尺度判别器训练出学生生成器;(3)评估并筛选合适的压缩模型结构,得到最终的生成器模型。
-
公开(公告)号:CN113723600B
公开(公告)日:2025-05-02
申请号:CN202010457247.1
申请日:2020-05-26
Applicant: 上海寒武纪信息科技有限公司
IPC: G06N3/0495 , G06N3/0464 , G06N3/048 , G06N3/084 , G06N3/0985 , G06N3/063
Abstract: 本公开涉及神经网络计算的方法、装置、板卡及计算机可读存储介质,其中本公开的神经网络计算装置包括在集成电路装置中,该集成电路装置包括通用互联接口和其他处理装置。神经网络计算装置与其他处理装置进行交互,共同完成用户指定的计算操作。集成电路装置还可以包括存储装置,存储装置分别与神经网络计算装置和其他处理装置连接,用于神经网络计算装置和其他处理装置的数据存储。
-
公开(公告)号:CN119904839A
公开(公告)日:2025-04-29
申请号:CN202411973649.1
申请日:2024-12-30
Applicant: 清华大学
IPC: G06V20/58 , G06V10/44 , G06V10/40 , G06V10/762 , G06V10/82 , G06N3/0464 , G06N3/0495
Abstract: 本申请涉及车辆技术领域,特别涉及一种轻量化3D占据栅格感知方法、装置、车辆及存储介质,其中,方法包括:基于轻量化网络提取多视角图像的稠密特征;对稠密特征进行自适应下采样得到稀疏特征令牌;根据相机的内外参数对特征令牌进行位置编码得到编码结果;根据编码结果和交叉注意力机制将多视角图像聚合到BEV特征图,提取融合后BEV特征图的网络特征,将网络特征输入占据栅格的预测头,预测头输出3D占据栅格的感知结果。由此,解决了相关技术模型体量较大,难以收敛,并且无法有效识别通用障碍物等问题。
-
-
-
-
-
-
-
-
-