-
公开(公告)号:CN117764172A
公开(公告)日:2024-03-26
申请号:CN202311810815.1
申请日:2023-12-26
Applicant: 北京市商汤科技开发有限公司
Abstract: 本公开涉及一种硬件适配大模型的方法及装置、电子设备和存储介质,所述方法包括:对大模型提供平台提供的至少两个大模型进行算子抓取,得到目标算子库;接收目标硬件对所述目标算子库的接入请求;响应于所述接入请求,基于所述目标算子库,对所述目标硬件与每个大模型进行适配。本公开实施例可以为硬件方提供完整的大模型场景下的模型‑算子清单,以及可以快速实现目标硬件与每个大模型的适配。
-
公开(公告)号:CN117574980A
公开(公告)日:2024-02-20
申请号:CN202311606639.X
申请日:2023-11-28
Applicant: 北京市商汤科技开发有限公司
Abstract: 本公开提供了一种模型训练方法、装置、系统、电子设备及存储介质,该方法包括:获取生成的标准接口集合内各个标准接口的接口信息,标准接口包括运行时标准接口和算子标准接口;根据标准接口集合内标准接口的接口信息,对模型框架系统进行接口适配处理;在对神经网络模型进行训练的过程中,调用适配处理后的模型框架系统内的第一目标接口;响应于第一目标接口的调用操作,控制与模型框架系统对接的至少一个AI加速芯片执行匹配第一目标接口的目标操作,其中在模型训练结束之后得到训练后的神经网络模型,AI加速芯片与模型框架系统通信相连,AI加速芯片的至少部分软件功能模块为根据标准接口集合内接口信息开发生成的。
-
公开(公告)号:CN117825919A
公开(公告)日:2024-04-05
申请号:CN202311840107.2
申请日:2023-12-28
Applicant: 北京市商汤科技开发有限公司
Abstract: 本公开涉及一种芯片评测方法、系统、电子设备和存储介质。所述方法包括:获取预设输入数据、基准芯片对应的第一测试代码和待测芯片对应的第二测试代码;在安装有所述基准芯片的基准机器上,使用评测工具基于所述预设输入数据运行所述第一测试代码,得到所述基准芯片对应的基准输出结果;在安装有所述待测芯片的待测机器上,使用所述评测工具基于所述预设输入数据运行所述第二测试代码,得到所述待测芯片对应的待评测输出结果;将所述待评测输出结果与所述基准输出结果进行比对,得到所述待测芯片对应的评测结果。
-
公开(公告)号:CN113282535B
公开(公告)日:2022-11-25
申请号:CN202110570946.1
申请日:2021-05-25
Applicant: 北京市商汤科技开发有限公司
Abstract: 本公开实施例提供一种量化处理方法和装置、量化处理芯片,先基于各个通道的网络参数的分布特征分别确定各通道的初始量化参数,一个通道的初始量化参数是理论上符合该通道网络参数的分布特征的最优的量化参数,但该初始量化参数可能不满足层量化硬件部署条件;因此,再从基于初始量化参数确定的搜索空间内搜索各通道对应的优化量化参数,搜索到的优化量化参数的量化性能与初始量化参数接近,且能够满足层量化硬件部署条件,从而能够应用于通用量化处理芯片,并使通用量化处理芯片达到与通道量化方式接近的量化性能。
-
公开(公告)号:CN113688975A
公开(公告)日:2021-11-23
申请号:CN202110977534.X
申请日:2021-08-24
Applicant: 北京市商汤科技开发有限公司
Abstract: 本发明涉及一种神经网络的训练方法、装置、电子设备及存储介质,所述方法应用于第一处理设备,所述方法包括:获取样本图像;将携带所述样本图像的任务指令发送至第二处理设备,以使所述第二处理设备对所述样本图像进行至少一种预处理,得到目标图像;接收所述第二处理设备发送的携带所述目标图像的任务响应,并将所述目标图像输入至待训练的神经网络进行训练。由于第一处理设备将样本图像预处理的任务转移至了第二处理设备进行,从而能够降低第一处理设备的运行负荷,提高神经网络的训练速度。
-
公开(公告)号:CN113282535A
公开(公告)日:2021-08-20
申请号:CN202110570946.1
申请日:2021-05-25
Applicant: 北京市商汤科技开发有限公司
Abstract: 本公开实施例提供一种量化处理方法和装置、量化处理芯片,先基于各个通道的网络参数的分布特征分别确定各通道的初始量化参数,一个通道的初始量化参数是理论上符合该通道网络参数的分布特征的最优的量化参数,但该初始量化参数可能不满足层量化硬件部署条件;因此,再从基于初始量化参数确定的搜索空间内搜索各通道对应的优化量化参数,搜索到的优化量化参数的量化性能与初始量化参数接近,且能够满足层量化硬件部署条件,从而能够应用于通用量化处理芯片,并使通用量化处理芯片达到与通道量化方式接近的量化性能。
-
公开(公告)号:CN108256506A
公开(公告)日:2018-07-06
申请号:CN201810151829.X
申请日:2018-02-14
Applicant: 北京市商汤科技开发有限公司
IPC: G06K9/00
Abstract: 本发明公开了一种视频中物体检测方法,所述方法包括:基于目标视频确定若干个关键帧,并对每个所述关键帧进行物体检测,得到各个所述关键帧的检测结果;根据各个所述关键帧的检测结果,确定每相邻两所述关键帧之间的中间帧的检测结果;对各个所述中间帧的检测结果进行修正,得到修正后的各个中间帧的检测结果;基于各个所述关键帧的检测结果、各个修正后的所述中间帧的检测结果,确定所述目标视频的检测结果。本发明还同时公开了一种视频中物体检测装置及计算机存储介质。
-
公开(公告)号:CN119046245A
公开(公告)日:2024-11-29
申请号:CN202411147447.1
申请日:2024-08-20
Applicant: 北京市商汤科技开发有限公司
IPC: G06F16/16 , G06F16/13 , G06F16/176
Abstract: 本申请公开了一种权重文件的发送方法及装置、存储介质及电子装置,其中,上述方法包括:将第一权重文件的文件名称传入文件读取接口,并通过所述文件读取接口确定共享内存中是否存在所述文件名称对应的文件;在确定所述共享内存中存在所述文件名称对应的文件的情况下,在所述共享内存中获取所述第一权重文件,并将所述第一权重文件发送至目标加速芯片。采用上述技术方案,解决了相关技术中,每个加速芯片都分别将相同模型的权重文件读入主机内存,导致主机内存消耗较大的问题。
-
公开(公告)号:CN117829309A
公开(公告)日:2024-04-05
申请号:CN202311810556.2
申请日:2023-12-26
Applicant: 北京市商汤科技开发有限公司
Abstract: 本公开涉及一种针对AI加速芯片的自动混合精度训练方法及装置,所述方法包括:响应于AI加速芯片执行目标训练框架下的自动混合精度训练,获取当前待计算的输入数据,并从目标训练框架中预设的算子精度配置文件中查询待调用的训练算子偏好的目标数据精度;根据查询到的目标数据精度以及输入数据原始的数据精度,确定具有目标数据精度的目标输入数据,并调用训练算子对目标输入数据进行计算,以使AI加速芯片完成目标训练框架下的自动混合精度训练。本公开实施例可实现降低AI加速芯片与目标训练框架之间的适配成本,使目标训练框架可以高效地适配到不同AI加速芯片中执行自动混合精度训练。
-
公开(公告)号:CN117806849A
公开(公告)日:2024-04-02
申请号:CN202311832966.7
申请日:2023-12-27
Applicant: 北京市商汤科技开发有限公司
Abstract: 本公开涉及一种让模型运行于目标设备的方法、装置、设备及存储介质,所述方法包括:在目标设备上部署虚拟加速器,虚拟加速器中设有多种虚拟设备接口以及各种虚拟设备接口与各种CUDA接口之间的映射关系;在目标设备运行模型的过程中,利用虚拟加速器拦截模型所调用的CUDA接口,并基于映射关系,将拦截到的CUDA接口替换为对应的虚拟设备接口,并调用被替换为的虚拟设备接口,以实现在目标设备上运行模型。本公开实施例可实现让基于预设深度学习框架所构建的模型免修改地运行于目标设备。
-
-
-
-
-
-
-
-
-