任务处理方法、装置、电子设备及存储介质

    公开(公告)号:CN119830956A

    公开(公告)日:2025-04-15

    申请号:CN202411863753.5

    申请日:2022-06-21

    Abstract: 本申请提供一种任务处理方法、装置、电子设备及存储介质,该方法包括:在对Transformer模型进行训练的过程中,对于Transformer模型中的任一归一化层,确定该归一化层当前批次的第一统计值,依据该第一统计值以及该归一化层历史批次的统计值,利用滑动平均策略,对该第一统计值进行平滑处理,得到第二统计值,并利用将该归一化层的第二统计值进行前向或反向传播;在利用训练好的Transformer模型进行任务处理的过程中,对于Transformer模型中的任一归一化层,将该归一化层的统计值固定为第三统计值进行推理计算。该方法可以在降低Transformer模型的计算内存消耗的情况下,保证处理性能。

    一种模型量化方法、装置、电子设备及存储介质

    公开(公告)号:CN119337045A

    公开(公告)日:2025-01-21

    申请号:CN202411873806.1

    申请日:2024-12-18

    Abstract: 本申请实施例提供了一种模型量化方法、装置、电子设备及存储介质,涉及深度学习技术领域。方法包括:获取原始模型中待量化网络层的待量化权重矩阵;将待量化权重矩阵中各权重分为多个权重组;计算各权重组对应的第一模型损失;按照对应的第一模型损失从大到小的顺序确定当前待处理的权重组;以当前待处理的权重组对应的第二模型损失最小为优化目标,基于目标量化格式确定当前待处理的权重组的目标量化结果;按照对应的第一模型损失从大到小的顺序确定当前待处理的权重组,直至得到各权重组的目标量化结果;基于各权重组的目标量化结果得到量化后的目标模型。如此可以对原始模型进行量化,且量化后的目标模型的模型损失较小。

    视频分析方法、装置、设备及存储介质

    公开(公告)号:CN119152422A

    公开(公告)日:2024-12-17

    申请号:CN202411658736.8

    申请日:2024-11-20

    Abstract: 本申请提供一种视频分析方法、装置、设备及存储介质,应用于计算机技术、视频识别技术领域。该方法包括:基于预先训练的视频文本多模态模型,对预先获取的多个视频序列进行推理得到视频特征,进而对视频特征和特征底库进行相似度计算,得到每个视频序列对应的相似度结果,基于预先设定的相似度阈值和每个视频序列对应的相似度结果,在多个视频序列中,确定出至少一个异常视频序列,将至少一个异常视频序列和每个异常视频序列对应的行为特征推送至用户,基于用户对异常视频的标定对特征底库进行更新。通过上述方法提高了视频中目标行为分析的准确性和分析效率,通过不断接收用户反馈优化模型,对异常行为的检测能力逐渐增强,提高了用户体验。

    一种自注意力机制计算方法、推理方法

    公开(公告)号:CN118396039A

    公开(公告)日:2024-07-26

    申请号:CN202410852330.7

    申请日:2024-06-27

    Abstract: 本申请实施例提供了一种自注意力机制计算方法、推理方法,该方法包括:基于待处理对象确定查询矩阵、键矩阵、以及值矩阵;待处理对象包括图像、文本、视频、音频、信号中的任一种或多种;并计算查询矩阵与转置后键矩阵的乘积,作为第一乘积矩阵;以自然常数e为底数,并以第一乘积矩阵为指数,得到第二乘积矩阵;若值矩阵的列数小于第一乘积矩阵的列数,计算第二乘积矩阵与值矩阵的乘积,作为第三乘积矩阵;计算第二乘积矩阵的和值,作为矩阵和值;并计算第三乘积矩阵与矩阵和值的比值,作为基于自注意力机制得到的输出特征。应用本申请实施例提供的技术方案,能够提高基于自注意力机制的推理任务的效率。

    一种数据块处理方法、装置及电子设备

    公开(公告)号:CN111753949B

    公开(公告)日:2024-06-07

    申请号:CN201910245117.9

    申请日:2019-03-28

    Abstract: 本发明实施例提供了一种数据块处理方法、装置及电子设备。其中,所述方法包括:获取多个经过裁剪处理的输入数据块,所述输入数据块中的特征数据设置有标签,所述标签用于表示特征数据在经过裁剪处理前所处的位置;针对所述多个输入数据块中的每个特征数据,将该特征数据,和与该特征数据的标签相同的特征数据进行预设计算,得到计算结果;将所述计算结果存放于输出数据块中该特征数据的标签所表示的位置。可以在输入数据块尺寸不同的情况下,实现对输入数据块的元素级操作。由于不要求输入数据块的尺寸相同,因此可以输入数据块的裁剪方式可以相对独立,即可以分别针对每个输入数据块进行独立优化,可以有效降低神经网络的优化难度。

    网络模型裁剪方法、装置、电子设备及可读存储介质

    公开(公告)号:CN113537377B

    公开(公告)日:2024-01-23

    申请号:CN202110859748.7

    申请日:2021-07-28

    Abstract: 本申请提供一种网络模型裁剪方法、装置、电子设备及可读存储介质,该方法包括:对原始网络模型进行稀疏约束训练;依据同一训练过程中对所述原始网络模型进行不同轮数的稀疏约束训练的训练结果统计N1条裁剪参数‑优化目标量曲线,直至统计得到的裁剪参数‑优化目标量曲线满足预设停止规则;依据所述N1条裁剪参数‑优化目标量曲线,以及预设裁后优化目标量,确定第一目标裁剪参数;依据所述第一目标裁剪参数确定各层的裁剪比例;依据各层的裁剪比例,对所述原始网络模型进行变权重稀疏约束训练,得到原始网络模型对应的稀疏模型,并依据各层的裁剪比例对所述稀疏模型进行裁剪。该方法可以实现基于变权重稀疏约束的网络模型自动裁剪。

    一种任务分配方法、装置及系统
    8.
    发明公开

    公开(公告)号:CN116820769A

    公开(公告)日:2023-09-29

    申请号:CN202310799474.6

    申请日:2023-06-30

    Abstract: 本申请实施例提供了一种任务分配方法、装置及系统,通过设置多个等待队列和预设阈值,将目标用户端提交的目标任务分配至多个等待队列中,这样使得每个用户端在高优先级等待队列中的任务数有限,且每个用户端在高优先级等待队列中都有提交的任务,每个用户端提交的任务都可以快速地被响应,可以避免因为某一用户端提交任务过多,服务端只处理该用户端提交的任务,每个用户端在针对其他用户端而言,都有任务在高等待队列中,提高了服务端的执行效率。

    目标检测方法、装置及存储介质

    公开(公告)号:CN111783797B

    公开(公告)日:2023-08-18

    申请号:CN202010610242.8

    申请日:2020-06-30

    Abstract: 本发明实施例提供一种目标检测方法、装置及存储介质,通过对待检测图像进行特征提取和特征融合,得到多张不同尺度的第一特征图,分别对多张不同尺度的第一特征图进行目标检测,得到第一目标检测结果。通过对第一目标检测结果中的各目标框对应的类别分数信息进行修正,得到修正后的第二目标检测结果。再对第二目标检测结果中的各目标框进行非极大值抑制,确定最终的目标检测结果。上述方法可有效降低相近类别之间的误检,提高目标检测的准确性。

Patent Agency Ranking