-
公开(公告)号:CN117409093A
公开(公告)日:2024-01-16
申请号:CN202311251217.5
申请日:2023-09-22
Abstract: 本申请公开了一种特征块的压缩方法及相关设备,该方法包括:获取编码器中的注意力层输出的多个特征块;获取每两个特征块之间的第一参数;基于每两个特征块之间的第一参数,确定每个特征块的第二参数;基于每个特征块的第二参数,从多个特征块中确定出对任务重要程度较高的至少一个第一特征块;将多个特征块中的至少一个第二特征块融合到至少一个第一特征块中;至少一个第二特征块为多个图像块中除至少一个第一特征块之外的特征块。本申请实施例能够压缩特征块的数量,提升模型的推理效率。
-
公开(公告)号:CN117744730A
公开(公告)日:2024-03-22
申请号:CN202311498192.9
申请日:2023-11-09
Applicant: 华为技术有限公司
IPC: G06N3/08 , G06F18/25 , G06N3/0455 , G06N3/0464
Abstract: 提供了一种多模态模型的训练方法、训练装置以及训练设备,涉及人工智能技术领域。该多模态模型包括分别用于处理不同模态的数据的第一网络和第二网络,第一网络包括多个第一中间层,第二网络包括多个第二中间层。该方法包括:将第一数据和第二数据分别输入第一网络和第二网络;将多个第一中间层输出的一个或多个第一特征、和多个第二中间层输出的一个或多个第二特征进行融合得到融合特征;至少基于融合特征确定用于拉近所述多模态模型的预测值和真实值之间的偏差的第三损失值;根据第三损失值对多模态模型的参数进行更新。该方案通过融合两个网络的中间层特征得到的融合特征更新多模态模型的参数,可以提升多模态模型的性能。
-
公开(公告)号:CN117350913A
公开(公告)日:2024-01-05
申请号:CN202311101338.1
申请日:2023-08-29
Applicant: 华为技术有限公司
IPC: G06T1/20 , G06N3/0464 , G06N3/084 , G06V30/10
Abstract: 一种数据处理方法,应用于人工智能领域,包括:获取图像;根据尺寸范围,在所述图像上确定所述图像上的至少一个图像区域;每个所述图像区域的面积为在所述尺寸范围内确定的;所述至少一个图像区域包括多个第一图像块;根据所述第一图像上的多个第二图像块,通过图像编码器,得到特征表示;所述第二图像块与所述第一图像块不同;根据所述特征表示,对所述多个第一图像块进行预测,得到预测结果;根据所述预测结果和所述第一图像块,更新所述图像编码器。本申请在确定用于进行预测的图像区域时,图像区域的面积是灵活非固定的,令模型在学习过程中可以感知长程的文字视觉模式。
-
公开(公告)号:CN111401517B
公开(公告)日:2023-11-03
申请号:CN202010109254.2
申请日:2020-02-21
Applicant: 华为技术有限公司
IPC: G06V10/82 , G06V10/25 , G06V10/52 , G06V10/80 , G06V10/764 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/048 , G06N3/084
Abstract: 本申请公开了一种感知网络结构搜索方法,涉及人工智能领域,包括:获取待搜索感知网络和目标搜索空间,所述待搜索感知网络包括主干网络和头端header,所述主干网络与所述header连接,所述主干网络包括第一卷积层,所述header包括第三卷积层,所述目标搜索空间包括多个操作类型;在所述目标搜索空间内对所述第一卷积层进行结构搜索,在所述目标搜索空间内对所述第二卷积层进行结构搜索,在所述目标搜索空间内对所述第三卷积层进行结构搜索,得到搜索后的感知网络。本申请中结构搜索后得到的感知网络的性能更优。
-
公开(公告)号:CN115335850A
公开(公告)日:2022-11-11
申请号:CN202080099257.0
申请日:2020-03-31
Applicant: 华为技术有限公司
IPC: G06T1/20
Abstract: 一种神经网络的训练系统、方法及其相关设备,该方法可应用于人工智能的神经网络训练领域。该系统包括第一服务器和M个第二服务器,M为大于或等于2的整数;第一服务器,用于获取M个不同的第一神经网络,将M个不同的第一神经网络分别发送至M个第二服务器;M个第二服务器,用于并行对M个不同的第一神经网络执行训练操作;第一服务器,还用于接收M个第二服务器发送的M个执行过训练操作的第一神经网络,在满足预设条件的情况下,对M个执行过训练操作的第一神经网络执行神经网络选取操作;由不同的第二服务器并行对不同的神经网络进行训练,缩短了多个不同的神经网络的总训练时长,也即提高了神经网络的训练效率。
-
公开(公告)号:CN113065638A
公开(公告)日:2021-07-02
申请号:CN202110221937.1
申请日:2021-02-27
Applicant: 华为技术有限公司
Abstract: 本申请提供一种神经网络压缩方法及其相关设备,可使得压缩后的神经网络对不同图像进行不同精度的图像处理,从而保证图像处理的准确性。本申请的方法包括:获取目标图像;将目标图像输入第一神经网络,得到第二神经网络的量化比特数,其中,第二神经网络用于对目标图像进行图像处理,第二神经网络的量化比特数与图像处理所需的计算量正相关;根据第二神经网络的量化比特数,对第二神经网络的参数进行量化处理,得到量化处理后的第二神经网络。
-
公开(公告)号:CN113065638B
公开(公告)日:2025-03-11
申请号:CN202110221937.1
申请日:2021-02-27
Applicant: 华为技术有限公司
Abstract: 本申请提供一种神经网络压缩方法及其相关设备,可使得压缩后的神经网络对不同图像进行不同精度的图像处理,从而保证图像处理的准确性。本申请的方法包括:获取目标图像;将目标图像输入第一神经网络,得到第二神经网络的量化比特数,其中,第二神经网络用于对目标图像进行图像处理,第二神经网络的量化比特数与图像处理所需的计算量正相关;根据第二神经网络的量化比特数,对第二神经网络的参数进行量化处理,得到量化处理后的第二神经网络。
-
公开(公告)号:CN119494958A
公开(公告)日:2025-02-21
申请号:CN202311031199.X
申请日:2023-08-15
Applicant: 华为技术有限公司
Abstract: 本申请实施例公开了一种图像语义分割方法、装置及计算机存储介质,属于计算机视觉技术领域。所述方法包括:确定图像的多个特征;基于第一特征确定初始类别嵌入;基于至少一个第二特征和初始类别嵌入,确定学习后的类别嵌入;基于学习后的类别嵌入以及多个特征确定图像的语义分割结果。在本申请实施例中,在语义分割过程中引入类别嵌入,以通过类别嵌入与图像中的各个特征交互,进而提高图像的语义分割效果。并且,初始类别嵌入是基于图像的其中一个特征确定的,而不是随机初始化,这样初始类别嵌入已经融合有图像的空间先验信息,相对于直接将初始类别嵌入随机初始化为0,本申请实施例可以进一步提高图像的语义分割效果。
-
公开(公告)号:CN117765341A
公开(公告)日:2024-03-26
申请号:CN202211168795.8
申请日:2022-09-24
Applicant: 华为技术有限公司
IPC: G06V10/774 , G06V10/42 , G06V10/44 , G06V10/80
Abstract: 一种数据处理方法,可以应用于人工智能领域,方法包括:获取第一特征表示和第二特征表示,所述第一特征表示为根据注意力网络通过对图像中的多个图像块中不同图像块之间的信息交互得到;所述第二特征表示为基于注意力机制通过对所述图像块中的多个子图像块中不同子图像块之间的信息交互得到;将所述第一特征表示和所述第二特征表示进行特征融合,得到融合特征表示;根据所述融合特征表示,通过下游任务网络,对所述图像执行目标任务。本申请通过提取图像数据的全局特征和局部细粒度特征,提高了模型整体的精度。
-
公开(公告)号:CN117173626A
公开(公告)日:2023-12-05
申请号:CN202310940169.4
申请日:2023-07-27
Applicant: 华为技术有限公司
IPC: G06V20/52 , G06V10/24 , G06V10/40 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/048 , G06N3/0985
Abstract: 本申请实施例公开了一种目标检测方法及其相关设备,在进行目标检测的过程中,所考虑的因素较为全面,故可准确完成目标检测。本申请的方法包括:首先,可获取包含待检测的物体的目标图像,并将目标图像输入至目标模型。接着,目标模型可对目标图像进行特征提取,从而得到第一特征,并对第一特征作进一步的特征提取,从而得到第二特征。然后,目标模型可对第一特征以及第二特征进行第一融合,从而得到第一融合结果。随后,目标模型可基于第一融合结果,对第一特征以及第二特征进行增强,从而得到增强后的第一特征以及增强后的第二特征。最后,目标模型可利用增强后的第一特征以及增强后的第二特征进行检测,从而得到物体在目标图像中的位置信息。
-
-
-
-
-
-
-
-
-