一种确定目标位置的方法、装置及存储介质

    公开(公告)号:CN116912472A

    公开(公告)日:2023-10-20

    申请号:CN202310822865.5

    申请日:2023-07-05

    Inventor: 茅心悦 张园

    Abstract: 本公开涉及目标检测领域,公开了一种确定目标位置的方法、装置及存储介质,该方法为:对各个控制点进行拟合,得到包括多个采样点的曲线,其中,控制点是通过卷积神经网络对包含待检测目标的图像进行识别确定的,采样点的坐标与控制点的坐标不同,基于各个采样点和目标图形的中心点之间的距离,从各个采样点中筛选出多个有效采样点,其中,目标图形是通过分割神经网络对包含待检测目标的图像进行识别确定的像素点的集合,基于各个有效采样点对应的方向角确定待检测目标的关键点,将关键点的坐标确定为待检测目标的目标位置,其中,方向角为有效采样点和中心点之间的角度,用关键点检测来确定待检测目标的目标位置的方式,使得定位更加准确。

    一种图像分类模型生成方法、装置、设备及存储介质

    公开(公告)号:CN116778254A

    公开(公告)日:2023-09-19

    申请号:CN202310825795.9

    申请日:2023-07-06

    Abstract: 本申请实施例提供了一种图像分类模型生成方法、装置、设备及存储介质,涉及人工智能技术领域,该方法包括:先采用带有预设标签的待分类图像对图像分类模型进行训练,在至少一次训练结束后,针对任一特征提取层,从特征提取层的多个掩码矩阵中,获取特征提取层对应的失活掩码矩阵,其中,失活掩码矩阵用于指示特征提取层中不参与后续训练的掩码矩阵,可以降低模型训练的复杂度,提高模型训练效率。在训练结束后,针对任一特征提取层,基于特征提取层对应的失活掩码矩阵,从特征提取层删除失活掩码矩阵对应的滤波器,从而得到训练好的图像分类模型,而不用再进行图像分类模型的微调,可以进一步提高模型训练效率,提高模型剪枝效率。

    图像编解码方法、系统、装置、设备及介质

    公开(公告)号:CN119027519A

    公开(公告)日:2024-11-26

    申请号:CN202310588587.1

    申请日:2023-05-23

    Abstract: 本公开提供了一种图像编解码方法、系统、装置、设备及介质,涉及机器视觉编解码技术领域。该方法包括:将原始图像划分为M个非重叠的分块;计算每个分块区域内所有像素基于Laplacian二阶差分的梯度平均值;根据梯度平均值的大小,将M个分块进行排序,其中,分块的梯度平均值越大,则所述分块区域中的信息越密集;去除排序靠后的q个分块后,得到目标分块,其中,q是根据去除前的分块数量M和预设图像压缩比计算得到的;基于目标分块及目标分块在原始图像中的位置关系,进行编码得到压缩数据。根据本公开实施例,能够针对被压缩图像的不同信息区域,进行有选择、可控制地压缩,任务时延较短,计算效率较高,不会对机器视觉任务产生影响。

    图像处理方法、装置、系统和计算机可读存储介质

    公开(公告)号:CN115150622B

    公开(公告)日:2024-11-22

    申请号:CN202110339333.7

    申请日:2021-03-30

    Abstract: 本公开涉及一种图像处理方法、装置、系统和计算机可读存储介质,涉及计算机技术领域。本公开的方法包括:针对神经网络中多个备选层中每个备选层,将该备选层输出的图像的特征值按照预设方式进行压缩,得到压缩的特征值;将压缩的特征值输入该备选层之后连接的层,确定神经网络的评价指标值;在神经网络的评价指标值达到预设值的情况下,确定该备选层对应的压缩的特征值的数据量,作为该备选层的参考指标;根据各个备选层的参考指标选取一个备选层作为待压缩层,以便在使用神经网络的过程中,将待压缩层输出的特征值进行压缩。

    基于机器视觉模型的编码解码器训练方法、装置及设备

    公开(公告)号:CN118828010A

    公开(公告)日:2024-10-22

    申请号:CN202310431267.5

    申请日:2023-04-20

    Abstract: 本公开提供一种基于机器视觉模型的编码解码器训练方法、装置及设备,涉及计算机技术领域,该方法具体包括:通过机器视觉模型输出的机器视觉模型特征,得到机器视觉模型特征的均方误差损失,通过编码解码器的原始均方误差损失,和机器视觉模型特征的均方误差损失的加权和,对编码解码器进行训练。利用机器视觉模型特征对编码解码器的联合训练,对编码解码器的训练过程进行反向传播,可以提升编码解码器和机器视觉模型之间的匹配度,以此提升已训练的编码解码器的输出在机器视觉模型中执行智能任务时的精度。

    I帧重建方法、装置、设备及存储介质

    公开(公告)号:CN118827955A

    公开(公告)日:2024-10-22

    申请号:CN202310436411.4

    申请日:2023-04-21

    Abstract: 本公开提供了一种I帧重建方法、装置、设备及存储介质。涉及通信编码领域,通过获取I帧编码后的编码特征,然后将编码特征输入特征与的帧内人眼视频模型,以使特征域的帧内人眼视频模型对编码特征进行解码以及人眼适配图像重建,得到重建后的I帧,可以使得重建后的I帧更加能够满足人眼视觉需求,使得基于重建后的I帧生成到的重建视频的视频质量较高,在用户观看视频时,可以提高用户观看视频的体验。

    一种面向机器视觉的运动估计方法和装置

    公开(公告)号:CN118803267A

    公开(公告)日:2024-10-18

    申请号:CN202310403893.3

    申请日:2023-04-14

    Abstract: 本公开提供了一种面向机器视觉的运动估计方法,涉及机器视觉数据通信中信号编码技术领域。该方法包括:获取从视频序列中抽帧得到的第一图像帧和第二图像帧,确定目标对象在第一图像帧内的边界框;确定第一图像帧的边界框内的有效角点;根据第一图像帧的边界框内的有效角点,确定目标对象在第一图像帧与第二图像帧之间的移动距离;根据目标对象在第一图像帧与第二图像帧之间的移动距离,确定目标对象在第一图像帧与第二图像帧之间的移动速度;根据目标对象在第一图像帧与第二图像帧之间的移动速度,确定目标对象的运动估计值。本发明提升了运动估计的精准度。

    图像特征的传输方法、装置和系统

    公开(公告)号:CN115147500B

    公开(公告)日:2024-06-28

    申请号:CN202110339533.2

    申请日:2021-03-30

    Abstract: 本公开涉及一种图像特征的传输方法、装置和系统,涉及通信技术领域。该传输方法包括:利用机器学习模型,提取待处理图像对于各通道的特征矩阵;根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对;根据信息量大小,在各关联矩阵对的两个特征矩阵中确定表征矩阵和被表征矩阵;确定各表征矩阵与各被表征矩阵的对应关系;将各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值进行量化处理和编码处理后,传输给译码端。

    图像序列抽帧处理方法、视频编码和解码方法及相关设备

    公开(公告)号:CN118057815A

    公开(公告)日:2024-05-21

    申请号:CN202211449877.X

    申请日:2022-11-18

    Abstract: 本公开提供了一种图像序列抽帧处理方法、视频编码和解码方法及相关设备,涉及机器视觉技术领域。该方法包括:获取图像序列,其中,图像序列中包含:目标对象在移动过程中的多帧图像;确定图像序列中符合预设条件的目标对象数量和/或图像序列的移动速度;根据图像序列中符合预设条件的目标对象数量和/或图像序列的移动速度,确定对图像序列进行抽帧处理的抽帧参数信息。本公开能够实现对图像/视频序列的自适应抽帧编码,可以应用于各种面向机器视觉的图像/视频编码。

    红外图像处理方法、装置、电子设备及存储介质

    公开(公告)号:CN117934639A

    公开(公告)日:2024-04-26

    申请号:CN202211255737.9

    申请日:2022-10-13

    Abstract: 本公开提供了一种红外图像处理方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体方法如下:根据待压缩红外图像中每个像素点的像素值,以及第一预设数值,确定待压缩红外图像的掩膜像素阈值,将待压缩红外图像中像素值小于或者等于掩膜像素阈值的区域作为掩膜区域,并将掩膜区域中的信号值量化为第二预设数值,得到掩膜图像,将待压缩红外图像中,与掩膜图像的掩膜区域对应的区域转换为量化死区,得到掩膜红外图像,并对掩膜红外图像进行编码压缩处理得到无格式压缩码流文件。通过上述方式,可以有效降低压缩码流,增加压缩比,扩大量化死区,并提高执行智能任务时的精度。

Patent Agency Ranking