图像局部描述子的压缩方法、视觉地图定位方法及系统

    公开(公告)号:CN118827991A

    公开(公告)日:2024-10-22

    申请号:CN202410790905.7

    申请日:2024-06-19

    Abstract: 本发明提供一种图像局部描述子的压缩方法、视觉地图定位方法及系统。所述方法包括:获取指定训练数据集中相互匹配的第一图像特征数据及第二图像特征数据;将指定训练数据集的描述子传入带瓶颈层的自编码网络模块,以输出重建特征;设定损失函数,并基于所述输出重建特征计算特征匹配数据集;对照所述特征匹配数据集与所述训练数据集以调整所述损失函数;获取待压缩图像特征数据并将待压缩图像特征数据传入自编码网络模块,经过编码层与瓶颈层,以输出地图压缩数据。本发明能够在确保图像匹配准确度的情况下进一步减小图像局部描述子的存储量。

    时域上采样模型训练、解码方法、装置、设备及存储介质

    公开(公告)号:CN118803241A

    公开(公告)日:2024-10-18

    申请号:CN202310403858.1

    申请日:2023-04-14

    Abstract: 本公开提供了一种时域上采样模型训练、解码方法、装置、设备及存储介质,涉及视频编解码技术领域。时域上采样模型训练方法包括:获取第一重构序列和第一视频,第一重构序列由第一视频经时域下采样、编码及解码处理得到;获取初始时域上采样模型和第一特征提取网络;根据初始时域上采样模型对第一重构序列进行上采样,得到第二视频;根据第一特征提取网络,分别对第一视频和第二视频进行特征提取,得到第一特征数据和第二特征数据;确定第一特征数据和第二特征数据之间的第一损失值;根据第一损失值对初始时域上采样模型进行训练,得到目标时域上采样模型。通过上述训练方式得到的目标时域上采样模型可以更好地满足视觉任务的需求。

    在多个子网格中进行量化的方法和装置

    公开(公告)号:CN118786465A

    公开(公告)日:2024-10-15

    申请号:CN202480001109.9

    申请日:2024-02-05

    Abstract: 一种方法,包括:接收包括多个子网格的输入网格;针对多个子网格中的相应子网格,确定包围相应子网格的子网格边界框;针对相应子网格,确定相应子网格中的坐标,其中,坐标是相应子网格中具有最小值的最小坐标;基于坐标和子网格边界框,为相应子网格确定第一位深度,其中,第一位深度是根据相应子网格的面积变化的自适应位深度;确定第二位深度,第二位深度是相应子网格的第一位深度和为多个子网格中的每个剩余子网格确定的第一位深度中的最大值;基于第二位深度对相应子网格进行量化以生成相应量化的子网格;以及对相应量化的子网格进行编码。

    视频的编、解码方法、装置、设备和存储介质

    公开(公告)号:CN114257818B

    公开(公告)日:2024-09-24

    申请号:CN202011004238.3

    申请日:2020-09-22

    Abstract: 本申请实施例提供了一种视频的编、解码方法、装置、设备和存储介质,以简化编解码的网络结构,提高编解码效率。所述方法包括:将目标帧输入到编码网络中,获取所述目标帧的第一特征信息,其中,所述编码网络为关键帧的编码网络;获取参考帧通过编码网络处理的第二特征信息,其中,所述参考帧为目标帧的相邻N帧;依据所述第一特征信息和第二特征信息,确定待压缩的目标特征信息;对所述目标特征信息进行熵编码,得到目标帧的压缩信息。能够复用关键帧的编码网络对非关键帧进行编码,得到压缩信息,提高编码效率。

    编码方法、装置及编解码系统

    公开(公告)号:CN111556317B

    公开(公告)日:2024-09-13

    申请号:CN202010327178.2

    申请日:2020-04-23

    Inventor: 张文强 范志刚

    Abstract: 本公开提供一种编码方法、装置及编解码系统,涉及计算机编码领域,该编码方法包括:获取当前帧图像,所述当前帧图像被划分为多个宏块,每个宏块包括M*N个像素,其中,M、N为正整数;提取所述当前帧图像的背景色,并生成背景色信息;判断每个宏块中像素点的值和背景色信息是否一致;根据判断结果和预设规则识别出第一类型宏块;将所述第一类型宏块按照第一编码方式进行编码,得到第一编码数据。本公开提供的实施例能够适配桌面图像的特点,能够有效降低带宽。

    视频编解码的方法、装置、系统、介质及存储码流的方法

    公开(公告)号:CN118632011A

    公开(公告)日:2024-09-10

    申请号:CN202410754883.9

    申请日:2020-12-16

    Abstract: 本申请提供了一种视频编解码的方法、装置、系统、介质及存储码流的方法。方法包括:接收已编码图片的第一切片的第一视频编码层VCL网络抽象层NAL单元和已编码图片的第二切片的第二VCL NAL单元,第一VCL NAL单元具有第一VCL NAL单元类型,第二VCL NAL单元具有不同于第一VCL NAL单元类型的第二VCL NAL单元类型;以及基于第一VCL NAL单元的第一VCL NAL单元类型和第二VCL NAL单元的第二VCL NAL单元类型,确定已编码图片的图片类型,包括:基于第一VCL NAL单元类型,指示第一VCL NAL单元包含逐渐解码刷新GDR图片已编码切片;以及基于第二VCL NAL单元类型,指示第二VCL NAL单元不包含瞬时解码刷新IDR图片已编码切片或干净随机存取CRA图片已编码切片,确定已编码图片是拖尾图片。

Patent Agency Ranking