一种基于迁移学习及生成对抗网络的图像数据扩增方法

    公开(公告)号:CN116129218A

    公开(公告)日:2023-05-16

    申请号:CN202310060332.8

    申请日:2023-01-13

    Abstract: 本发明公开一种基于迁移学习及生成对抗网络的图像数据扩增方法,包括以下步骤:利用GAN的第一图像生成器收集输入的隐向量与输出图像的样本对数据集,称为第一数据集;把第一数据集中的每一对数据融合,得到第二数据集;构建第一编码器,其输入、输出格式分别与第一数据集的图像、隐向量相同;构建第一向量判别器,其输入格式与第二数据集的数据相同;利用第一数据集以及第二数据集,对第一编码器以及第一向量判别器进行训练;收集第三数据集;对第三数据集预处理获得第四数据集;将第四数据集的图像依次输入训练后的第一编码器,得到相同数量的隐向量数据集,称为第五数据集;对GAN网络模型进行训练;利用训练后GAN网络模型进行数据扩增。

    一种基于图像复杂度的多模型融合的CU划分方法

    公开(公告)号:CN116471419A

    公开(公告)日:2023-07-21

    申请号:CN202310138253.4

    申请日:2023-02-20

    Abstract: 本发明公开的一种基于图像复杂度的多模型融合的CU划分方法,包括以下步骤:根据编码块的大小选择不同的混合模型;混合模型为预先建立并训练的模型;根据选择的模型对输入的编码单元进行处理,得到的值与编码单元的真实方差相比较,从而判断图像的复杂度,对编码单元的划分情况进行预测。本发明提供一个均值模型学习图像的均值,差值模型学习图像的方差,预测CU的划分结果,如果图像的像素值存在较大的差异,说明图像包含的信息比较多,CU倾向于划分成更小的CU,如果图像的像素值几乎相等,CU的大小基本保持不变。上述方法可以优化视频编码框架中的帧内预测模式,降低视频编码框架的编码复杂度,提升视频的编码效率。

Patent Agency Ranking