-
公开(公告)号:CN116129218A
公开(公告)日:2023-05-16
申请号:CN202310060332.8
申请日:2023-01-13
Applicant: 华南理工大学
Abstract: 本发明公开一种基于迁移学习及生成对抗网络的图像数据扩增方法,包括以下步骤:利用GAN的第一图像生成器收集输入的隐向量与输出图像的样本对数据集,称为第一数据集;把第一数据集中的每一对数据融合,得到第二数据集;构建第一编码器,其输入、输出格式分别与第一数据集的图像、隐向量相同;构建第一向量判别器,其输入格式与第二数据集的数据相同;利用第一数据集以及第二数据集,对第一编码器以及第一向量判别器进行训练;收集第三数据集;对第三数据集预处理获得第四数据集;将第四数据集的图像依次输入训练后的第一编码器,得到相同数量的隐向量数据集,称为第五数据集;对GAN网络模型进行训练;利用训练后GAN网络模型进行数据扩增。
-
公开(公告)号:CN116471419A
公开(公告)日:2023-07-21
申请号:CN202310138253.4
申请日:2023-02-20
Applicant: 华南理工大学
IPC: H04N19/70 , H04N19/593 , H04N19/17
Abstract: 本发明公开的一种基于图像复杂度的多模型融合的CU划分方法,包括以下步骤:根据编码块的大小选择不同的混合模型;混合模型为预先建立并训练的模型;根据选择的模型对输入的编码单元进行处理,得到的值与编码单元的真实方差相比较,从而判断图像的复杂度,对编码单元的划分情况进行预测。本发明提供一个均值模型学习图像的均值,差值模型学习图像的方差,预测CU的划分结果,如果图像的像素值存在较大的差异,说明图像包含的信息比较多,CU倾向于划分成更小的CU,如果图像的像素值几乎相等,CU的大小基本保持不变。上述方法可以优化视频编码框架中的帧内预测模式,降低视频编码框架的编码复杂度,提升视频的编码效率。
-