-
公开(公告)号:CN119743609A
公开(公告)日:2025-04-01
申请号:CN202411950991.X
申请日:2024-12-27
Applicant: 中国科学院深圳先进技术研究院
IPC: H04N19/182 , H04N19/136 , H04N19/154 , G06T9/00
Abstract: 本申请公开了一种图像级JND阈值预测方法、装置、设备以及存储介质,所述方法包括:获取参考图像和失真图像,并根据人眼视觉机理因素计算所述参考图像的像素级JND图;根据所述参考图像、失真图像和像素级JND图构建视觉机理与数据联合驱动的JND训练样本对,并通过特征提取网络对所述JND训练样本进行中间层特征图提取;根据中间层特征图进行内容感知处理,再进行感知失真预测,得到感知失真预测标签序列集合;采用二分块的图像级JND阈值搜索策略对所述感知失真标签序列集合进行纠错处理,得到最终的图像级JND阈值预测结果。本申请实施例通过采用视觉机理辅助数据驱动的策略和二分块的JND搜索策略,提高了图像级JND阈值预测方法的精准度,增强了图像编码性能。
-
公开(公告)号:CN118368419A
公开(公告)日:2024-07-19
申请号:CN202410382665.7
申请日:2024-04-01
Applicant: 中国科学院深圳先进技术研究院
IPC: H04N19/119 , H04N19/14 , H04N19/70 , G06T9/00 , G06T19/00 , G06V10/764 , G06V10/771 , G06N20/00
Abstract: 本申请涉及一种基于机器学习预测的动态点云低复杂度编码方法及装置。所述方法包括:对待编码的点云视频进行编码,并在编码过程中提取当前编码单元的二维编码特征和点云编码特征,构建用于机器学习预测的特征集;计算所述特征集中每个特征的重要度以及特征与特征之间的冗余度,根据所述重要度和冗余度对所述特征集进行筛选,得到筛选后的特征集;将所述筛选后的特征集输入包括多个分类器的SVM,所述SVM利用多个分类器预测当前编码单元是否提前终止编码操作。本申请实施例通过借鉴传统二维编码复杂度优化领域的经验,并深入分析V‑PCC点云编码的特性,具有更好的编码性能,且不受内部二维编码器种类的限制,具有较强的普适性。
-
公开(公告)号:CN118368418A
公开(公告)日:2024-07-19
申请号:CN202410373024.5
申请日:2024-03-29
Applicant: 中国科学院深圳先进技术研究院
IPC: H04N19/119 , H04N19/14 , H04N19/70
Abstract: 本申请涉及一种动态点云低复杂度编码方法、装置、设备以及存储介质。所述方法包括:在编码过程中提取当前编码单元的纹理信息,根据纹理信息计算当前编码单元的纹理复杂度;分别提取当前编码单元与相邻编码单元之间的空间关联性特征信息、父子关联性特征信息以及帧间帧内特征信息,并根据所述空间关联性特征信息、父子关联性特征信息和帧间帧内特征信息计算所述当前编码单元的自适应纹理阈值;将所述当前编码单元的纹理复杂度与自适应纹理阈值进行对比,根据对比结果判断所述当前编码单元的纹理类型,确定是否对当前编码单元的编码结果执行分区编码操作。本申请实施例既具有更好的编码性能,且不受内部二维编码器种类的限制,具有较强的普适性。
-
公开(公告)号:CN118351325A
公开(公告)日:2024-07-16
申请号:CN202410341147.0
申请日:2024-03-25
Applicant: 中国科学院深圳先进技术研究院
Abstract: 本申请公开了一种点云颜色上采样方法及系统,运用于点云处理技术领域,其方法包括:获取几何信息对稀疏颜色信息进行上采样,通过颜色上采样生成粗颜色集;基于所述几何信息与深度神经网络,提取高维颜色特征;采用局部距离差作为权重定位邻域点的特征,得到所述几何信息加权的局部重要颜色特征;基于所述高维颜色特征与所述局部重要颜色特征的融合,获取高维局部颜色特征;通过所述高维局部颜色特征对所述粗颜色集进行细化,得到细粒度颜色集;有效地实现了对点云颜色的上采样,提供了高质量的颜色信息。
-
公开(公告)号:CN107690069B
公开(公告)日:2021-01-01
申请号:CN201710751982.1
申请日:2017-08-28
Applicant: 中国科学院深圳先进技术研究院
IPC: H04N19/103 , H04N19/147 , H04N19/159 , H04N19/94
Abstract: 本发明涉及一种数据驱动的级联视频编码方法,通过编码模式决策器的级联,以及编码模式决策数据,提高单级编码单元模式决策器的决策准确度和编码效率的控制,有效降低视频编码的编码复杂度。将多个单级编码单元模式决策器级联,有效进一步减少单一编码单元模式决策器决策过程中的分类不确定性问题;因此,有效提高编码单元模式决策准确性,降低了高效视频编码的计算复杂度的同时,提高了高效视频编码的有效性。
-
公开(公告)号:CN106162167B
公开(公告)日:2019-05-17
申请号:CN201510137157.3
申请日:2015-03-26
Applicant: 中国科学院深圳先进技术研究院
IPC: H04N19/103 , H04N19/147
Abstract: 基于学习的高效视频编码方法采用高效视频编码器编码视频序列,提取每个编码单元块对应的特征向量;将提取的特征向量与最佳编码单元尺寸输入三值输出的学习机,建立学习模型。在高效视频编码器中进行编码单元尺寸的选择过程加入早期终止策略结构,首先执行直接模式和融合模式当前块,提取对应的当前编码对应的特征向量。将特征向量输入已学习好了的学习机模型,输出预测值,按照对应早期终止策略结构执行当前编码单元尺寸。直至编码树单元中所有的编码单元层都编码完成;重复执行直至所有视频帧中编码树单元都编码完成。因此,能够根据率失真代价以及计算复杂度对应输出最优的编码过程,提高分类器的学习和分类性能,进而提高视频编码的编码效率。
-
公开(公告)号:CN105306947B
公开(公告)日:2018-08-07
申请号:CN201510708472.7
申请日:2015-10-27
Applicant: 中国科学院深圳先进技术研究院
IPC: H04N19/40 , H04N19/147 , H04N19/96 , H04N19/103
Abstract: 本发明涉及种基于机器学习的视频转码方法,将原始视频中编码单元的四叉树分割摸式模型化为若干个不同层次的二进制分类器,然后再选取最优特征集,最后再对特征矢量和最佳的编码参数构成的数据集合进行学习,即将机器学习的方法引入到视频转码中,将视频编码中的参数确定问题转化为分类问题。因而能够根据当前编码单元的大小选取相应的分类器,并将分类概率值与相应的自适应阈值进行比较,从而选取最佳编码参数进行编码。且自适应概率阈值针对不同视频场景自适应调整,因此,能够得到最优的转码速度和转码质量使得转码过程中功耗较小,在保证转码率失真性能的前提下有效降低转码的复杂度。
-
公开(公告)号:CN104581181B
公开(公告)日:2017-12-05
申请号:CN201310474376.1
申请日:2013-10-11
Applicant: 中国科学院深圳先进技术研究院
IPC: H04N19/593 , H04N19/11 , H04N19/147
Abstract: 本发明涉及视频信号处理方法技术领域,提供了一种基于备选模式列表优化的帧内编码方法,包括:步骤A:得到最初的备选模式列表CML;步骤B:重新确定与优化备选模式列表CML;步骤C:对所述重新确定的备选模式列表CML中的模式逐一计算代价,将率失真代价最小的备选模式选择为最佳帧内预测模式。本发明通过重新确定备选模式列表CML减少备选模式从而实现帧内快速编码,在不降低编码后视频质量的前提下,有效地降低了帧内编码过程的复杂度。
-
公开(公告)号:CN104581181A
公开(公告)日:2015-04-29
申请号:CN201310474376.1
申请日:2013-10-11
Applicant: 中国科学院深圳先进技术研究院
IPC: H04N19/593 , H04N19/11 , H04N19/147
Abstract: 本发明涉及视频信号处理方法技术领域,提供了一种基于备选模式列表优化的帧内编码方法,包括:步骤A:得到最初的备选模式列表CML;步骤B:重新确定与优化备选模式列表CML;步骤C:对所述重新确定的备选模式列表CML中的模式逐一计算代价,将率失真代价最小的备选模式选择为最佳帧内预测模式。本发明通过重新确定备选模式列表CML减少备选模式从而实现帧内快速编码,在不降低编码后视频质量的前提下,有效地降低了帧内编码过程的复杂度。
-
公开(公告)号:CN103813149A
公开(公告)日:2014-05-21
申请号:CN201210460004.9
申请日:2012-11-15
Applicant: 中国科学院深圳先进技术研究院
IPC: H04N13/00
Abstract: 本发明公开了一种编解码系统的图像与视频重构方法,主要包括以下步骤:S1、利用采集的原始深度图像和原始彩色图像生成参考虚拟视点图像序列;S2、对原始深度图像和原始彩色图像进行编码形成压缩视频流;S3、对压缩视频流进行解码,得到失真图像,并采用失真图像绘制生成第一失真虚拟视点图像序列。本发明不仅能够有效克服传统方案所存在的全局深度值失真,满足人们的现实需求,而且与现有技术相比,其PSNR(Peak?Signal-to-Noise?Ratio,峰值信噪比)可提高约为0.3dB~1.2dB,BDPSNR可提高约为0.4dB~1.0dB。
-
-
-
-
-
-
-
-
-