-
公开(公告)号:CN118828017A
公开(公告)日:2024-10-22
申请号:CN202410963351.6
申请日:2024-07-18
Applicant: 上海大学
IPC: H04N19/593 , H04N19/597 , H04N19/88 , H04N19/31 , H04N19/33 , H04N19/132
Abstract: 本发明提供一种基于稀疏编码与角度重建的光场视频压缩方法及系统,其中方法包括:提供一角度下采样光场视频数据集;对所述角度下采样光场视频数据集进行MV‑HEVC编解码,得到解码光场视频数据集;对所述解码光场视频数据集进行光场视频角度重建,完成对光场视频的压缩。本发明首先对光场视频进行角度下采样,利用MV‑HEVC对稀疏视点进行编解码,然后利用一个时间‑空间‑角度联合重建网络充分提取光场的时间、空间和角度信息,以重建出完整的高质量的光场视频。该系统可实现光场视频的高效压缩,在压缩比特率和重建质量上均有较大改善。
-
公开(公告)号:CN116156202A
公开(公告)日:2023-05-23
申请号:CN202310082534.2
申请日:2023-01-18
Applicant: 上海大学
IPC: H04N19/65 , H04N19/60 , G06T9/00 , G06T3/40 , G06N3/045 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/084
Abstract: 本发明提供一种实现视频错误隐藏的方法、系统、终端及介质,其中将原始视频经编解码压缩后形成测试集和训练集;对测试集和训练集进行抽帧处理,在进行掩码块操作,得到网络训练集;构建网络模型,对网络模型进行训练,得到视频错误隐藏模型;将视频帧测试集输入视频错误隐藏模型,输出重建帧;模型的生成器采用Video Swin Transformer网络对输入的视频帧测试集进行视频帧多层特征提取,之后将不同层次的特征进行融合用于视频丢失或受损区域的重建,输出重建帧。本发明解决了不能对VVC标准压缩视频的丢失或受损区域进行有效恢复的问题,同时克服了传统卷积神经网络不能兼顾并行执行和长程时间依赖性建模能力的弊端。
-
公开(公告)号:CN115052146A
公开(公告)日:2022-09-13
申请号:CN202210689127.3
申请日:2022-06-16
Applicant: 上海大学
IPC: H04N19/124 , H04N19/132 , H04N19/149 , H04N19/52 , H04N19/567 , H04N19/59 , G06V10/764 , G06V10/774
Abstract: 本发明提供一种基于分类的内容自适应下采样视频编码优化方法,包括:确定数据库中每个待编码视频序列的标签,标记其适用于原分辨率直接编码或下采样后编码;提取训练和测试视频序列的特征;采用支持向量机对训练视频序列按标签进行分类,获得训练模型;采用训练模型对测试视频序列进行标签预测,获得测试模型;对测试模型进行准确性与性能分析。本发明结合支持向量机与特征提取算法,实现在保证编码质量的同时,自适应地选择待编码序列的分辨率,进一步节省了码率资源,具有流程简单、算法时间复杂度低、视频分类准确性高等优点。
-
公开(公告)号:CN114998404A
公开(公告)日:2022-09-02
申请号:CN202210693473.9
申请日:2022-06-17
Applicant: 上海大学
Abstract: 本发明提供一种基于深度学习的点云上采样方法,包括:计算稀疏点的法向量,并在其切平面生成栅格点;根据所述栅格点与其邻近稀疏点的相对位置信息,使用深度学习方法对所述栅格点进行线性组合,生成3D平面点;根据所述3D平面点之间的相对位置关系和所述3D平面点与所述邻近稀疏点的相对位置关系,使用深度学习模型计算各3D平面点的移动偏置,获得最终的上采样点。本发明实施例中一种基于深度学习的点云上采样方法,引入栅格点辅助进行点云上采样,利用点云间相对位置关系的同时,加深点云上采样块之间的联系,从而达到更好的点云上采样效果。
-
公开(公告)号:CN113643262A
公开(公告)日:2021-11-12
申请号:CN202110946915.1
申请日:2021-08-18
Applicant: 上海大学
Abstract: 本发明公开了一种无参考全景图像质量评价方法、系统、设备及介质,包括:对全景图像进行下采样,生成不同尺度的图像;对所述不同尺度的图像,计算每个尺度图像HSV特征;计算所述全景图像的MSCN系数,将MSCN系数拟合成广义高斯分布和非对称性广义高斯分布,从中提取BRI SQUE特征;将得到的不同尺度图像的HSV特征和BRI SQUE特征组合在一起,作为整体特征输入到回归模型中进行训练及预测,得到全景图像的最终质量分数。通过本发明,结合了全景图像的统计特性以及人类视觉系统的观察特性,与其他的无参考图像质量评价相比,具有更好的准确性。
-
公开(公告)号:CN107798687B
公开(公告)日:2021-08-06
申请号:CN201710878115.4
申请日:2017-09-26
Applicant: 上海大学
Abstract: 本发明公开了一种基于稀疏时变图的幻灯片切换检测方法。对多摄像机拍摄的有演讲者,幻灯片和观众的演讲视频,首先通过特征点检测和匹配将视频分段,通过对每个时间点将每段视频作为节点建立稀疏图,可以将幻灯片切换检测问题转化为推测图邻接矩阵问题。邻接矩阵间的变化反映出了幻灯片切换。本发明是一种准确性更好的克服演讲视频有镜头移动、演讲者移动和多个PTZ镜头切换干扰的方法,利用每个时刻推断出的邻接矩阵,得到的检测结果没有出现检测到人以及人和幻灯片切换的问题。并且比现有方法精确度高,扩大了可处理的演讲视频种类的范围。
-
公开(公告)号:CN111787187B
公开(公告)日:2021-07-02
申请号:CN202010747063.9
申请日:2020-07-29
Applicant: 上海大学
Abstract: 本发明提供了一种利用深度卷积神经网络进行视频修复的方法、系统、终端,包括:对原始视频数据集进行预处理,形成训练集;构建特征提取网络模型;构建损失函数;联合利用训练集和损失函数对构建的特征提取网络模型进行训练,通过训练生成的结果,对模型进行调参,得到最终的视频修复模型;利用得到的视频修复模型对视频进行修复。本发明提供的利用深度卷积神经网络进行视频修复的方法、系统、终端,改变了传统方法依靠人工定义和提取特征的弊端,利用深度卷积神经网络强大的特征提取能力,加上帧间的边缘信息作为修复引导,使得视频帧在空域和时域上的特征得到尽可能多的利用,同时提升了视频修复的主、客观质量评价指标。
-
公开(公告)号:CN111787187A
公开(公告)日:2020-10-16
申请号:CN202010747063.9
申请日:2020-07-29
Applicant: 上海大学
Abstract: 本发明提供了一种利用深度卷积神经网络进行视频修复的方法、系统、终端,包括:对原始视频数据集进行预处理,形成训练集;构建特征提取网络模型;构建损失函数;联合利用训练集和损失函数对构建的特征提取网络模型进行训练,通过训练生成的结果,对模型进行调参,得到最终的视频修复模型;利用得到的视频修复模型对视频进行修复。本发明提供的利用深度卷积神经网络进行视频修复的方法、系统、终端,改变了传统方法依靠人工定义和提取特征的弊端,利用深度卷积神经网络强大的特征提取能力,加上帧间的边缘信息作为修复引导,使得视频帧在空域和时域上的特征得到尽可能多的利用,同时提升了视频修复的主、客观质量评价指标。
-
公开(公告)号:CN106507116B
公开(公告)日:2019-08-06
申请号:CN201610889330.X
申请日:2016-10-12
Applicant: 上海大学
IPC: H04N19/597 , H04N19/109 , H04N19/86
Abstract: 本发明涉及一种基于3D显著性信息和视点合成预测的3D‑HEVC编码方法,具体步骤是:1)建立3D显著性模型,获取显著性信息;2)确定当前编码块的所属划分区域;3)确定不同划分区域的编码策略;4)改进原始视点合成预测算法;5)编码多视点视频序列。本方法利用人眼视觉特性,有效减小了块效应,在保证编码客观质量的同时,可节省码率,提高编码效率。
-
公开(公告)号:CN109800314A
公开(公告)日:2019-05-24
申请号:CN201910003114.4
申请日:2019-01-03
Applicant: 上海大学
Abstract: 本发明的目的在于获得能使图像检索准确率更高的哈希码,提出了一种利用深度卷积网络生成用于图像检索的哈希码的方法。本方法选择当前性能较好的DenseNet模型作为基础模型,提取图像特征,在分类层前添加一个哈希层,哈希层的输出经过二值化后获得图像的哈希码。本发明方法采用两个权重共享的基础网络,在训练模型时,将图像对作为输入,在损失函数中加入了图像的分类损失和图像对的相似损失,训练后获得的相似图像的哈希码更加相似。并且,本发明方法设计了一种新的哈希函数,将哈希层输出的每一位上的值进行排序,根据排序结果对哈希层的输出进行二值化,从而获得哈希码。本发明方法获得的哈希码用于图像检索时能有效地提高检索的平均准确率。
-
-
-
-
-
-
-
-
-