-
公开(公告)号:CN119850441A
公开(公告)日:2025-04-18
申请号:CN202510317059.1
申请日:2025-03-18
Applicant: 华侨大学 , 信泰(福建)科技有限公司 , 福建省万物智联科技有限公司
Abstract: 本发明公开了一种基于频域边界协同优化的沉浸式视频增强方法及装置,涉及视频处理领域,包括:获取待重建的压缩的多视点纹理加深度视频序列并输入到经训练的沉浸式视频增强模型;当前的待增强视频帧先经过特征提取模块,分别提取得到高频特征和低频特征;高频特征和低频特征经过频域增强模块,得到频域增强图像;频域增强图像和当前的待增强视频帧输入到边界增强模块,得到融合图像;融合图像和当前的待增强视频帧的相邻视频帧输入到时空可变形卷积模块,得到对齐后的融合图像,对齐后的融合图像经过质量增强模块,预测得到增强残差并生成对应的重建视频。本发明解决压缩伪影、边界伪影以及沉浸式视频的质量低等问题。
-
公开(公告)号:CN119478751B
公开(公告)日:2025-03-25
申请号:CN202510062002.1
申请日:2025-01-15
IPC: G06V20/30 , G06V40/70 , G06V40/10 , G06V40/16 , G06V10/44 , G06V10/74 , G06V10/762 , G06V10/774 , G06V10/80 , G06F16/583 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于渐进式多源特征融合与对齐的人像聚档方法及装置,涉及公共视频智能分析领域,包括:构建人像聚档模型,在人像聚档模型中,对人脸图像、人脸模拟素描画像、人体图像、人体模拟素描画像的特征进行渐进融合,并通过伪标签聚类和相似度约束对齐人体特征与人脸特征,有效融合多源人像特征,生成渐进多源融合的行人特征;将待查询人员的人脸图像、人体图像及其相对应的人脸模拟素描画像、人体模拟素描画像输入到经训练的人像聚档模型,得到待查询人员的渐进多源融合的行人特征,并计算其与数据库中每个参考样本的渐进多源融合的行人特征的相似度,以进行人像聚档。
-
公开(公告)号:CN119068266B
公开(公告)日:2025-02-14
申请号:CN202411551042.4
申请日:2024-11-01
Applicant: 华侨大学 , 泉州圣源警用侦察设备有限公司
IPC: G06V10/764 , G06V10/74 , G06V10/774 , G06V10/82 , G06V20/52 , G06F17/16
Abstract: 本发明涉及图像处理与目标识别技术领域,公开了一种基于真伪标签一致性的跨模态行人再辨识方法及系统,方法包括:通过深度神经网络对可见光与红外光两种不同模态的行人图像提取特征向量;计算同模态、不同模态间的特征向量相似度,构建同模态、跨模态匹配矩阵,并进行归一化处理,生成同模态和跨模态归一化匹配矩阵;采用跨模态归一化匹配矩阵和同模态归一化匹配矩阵对真实标签进行投影,获得跨模态伪标签;优化真实标签与跨模态伪标签之间的Kullback‑Leibler(KL)散度,从而优化同模态和跨模态匹配矩阵,提升匹配矩阵对模态变化的鲁棒性,从而提升跨模态行人再辨识准确性。
-
公开(公告)号:CN119299671A
公开(公告)日:2025-01-10
申请号:CN202411815010.0
申请日:2024-12-11
Applicant: 华侨大学
IPC: H04N19/103 , H04N19/96 , H04N19/119 , H04N19/126 , H04N19/127 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于多阶段不规则编码单元划分的VVC‑SCC帧内编码方法及装置,涉及视频编码领域,包括:设计并训练基于多阶段卷积神经网络的编码单元划分预测模型;其次将输入的视频帧通过经训练的编码单元划分预测模型进行编码单元划分预测模型预测,输出当前帧所有CU的模式类型的预测概率;最后为不同的模式类别设置不同的阈值,根据预测概率和对应的阈值指导VVC‑SCC编码器进行编码,从而跳过不必要的模式类别的遍历。本发明解决现有的VVC‑SCC帧内编码方法编码时间长、编码器计算的复杂度高的问题。
-
公开(公告)号:CN119152215A
公开(公告)日:2024-12-17
申请号:CN202411667235.6
申请日:2024-11-21
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于梯度显著性感知的皱纹分割方法、装置及可读介质,涉及图像处理领域,包括:构建人脸皱纹数据集和人脸皱纹分割网络;将人脸皱纹数据集中的原始人脸图像输入到人脸皱纹分割网络,得到对应的皱纹分割预测图,计算原始人脸图像中的每个像素点的显著性,进一步计算得到原始人脸图像中的每个像素点的权重,基于原始人脸图像中的每个像素点的像素值及其权重和原始人脸图像对应的皱纹标注掩码图中的相应像素点的像素值构建梯度显著性加权损失函数,基于梯度显著性加权损失函数对人脸皱纹分割网络进行训练,得到经训练的人脸皱纹分割网络。本发明解决现有技术的人脸图像中皱纹被过度分割或错误分割的问题。
-
公开(公告)号:CN118506168B
公开(公告)日:2024-10-15
申请号:CN202410954584.X
申请日:2024-07-17
Applicant: 华侨大学 , 杭州电子科技大学 , 厦门亿联网络技术股份有限公司
IPC: G06V10/98 , G06N3/045 , G06N3/0464 , G06T7/13 , G06V10/40 , G06V10/54 , G06V10/776 , G06V10/80 , G06V10/82 , G06V20/40
Abstract: 本发明公开一种基于多重特征网络的沉浸式视频质量评价方法及装置,涉及图像处理领域,包括:在沉浸式视频质量评价模型中,通过视频预处理网络对待评价的沉浸式视频包含的多个视点的纹理视频和深度视频进行视点筛选,得到筛选后视点的纹理视频和深度视频,通过时空特征提取网络对筛选后视点的纹理视频和深度视频进行特征提取并计算得到对应视点的纹理视频的质量分数和深度视频的质量分数;通过权重计算网络计算得到筛选后视点的时空轨迹权重,将筛选后视点的时空轨迹权重与对应视点的纹理视频的质量分数和深度视频的质量分数输入质量分数计算模块计算得到沉浸式视频的质量分数。本发明解决现有沉浸式视频质量评价算法效果较差的问题。
-
公开(公告)号:CN118397659A
公开(公告)日:2024-07-26
申请号:CN202410828405.8
申请日:2024-06-25
Applicant: 华侨大学
Abstract: 本发明公开了一种基于全局特征与头肩特征多核融合的行人识别方法及装置,涉及图像识别领域,包括:采用经训练的行人头肩部检测模型对行人图像进行头肩部检测,得到行人头肩部图像;在行人识别模型中,将行人图像和行人头肩部图像分别输入全局特征提取分支和头肩特征提取分支,得到全局特征向量和头肩特征向量并输入多核融合模块进行融合,得到融合特征向量,根据全局特征向量、头肩特征向量和融合特征向量构建损失函数,以训练行人识别模型,得到经训练的行人识别模型;将待识别的行人图像及其对应的行人头肩部图像输入经训练的行人识别模型,得到对应的融合特征向量,再进行行人识别。本发明解决鱼眼摄像机下图像特征差异大、准确度低的问题。
-
公开(公告)号:CN118368483A
公开(公告)日:2024-07-19
申请号:CN202410788949.6
申请日:2024-06-19
Applicant: 华侨大学
IPC: H04N21/44 , G06V20/40 , G06V10/764
Abstract: 本发明公开了一种电网环境下的视频帧间篡改检测方法、装置、设备及介质,方法包括以下步骤:获取包含多个视频的数据集;对每个视频,计算每帧画面的所有行像素的平均亮度值,获得每帧的行亮度序列,并连接所有帧的行亮度序列获得行亮度信号样本;对行亮度信号样本采用去除直流分量和下采样操作,获得预处理后的一维时间序列样本;利用一维时间序列样本训练时间序列异常检测模型;通过序列异常检测模型对待检测的视频进行检测,以输出所述视频的分类结果。本发明无须依赖参考电网频率数据库,也无需对视频中的电网频率信号进行估计,采用神经网络方法学习视频亮度序列的异常特征来检测视频帧间篡改,适用场景多,实用性强。
-
公开(公告)号:CN118196840A
公开(公告)日:2024-06-14
申请号:CN202410610290.5
申请日:2024-05-16
Applicant: 华侨大学
Abstract: 本发明公开了一种基于语义偏好挖掘的行人再辨识方法,涉及人工智能、机器视觉领域,包括:利用预训练的语义分割模型将行人图像处理为语义分割图,将语义分割图空间划分为若干部件语义块,计算不同语义在语义分割图与部件语义块中的比例,根据不同语义的比例对部件语义块分组进行语义对齐,获得各部件语义块分组对应的部件序号;基于部件序号对部件特征分组,利用自注意网络将各部件特征组投影到公共嵌入空间并进行偏好挖掘,继而利用偏好信息对各部件特征组进行自适应聚合,增强行人再辨识准确性。
-
公开(公告)号:CN118196731A
公开(公告)日:2024-06-14
申请号:CN202410605567.5
申请日:2024-05-16
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于通道与空间量子注意力学习的车辆再辨识方法及装置,涉及车辆再辨识领域,包括:利用深度网络从车辆图像中提取车辆的特征映射;设计通道量子注意力学习分支和空间量子注意力学习分支,分别对残差模块输出的特征映射学习通道量子注意力掩码和空间量子注意力掩码,并将两种注意力掩码融合为通道‑空间复合量子注意力掩码,用于增强车辆的特征映射,使深度网络能够更全面捕捉特征映射中的重要特征。本发明利用量子叠加与纠缠特性实现车辆注意力学习,能够提高特征学习效果,改善车辆再辨识的准确率,解决了传统机器学习模型难以学习这些复杂的非线性关系的问题。
-
-
-
-
-
-
-
-
-