-
公开(公告)号:CN115661114B
公开(公告)日:2025-03-14
申请号:CN202211400068.X
申请日:2022-11-09
Applicant: 重庆大学
IPC: G06T7/00 , G06V10/74 , G06V10/774 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于Conformer和元学习的全参考图像质量评价方法,包括如下步骤:获取待预测的失真图像和对应的参考图像;将所述失真图像和对应的参考图像输入预先训练完成的图像质量评价模型中;所述图像质量评价模型包括:特征提取模块、相似度计算模块、权重计算模块、评价分数模块和基于元学习的训练和测试模块;输出所述失真图像对应的预测分数。本发明基于图像质量评价模型,通过其构建的特征提取模块、相似度计算模块、权重计算模块、评价分数模块和基于元学习的训练和测试模块,可实现当面对多种失真类型的小样本数据集时,在保证模型泛化能力的同时准确预测出需要预测的失真图像的质量分数。
-
公开(公告)号:CN117437528B
公开(公告)日:2025-03-07
申请号:CN202311519932.2
申请日:2023-11-15
Applicant: 重庆大学
IPC: G06V10/98 , G06V10/80 , G06V10/44 , G06V10/766 , G06V10/82 , G06V10/74 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于KLT理论和视差补偿的SR图像质量评价方法及系统,获取待预测超分辨率重建图像进行频域滤波并提取中高频域图像作为模型输入;计算每个频域图像通道的协方差向量矩阵并根据KLT内核计算KLT系数矩阵,谱分解并组合得到不同深度的图像细节特征图;将浅层特征图构成图像结构特征经第一回归网络得到图像结构信息质量分数;采用不同深度的卷积神经网络将多级深层特征图分别进行图像特征细化整合,并根据视差补偿的原理分两部分,利用第二和第三回归网络得到左眼和右眼细节特征质量分数;将三个质量分数进行自适应加权得到最终客观评价质量预测分数;本发明在感知图像整体结构的同时,利用左右眼视差补偿原理使客观评价结果贴近人眼感知。
-
公开(公告)号:CN118097212A
公开(公告)日:2024-05-28
申请号:CN202311559706.7
申请日:2023-11-22
Applicant: 重庆大学
IPC: G06V10/764 , G06V10/77 , G06V10/25 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于层内‑层间融合的小目标检测方法及相关产品,属于图像处理技术领域。其方法包括,多种小目标的自然图像,对所述自然图像中的小目标进行类别和位置标记,构建小目标数据集;构建目标检测网络模型对小目标数据进行特征提取,获取多组多尺度特征图;采用基于层内‑层间融合的特征融合方法,对提取出的多尺度特征图进行融合,得到层内‑层间融合特征图;利用增强后的层内‑层间融合特征图进行预测并对预存结构进行评估得到训练好的目标检测网络模型并对待检测图像进行目标预测。本发明不仅能解决传统层间融合方法无法学习小目标精细的局部表示的问题,还能改善基于IoU的度量方法所出现的检测小目标位置不稳定的情况。
-
公开(公告)号:CN115633180A
公开(公告)日:2023-01-20
申请号:CN202211406649.4
申请日:2022-11-10
Applicant: 重庆大学
IPC: H04N19/42 , H04N19/86 , H04N19/132 , H04N19/63 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于Swin TransGAN的端到端深度视频压缩方法,包括:结合上一帧的重构值对当前帧进行运动估计,得到当前帧的运动向量;使用Swin Transformer对运动向量进行运动和残差压缩;将压缩后的运动向量和上一帧的重构值输入至预先构建的StyleSwin TransGAN的生成器,生成预测帧;其中,StyleSwin TransGAN的生成器为StyleGAN和Swin Transformer的结合,并引入双注意力机制;将预测帧和残差的重构值相加,得到重构帧;使用小波条件鉴别器消除重构帧的压缩伪影。本发明通过Swin Transformer提取特征,并结合StyleSwin TransGAN网络以实现更高质量的图像重构。
-
公开(公告)号:CN114220171A
公开(公告)日:2022-03-22
申请号:CN202111546471.9
申请日:2021-12-16
Applicant: 重庆大学
IPC: G06V40/20 , G06V20/40 , G06V10/26 , G06V10/46 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于层次有序残差网络结构的多尺度动作识别方法,包括以下步骤:特征分割获得原特征组,计算原特征组对应的参考特征组从而得到运动特征组;对运动特征计算运动状态注意力评分和运动状态变化注意力评分以及综合特征注意力评分,根据综合特征注意力评分对运动特征进行激励并输出,并对注意力权重序号进行更新;对激励后的运动特征进行分割,根据更新后的特征注意力评分对特征组进行排序并通过层次有序残差卷积模块实现多尺度时空关系建模;更新卷积核权重,重复S1‑S3的内容直至收敛。本发明能够以一种计算量较少的方法生成时空融合特征,降低生成光流特征的计算量以提高模型运行速度;有效提高时空建模的精度。
-
公开(公告)号:CN119992299A
公开(公告)日:2025-05-13
申请号:CN202510077898.0
申请日:2025-01-17
Applicant: 重庆大学
Abstract: 本发明公开了一种基于生成噪声估计的无参考图像质量评价方法,包括以下步骤:S1:训练第一神经网络模型和第二神经网络模型。第一神经网络模型的训练步骤包括:将失真图像样本输入至编码器中将失真图像特征映射至潜在空间中;在潜在空间中进行采样,通过解码器生成不同级别的噪声图像;将失真图像输入至扩散模型进行退化修复,并生成伪参考图像;将伪参考图和噪声图像进行叠加,并与失真图像计算损失函数进行参数优化。将失真图像输入至训练好的第一神经网络模型后,生成不同级别的噪声图像。将不同级别的噪声图像输入至训练好的第二神经网络模型,生成图像质量分数;本发明能够准确的模拟失真图像退化,并学习图像失真,提高了评估的准确性。
-
公开(公告)号:CN118097212B
公开(公告)日:2025-03-21
申请号:CN202311559706.7
申请日:2023-11-22
Applicant: 重庆大学
IPC: G06V10/764 , G06V10/77 , G06V10/25 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于层内‑层间融合的小目标检测方法及相关产品,属于图像处理技术领域。其方法包括,多种小目标的自然图像,对所述自然图像中的小目标进行类别和位置标记,构建小目标数据集;构建目标检测网络模型对小目标数据进行特征提取,获取多组多尺度特征图;采用基于层内‑层间融合的特征融合方法,对提取出的多尺度特征图进行融合,得到层内‑层间融合特征图;利用增强后的层内‑层间融合特征图进行预测并对预存结构进行评估得到训练好的目标检测网络模型并对待检测图像进行目标预测。本发明不仅能解决传统层间融合方法无法学习小目标精细的局部表示的问题,还能改善基于IoU的度量方法所出现的检测小目标位置不稳定的情况。
-
公开(公告)号:CN118608829A
公开(公告)日:2024-09-06
申请号:CN202410652738.X
申请日:2024-05-24
Applicant: 重庆大学
IPC: G06V10/764 , G06V10/44
Abstract: 本发明公开了基于两阶段注意力定位框架的细粒度图像分类方法及系统,属于图像处理技术领域。方法包括:使用两种不同的划分模式处理图像,得到不重叠补丁序列和重叠的补丁序列,并分别对每个序列合并一个类令牌;第一阶段,不重叠补丁序列输入到基于Transformer编码器的特征提取器中以生成注意力分数和一个类令牌;第二阶段整合所有层的注意力分数,通过排序操作识别关键补丁位置,并提取这些位置上的重叠补丁序列作为复用特征提取器的输入,通过保留相邻区域的局部信息,以获取更精细的类令牌和图像特征;最终生成两个阶段的类令牌和最终的图像特征作为训练损失的组成部分。使用该方法便于提高细粒度图像分类精度。
-
公开(公告)号:CN117853204A
公开(公告)日:2024-04-09
申请号:CN202410042669.0
申请日:2024-01-11
Applicant: 重庆大学
IPC: G06Q30/0601 , G06F18/2113 , G06F18/2136 , G06F18/2131 , G06N3/0464 , G06N3/08
Abstract: 本发明属于商品推荐技术领域,具体公开了一种基于特征权重感知与二阶特征选择的商品推荐方法及系统,该方法获取原始数据集,并进行稀疏编码,通过嵌入层将高维的稀疏向量转换为低维的稠密嵌入特征向量,从不同尺度计算不同嵌入特征的注意力权重,以及单个稠密嵌入特征向量内部元素的注意力权重,计算所有二阶特征与目标任务的相关性;将获取的二阶交互特征向量拼接成单个向量后,输入深度神经网络,获取高阶特征交互结果;根据高阶特征交互结果,计算目标商品的点击概率的预测值,基于该预测值,决定是否对用户推荐该商品。采用本技术方案,从不同尺度计算输入的不同嵌入特征的注意力权重,对二阶交互特征进行选择,提高目标商品的推荐精准率。
-
公开(公告)号:CN116152062A
公开(公告)日:2023-05-23
申请号:CN202211678239.5
申请日:2022-12-26
Applicant: 重庆大学
IPC: G06T3/40 , G06V10/40 , G06V10/77 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/082
Abstract: 本发明公开了一种轻量化超分辨率重建方法,通过将待处理图像输入至深度特征提取网络,得到图像深度特征;并根据图像深度特征和待处理图像,得到超分辨率重建图像;其中,深度特征提取网络包括n个深度特征转换块,每个深度特征转换块包括渐进式细化模块、线性变换模块和多尺度特征融合模块,用于通过U型特征蒸馏提取待处理图像的多尺度特征信息;本发明提供的超分辨率重建方法,在提升模型性能的同时,利用深度可分离卷积和线性变换模块大幅度降低模型参数量。
-
-
-
-
-
-
-
-
-