-
公开(公告)号:CN104298981A
公开(公告)日:2015-01-21
申请号:CN201410616426.X
申请日:2014-11-05
Applicant: 河北工业大学
CPC classification number: G06K9/00302 , G06K9/00268 , G06K9/00288
Abstract: 本发明人脸微表情的识别方法,涉及应用电子设备进行识别图形的方法,是在对人脸微表情图像序列预处理完成之后,使用Birnbaum-Saunders分布曲线建立回归模型,再使用CBP-TOP算法提取人脸微表情序列的动态时空纹理特征,最后使用分类器进行训练和预测,该方法克服了现有人脸微表情的识别方法存在对人脸微表情图像的亮点、边缘和白色噪声微小特征较为敏感,因而识别性能低的缺陷。
-
公开(公告)号:CN119580306A
公开(公告)日:2025-03-07
申请号:CN202411707851.X
申请日:2024-11-27
Applicant: 河北工业大学
IPC: G06V40/10 , G06V20/52 , G06V10/26 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/77 , G06V10/82 , G06T3/4053 , G06N3/0464 , G06N3/047 , G06N3/094 , G06N3/048 , G06N3/0895
Abstract: 本发明为一种多相关的行人属性识别方法,包括以下内容:获取行人图片并预处理;构建多相关的行人属性识别模型:多相关的行人属性识别模型包括超分辨率结构校准模块、区域相关因果对象感知模块、空间属性相关感知模块;超分辨率结构校准模块包括预训练的VIT视觉编码器、全局超分辨率模块GSR,全局超分辨率模块GSR的输出再经过预训练的VIT视觉编码器处理后获得超分辨率结构校准模块的输出#imgabs0#;使用多项式对比损失函数训练多相关的行人属性识别模型,进行行人属性识别。本发明在统一模型框架中充分集成超分辨率提升、区域相关性、属性相关性等模块,利用对比学习的互相指导训练,考虑了行人图像的质量问题及属性不平衡问题。
-
公开(公告)号:CN111783658B
公开(公告)日:2023-08-25
申请号:CN202010621885.2
申请日:2020-07-01
Applicant: 河北工业大学
Abstract: 本发明为基于双生成对抗网络的两阶段表情动画生成方法,该方法首先在第一阶段中利用表情迁移网络FaceGAN提取目标表情轮廓图中的表情特征,并将其迁移到源人脸,生成第一阶段预测图;第二阶段中利用细节生成网络FineGAN来作为补充丰富第一阶段预测图中的对表情变化贡献比较大的眼睛和嘴巴区域的细节,生成细粒度的第二阶段预测图并合成人脸视频动画,表情迁移网络FaceGAN及细节生成网络FineGAN均采用生成对抗网络实现。本申请提出两阶段生成对抗网络进行表情动画生成,第一阶段进行表情的转换,第二阶段进行图像细节的优化,通过掩模向量提取图像的指定区域,进行着重优化,同时结合局部判别器的使用,使重要部位生成效果更佳。
-
公开(公告)号:CN116434010A
公开(公告)日:2023-07-14
申请号:CN202310423403.6
申请日:2023-04-20
Applicant: 河北工业大学
IPC: G06V10/774 , G06V10/74 , G06V10/762 , G06V10/82 , G06V10/764 , G06N3/0464
Abstract: 本发明为一种多视图的行人属性识别方法,从语义相关性、区域相关性以及语义区域之间的相关性三个视图识别属性,使用语义图卷积学习语义相关性,使用视觉图卷积学习区域相关性,联合语义关联图和视觉关联图构建合成图,通过合成图图卷积来学习语义与区域相关性,利用融合两图特征信息的嵌入图间边预测属性。对于损失函数而言,传统的方法都对所有数据集采用相同的加权策略,导致在某个数据集上的权重过重和过轻,本方法对不同的数据集采用不同的损失函数加权方式,对不同的数据集有效地缓解属性不平衡问题。
-
公开(公告)号:CN115546461A
公开(公告)日:2022-12-30
申请号:CN202211331208.2
申请日:2022-10-28
Applicant: 河北工业大学
Abstract: 本发明为一种基于掩膜去噪和特征选择的人脸属性编辑方法,该方法针对人脸属性编辑,设计的掩膜去噪模块能够在生成注意力掩膜的时候只生成与要更改属性有关的掩膜,而去除掉一些包含人脸信息的背景掩膜,能够很好的完成属性编辑的任务并同时保留非编辑区域的一致性;设计的特征选择单元能够在特征层面上筛选图像的特征,保留因为网络深度而回丢失的与属性无关的特征,并在解码过程中根据二进制属性向量经由属性编码器丰富信息后的属性风格码进行特征的风格融合;采用的预训练篡改检测模型能够更好的检测生成图像是否经过篡改,提升了模型生成图像的伪真性。
-
公开(公告)号:CN114549481A
公开(公告)日:2022-05-27
申请号:CN202210177248.X
申请日:2022-02-25
Applicant: 河北工业大学
Abstract: 本发明为一种融合深度和宽度学习的深度伪造图像检测方法,首先将待检测图像转换为灰度图像并分割为两组图像块,提取每个图像块的中心化频域幅度谱并对其施加注意力机制,再对两组图像块进行通道连接,得到初级特征;其次,构建通道卷积自编码模块,利用预训练的通道卷积自编码模块的编码器对初级特征进行特征融合得到两个中级特征,分别作为特征映射流和特征增强流的输入,得到两个映射特征和增强特征;最后,根据宽度学习系统原理构建三个分类器,将三个分类器的输出结果进行加权平均,得到最终的检测结果。本方法对图像块施加注意力机制,可以从全局信息中关注篡改痕迹明显的区域,模型训练所需的数据和时间少,实现了准确度和效率的兼顾。
-
公开(公告)号:CN111563554B
公开(公告)日:2022-05-17
申请号:CN202010390223.9
申请日:2020-05-08
Applicant: 河北工业大学
IPC: G06V10/764 , G06V10/774 , G06V10/77 , G06V10/766 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明基于回归变分自编码器的零样本图像分类方法,涉及用于应用电子设备进行识别图形的方法,通过训练对齐交叉重建变分自编码器,计算回归网络损失,计算整个模型网络的全局损失L,对分类器进行训练,计算分类正确率,完成基于回归变分自编码器的零样本图像分类,克服了对广义零样本分类的现有技术存在训练样本匮乏,生成样本缺少语义性和生成对抗网络易于崩溃的缺陷。
-
公开(公告)号:CN113782190A
公开(公告)日:2021-12-10
申请号:CN202111104505.9
申请日:2021-09-22
Applicant: 河北工业大学
Abstract: 本发明为基于多级时空特征和混合注意力网络的抑郁症诊断方法,该方法包括以下内容:经过预处理的公开数据集变为成组的大小固定的图片,每个图片组对应一个视频序列,并对应一个抑郁分数;构建多级时空特征和混合注意力网络:以3D‑Resnet50网络相邻两层的输出作为输入,接入多级时空特征融合模块;所述多级时空特征融合模块包括时空特征调制子模块和特征融合子模块,时空特征调制子模块用于分别对相邻两层的输出都进行空间和时间调制;特征融合子模块用于对两个调制后的特征进行特征融合;多级时空特征经调整后连接一个混合注意力模块。该方法有效克服了单一网络深度在时间感受野和空间感受野局限的问题,实现针对抑郁患者的抑郁分数评估。
-
公开(公告)号:CN110991348B
公开(公告)日:2021-10-15
申请号:CN201911234416.9
申请日:2019-12-05
Applicant: 河北工业大学
Abstract: 本发明基于光流梯度幅值特征的人脸微表情检测方法,涉及用于识别图形记录载体的处理,该方法首先根据人脸关键点拟合人脸边缘提取人脸感兴趣区域,用FlowNet2网络提取视频序列中人脸图像帧间的光流场,然后提取人脸感兴趣区域的光流梯度幅值特征,再计算及处理特征距离并进行噪声消除,完成基于光流梯度幅值特征的人脸微表情检测,克服了在人脸微表情检测的现有技术中,存在提取的人脸图像运动特征中无法捕捉微小的人脸微表情运动,特征中包含过多干扰信息,易受头部偏移,眨眼运动和累积噪声影响及特征距离分析中单帧噪声影响的缺陷。
-
-
-
-
-
-
-
-