-
公开(公告)号:CN110516569A
公开(公告)日:2019-11-29
申请号:CN201910753998.5
申请日:2019-08-15
Applicant: 华侨大学 , 厦门市公安局思明分局 , 中国人民公安大学
Abstract: 本发明提供一种基于身份和非身份属性交互学习的行人属性识别方法。首先,采用一种具有视角变化鲁棒性的特征学习方法对行人图像进行特征表达;其次,将行人属性分为身份属性和非身份属性,对二者之间的潜在关系进行建模,设计出行人身份属性和非身份属性交互学习的目标函数,利用身份属性的识别优势促进非身份属性识别率的提高,并且利用非身份属性识别率的提高反过来进一步改进身份属性的识别效果。行人属性分为身份属性和非身份属性的潜在关系为:相同身份的行人之间,必然具有相同的非身份属性;非身份属性差异大的行人之间,其身份属性差异一般较大。最后,采用mini-batch随机梯度下降算法对目标函数进行优化,实现行人属性的识别。
-
公开(公告)号:CN106973292B
公开(公告)日:2019-07-09
申请号:CN201710109148.2
申请日:2017-02-27
Applicant: 华侨大学
IPC: H04N19/103 , H04N19/105 , H04N19/172 , H04N19/20 , H04N13/161
Abstract: 本发明涉及一种基于彩色图像纹理特性的3D‑HEVC帧间预测快速模式选择方法,属于视频编码领域,方法包括分析编码单元纹理特性;判断编码单元纹理特性;根据判断结果决定是否跳过对称分割和非对称分割预测模式。本发明一种基于彩色图像纹理特性的3D‑HEVC帧间预测快速模式选择方法能够减少编码器的计算开销,在保持编码性能不变的情况下,减少编码时间。
-
公开(公告)号:CN109063535A
公开(公告)日:2018-12-21
申请号:CN201810541294.7
申请日:2018-05-30
Applicant: 华侨大学
CPC classification number: G06K9/00362 , G06K9/6267
Abstract: 本发明涉及一种基于联合深度学习的行人再辨识和行人性别分类方法,可同时预测行人身份和行人性别。首先,构建两个结构相同的深度网络,分别用于行人再辨识和行人性别分类;其次,利用参数相关正则项约束两个结构相同的深度网络中各层的参数集,使得二者参数的优化过程中不至于发生过大的偏离,以避免过拟合,从而同时提升行人再辨识与行人性别分类的准确率。
-
公开(公告)号:CN105320956B
公开(公告)日:2018-11-13
申请号:CN201510661393.5
申请日:2015-10-14
Applicant: 华侨大学
IPC: G06K9/46
Abstract: 本发明公开了一种基于中心窗口变差的四象限分块模式的图像纹理特征提取方法,对任一2M×2N像素的图像区域,首先计算其中心部分M×N个像素值的和作为阈值,然后把该2M×2N像素的图像区域分解为4个M×N像素的子区域,再分别计算这4个子区域像素值的和并与阈值进行比较,若像素值的和大于或等于阈值,就置该子区域的位置编码值为1,否则为0;最后将四个子区域的位置编码值乘以对应的权重后进行求和,得到该2M×2N像素的图像区域的纹理特征值。本发明只需要用4个比特就能有效地表示物体的局部纹理信息,可应用于目标检测、识别和跟踪。
-
公开(公告)号:CN106954057B
公开(公告)日:2018-08-28
申请号:CN201710109136.X
申请日:2017-02-27
Applicant: 华侨大学
IPC: H04N13/00 , H04N19/105 , H04N19/172 , H04N19/20
Abstract: 本发明涉及一种基于视点间相关性的3D‑HEVC帧间预测快速模式选择方法,属于视频编码领域,方法包括记录输入视频独立视点SKIP模式标志;查询非独立视点编码单元在独立视点中的对应位置;通过对应位置和相邻位置SKIP模式标志确定非独立视点中编码单元的最佳模式。本发明一种基于视点间相关性的3D‑HEVC帧间预测快速模式选择方法能够减少编码器的计算开销,在保持编码性能不变的情况下,减少编码时间。
-
公开(公告)号:CN104967855B
公开(公告)日:2018-01-16
申请号:CN201510356968.2
申请日:2015-06-25
Applicant: 华侨大学
IPC: H04N19/503
Abstract: 本发明一种适用于监控视频的编码方法,首先,利用背景建模技术建立背景帧;其次,把视频帧分割为前景区域和背景区域,并进行背景替换,把视频帧的背景区域替换成背景帧的对应区域,即空间位置相同的区域;最后把背景替换后的监控视频帧送入编码器进行编码。由于相邻两帧之间背景区域的各像素值相同,在帧间编码时,编码器无需对背景区域进行编码。因此,本发明可在保证前景目标客观质量的前提下,大大提高监控视频编码的压缩效率,降低编码的计算复杂度,可广泛地应用于视频监控系统。
-
公开(公告)号:CN106973292A
公开(公告)日:2017-07-21
申请号:CN201710109148.2
申请日:2017-02-27
Applicant: 华侨大学
IPC: H04N19/103 , H04N19/105 , H04N19/172 , H04N19/20 , H04N13/00
CPC classification number: H04N19/103 , H04N13/10 , H04N19/105 , H04N19/172 , H04N19/20
Abstract: 本发明涉及一种基于彩色图像纹理特性的3D‑HEVC帧间预测快速模式选择方法,属于视频编码领域,方法包括分析编码单元纹理特性;判断编码单元纹理特性;根据判断结果决定是否跳过对称分割和非对称分割预测模式。本发明一种基于彩色图像纹理特性的3D‑HEVC帧间预测快速模式选择方法能够减少编码器的计算开销,在保持编码性能不变的情况下,减少编码时间。
-
公开(公告)号:CN105320956A
公开(公告)日:2016-02-10
申请号:CN201510661393.5
申请日:2015-10-14
Applicant: 华侨大学
IPC: G06K9/46
CPC classification number: G06K9/4642
Abstract: 本发明公开了一种基于中心窗口变差的四象限分块模式的图像纹理特征提取方法,对任一2M×2N像素的图像区域,首先计算其中心部分M×N个像素值的和作为阈值,然后把该2M×2N像素的图像区域分解为4个M×N像素的子区域,再分别计算这4个子区域像素值的和并与阈值进行比较,若像素值的和大于或等于阈值,就置该子区域的位置编码值为1,否则为0;最后将四个子区域的位置编码值乘以对应的权重后进行求和,得到该2M×2N像素的图像区域的纹理特征值。本发明只需要用4个比特就能有效地表示物体的局部纹理信息,可应用于目标检测、识别和跟踪。
-
公开(公告)号:CN103366187A
公开(公告)日:2013-10-23
申请号:CN201310279042.9
申请日:2013-07-04
Applicant: 华侨大学
Abstract: 本发明提出一种基于四点二元模型的图像纹理特征值的提取方法,首先计算2x2像素块内四个像素点像素值的均值;其次计算每个像素点与均值的差值,若差值大于等于一给定阈值,就置该像素块的位置编码值为1,否则为0;最后将四个像素块的位置编码值乘以相对应的权重后,再将4个乘积求和,就得到该2x2像素块的纹理特征值,本发明只需要计算四个像素点与其均值的差值,得到4bit的二进制码,计算量减少一半且复杂度低,且能有效地表示人脸的局部纹理信息,可应用于人脸检测、识别和目标跟踪系统。
-
公开(公告)号:CN119228788B
公开(公告)日:2025-02-18
申请号:CN202411725027.7
申请日:2024-11-28
Applicant: 华侨大学
IPC: G06T7/00 , G06N3/0455 , G06N3/08 , G06V10/26 , G06V10/40 , G06V10/764 , G06V10/82 , G01R31/12 , G01N21/88
Abstract: 本发明公开了一种基于类别余弦映射的绝缘子故障检测方法及装置,涉及人工智能、机器视觉领域,包括:从真实数据集合与合成数据集合中获取图像数据、故障标签以及类别标签;利用类别余弦偏置编码将类别偏置编码进图像数据,利用特征提取网络提取编码结果中的空间特征;利用类别余弦偏置解码缓解空间特征中的偏置信息以获得类别特征,利用多标签分类器获取类别特征与类别标签的分类损失;利用分割解码器获取空间特征与故障标签的掩码损失;基于分类损失与掩码损失完成模型训练。本发明将正常、故障绝缘子以及合成图像的类别差异通过余弦偏置编码至图像数据中,引导模型理解合成图像与真实场景中的分布差异,最终提升合成数据在实践中的有效性。
-
-
-
-
-
-
-
-
-