-
公开(公告)号:CN119323716A
公开(公告)日:2025-01-17
申请号:CN202411485607.3
申请日:2024-10-23
Applicant: 国网河南省电力公司电力科学研究院 , 郑州轻工业大学 , 河南九域腾龙信息工程有限公司
Inventor: 田杨阳 , 李哲 , 郭志民 , 张伟剑 , 张璐 , 王棨 , 庞锴 , 吴博 , 姜亮 , 狄立 , 张龙 , 张焕龙 , 王延峰 , 蒋斌 , 袁少光 , 毛万登 , 毛泰奇 , 胡军星
IPC: G06V10/82 , G06V10/40 , G06V20/10 , G06N3/0495 , G06N3/0464 , G06N3/08
Abstract: 本发明提出了一种改进MobileNetV3的轻量化电塔识别算法,属于电塔识别算法技术领域,其步骤为:首先,在MobileNetV3中引入膨胀卷积方法,来扩大卷积核的感受野范围,以此来减少电塔特征的损失;然后,将网络中的通道注意力机制SENet,用无参引入的双维度注意力机制SimAM进行替换,减少网络的参数;最后在归一化操作中,将主干网络的批数据归一化,替换为准确度在各种批量大小下都很稳定的组数据归一化,以减少小批量数据处理导致的误差。自制电塔数据库上的实验证明,与基线算法相比,该网络保持95.1%的高识别率的同时,减少了网络的参数量,实现了网络对电塔图像的快速收敛和准确识别。
-
公开(公告)号:CN116505891A
公开(公告)日:2023-07-28
申请号:CN202310527911.9
申请日:2023-05-09
Applicant: 郑州轻工业大学
Abstract: 本发明公开了一种带失真校正的全数字扩频方法及用该方法构建的免滤波数字PWM调制器,属于免滤波数字D类音频功放技术领域;该方法先利用伪随机数生成器产生的随机数对扩频UPWM发生器输出信号的脉冲位置和PRF进行随机化,实现扩频目的;再通过在数字Sigma‑Delta调制器输入端和输出端分别添加插零值模块和抽取模块,并对数字Sigma‑Delta调制器的状态空间表达式进行重构,构造一个包含数字Sigma‑Delta调制器和扩频UPWM发生器的数字闭环模块;利用该闭环模块的高开环增益特性校正该环路内产生的失真;同时基于上述方法设计相应的免滤波数字PWM调制器。本发明不仅可以大幅降低功放输出PWM信号的带外频谱峰值幅度以降低EMI,还能基本消除UPWM失真和扩频引入的失真,从而使功放拥有较高的SNDR。
-
公开(公告)号:CN111429497B
公开(公告)日:2023-05-05
申请号:CN202010201383.4
申请日:2020-03-20
Applicant: 郑州轻工业大学
Inventor: 赵进超 , 张秋闻 , 王兆博 , 王祎菡 , 崔腾耀 , 赵永博 , 郭睿骁 , 王晓 , 蒋斌 , 黄立勋 , 张伟伟 , 钱晓亮 , 吴庆岗 , 常化文 , 魏涛 , 孙丽君
IPC: G06T7/40 , G06T7/136 , G06T7/13 , G06V10/774 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本发明提出了一种基于深度学习和多特征融合的自适应CU拆分决策方法,其步骤为:首先,利用标准偏差计算当前CU的纹理复杂度SD,再利用量化参数函数和深度函数构建阈值模型,将当前CU分为复杂CU和均匀CU;其次,如果复杂CU属于边缘CU,则利用基于多特征融合的CNN结构对复杂CU进行判断是否拆分;否则,利用基于自适应的CNN结构对复杂CU进行判断是否拆分。本发明将深度学习和多特征融合相结合,解决了编码复杂性的问题。基于多特征融合的CNN结构和基于自适应的CNN结构均可成功处理训练样本,避免计算所有与复杂CU的率失真RDO,从而降低了计算复杂度,节省了编码时间。
-
公开(公告)号:CN112291562B
公开(公告)日:2022-06-14
申请号:CN202011183696.8
申请日:2020-10-29
Applicant: 郑州轻工业大学
IPC: H04N19/159 , H04N19/172 , H04N19/64
Abstract: 本发明提出了一种针对H.266/VVC的快速CU分区和帧内模式决策方法,其步骤为:首先,当CU大小为第一种尺寸时,选择有效特征来区分CU分区模式;其次,通过有效特征在线训练SVM分类器模型,并利用训练好的SVM分类器模型用于确定第一种尺寸对应的CU分区模式;当CU大小为第二种尺寸时,分别计算五个分割模式下CU的方差的方差,并将最大值对应的分割模式作为CU的最佳模式;最后,根据计算的划分后的CU的像素值偏差PVD将帧内预测模式分为垂直帧内模式和水平帧内模式,并使用改进的搜索方式确定最佳帧内预测模式。本发明既缩短了CU划分的时间,又减少了需要计算的帧内预测模式的数量,可以在保持编码质量的同时降低编码的计算复杂度。
-
公开(公告)号:CN112929658A
公开(公告)日:2021-06-08
申请号:CN202110161928.8
申请日:2021-02-05
Applicant: 郑州轻工业大学
IPC: H04N19/122 , H04N19/147 , H04N19/159 , H04N19/186 , H04N19/96
Abstract: 本发明提出了一种针对VVC的基于深度强化学习的快速CU分区方法,用于解决现有编码技术中存在的计算复杂性和编码性能不平衡的技术问题。其步骤为:首先,通过计算率失真值的方式分别对视频序列中的单帧图像进行划分得到大小为32×32的CU,并保存每个32×32的CU的初始状态;其次,分别将每个32×32的CU的初始状态及其对应的动作输入DQN中进行训练,输出每个32×32的CU的最佳划分方式。本发明将拆分32×32的CU划分情况视为状态,将划分模式决策视为动作,将率失真值作为奖励,并由编码器作为智能体来连续做出编码决策。并通过DQN对32×32的CU进行编码模式的选择,既保证了迭代的稳定性,在不降低编码性能的前提下降低了计算复杂性。
-
公开(公告)号:CN111654698A
公开(公告)日:2020-09-11
申请号:CN202010534562.X
申请日:2020-06-12
Applicant: 郑州轻工业大学
IPC: H04N19/119 , H04N19/70 , H04N19/96 , G06K9/62
Abstract: 本发明提出了一种针对H.266/VVC的快速CU分区决策方法,其步骤为:首先,利用传统编码方法对视频序列进行编码,并在编码过程中记录与CU划分的类别相关的特征,并利用改进的F-score特征选择方法计算特征的得分值,将得分值较高的特征作为特征子集;其次,根据CU划分的类别和特征子集构建改进的有向无环图DAG-SVM分类器模型;最后,将待划分的CU的纹理复杂度、方向复杂度和量化步长输入改进的有向无环图DAG-SVM分类器模型中,预测CU最佳划分类别。本发明通过改进的F-score特征选择方法和改进的有向无环图支持向量机DAG-SVM模型的结合,能够提前预测最佳CU分区,降低了计算复杂度,节省了编码时间。
-
公开(公告)号:CN111479110A
公开(公告)日:2020-07-31
申请号:CN202010293694.8
申请日:2020-04-15
Applicant: 郑州轻工业大学
IPC: H04N19/109 , H04N19/119 , H04N19/51 , H04N19/543 , H04N19/567
Abstract: 本发明提出了一种针对H.266/VVC的快速仿射运动估计方法,其步骤为:利用标准差计算当前CU的纹理复杂度,并根据纹理复杂度将当前CU分为静态区域或非静态区域;对于静态区域的CU,跳过仿射运动估计,直接利用运动估计对当前CU进行预测,并通过率失真优化的方法选择最佳的预测方向模式;对于非静态区域的CU,利用训练好的随机森林分类器RFC模型对当前CU进行分类,输出最佳的预测方向模式。对于静态区域的CU,本发明跳过仿射运动估计,降低了计算复杂度;对于非静态区域的CU,本发明通过提前训练好的模型直接进行预测方向模式的预测,避免了仿射运动估计的计算,从而降低仿射运动估计模块的复杂度。
-
公开(公告)号:CN111031303A
公开(公告)日:2020-04-17
申请号:CN201911150040.3
申请日:2019-11-21
Applicant: 郑州轻工业大学
IPC: H04N13/161 , H04N13/271 , H04N19/597
Abstract: 本发明提出了一种基于贝叶斯决策定理的3D-HEVC快速深度编码方法,其步骤为:首先确定深度图树块,分析不同量化参数之间的帧间模式分布;一方面,采用贝叶斯规则计算深度图树块的后验概率,并判断深度图树块的交互模式是否最佳确定深度图树块的最佳编码模式为SKIP/Merge模式;另一方面,根据贝叶斯规则计算深度图树块的贝叶斯成本,根据贝叶斯成本是否小于公差参数,早期确定终止深度图树块的CU修剪,确定最佳编码模式,或者利用3D-HEVC编码器分割深度图树块的CU,测试深度图树块的其他编码模式,找到最佳编码模式。本发明通过引入贝叶斯规则避免了测试深度图编码的其它帧间模式,既保证相似虚拟视点质量,又明显降低3D-HEVC深度编码复杂度。
-
公开(公告)号:CN117351548A
公开(公告)日:2024-01-05
申请号:CN202311392029.4
申请日:2023-10-25
Applicant: 郑州轻工业大学
IPC: G06V40/16 , G06V10/46 , G06V10/80 , G06V10/82 , G06V10/774
Abstract: 本发明提出了一种基于加权表情显著性区域的多姿态人脸表情识别方法,步骤为:采集不同表情、姿态的人脸图像,并对人脸图像进行表情类别的标记;依据人脸关键点对人脸图像的表情显著性区域进行检测,对表情显著性区域与人脸其他区域进行加权,获取加权图像;将每一幅训练图像计算得到的加权图像构成训练集,通过训练集构建多姿态的表情因子分析模型,采用期望最大化算法求解加权图像与潜在表情变量之间的后验概率,通过概率关系判断人脸表情图像的表情类别。本发明通过表情显著性区域检测获取人脸表情图像上的表情显著性区域,进行加权得到加权图像;以加权图像为基础构建表情因子分析模型,实现了对多姿态条件下人脸表情的识别,提高了识别率。
-
公开(公告)号:CN115731593A
公开(公告)日:2023-03-03
申请号:CN202210928331.6
申请日:2022-08-03
Applicant: 郑州轻工业大学
Abstract: 本申请公开一种人脸活体检测方法,其特征在于,包括如下步骤:步骤一:接收包含人脸区域的可见光、深度和红外图像;步骤二:对人脸可见光、深度和红外图像进行预处理操作,提取可见光、深度和红外三种模态特征向量,实现人脸图像增强;步骤三:将所述三种模态人脸图像输入至经训练的多核卷积神经网络中,对所述三种模态的学习结果进行LTF融合,将融合特征输入至分类层实现人脸活体检测得到人脸检测结果,或从所述三种模态向量中任意选取两个进行组合,得到三个组合,将所述三个组合输入至MultiModal Vision Transformer结构中,对所述三个模态的学习结果进行融合,将融合特征输入至分类层实现人脸活体检测,得到人脸检测结果。
-
-
-
-
-
-
-
-
-