一种基于对抗知识蒸馏与注意力机制的模型轻量化方法

    公开(公告)号:CN117057402A

    公开(公告)日:2023-11-14

    申请号:CN202311206638.6

    申请日:2023-09-19

    Abstract: 本发明涉及一种基于对抗知识蒸馏与注意力机制的模型轻量化方法,属于知识蒸馏与图像识别领域;该方法通过构建师生模型结构,引入注意力机制,类比知识蒸馏与对抗网络结构的相似性,成功提高了边缘场景下资源受限的图像识别精度;首先采用知识转移方法将教师网络的专业知识传授给学生网络,以有效传递有价值信息和引导学生网络学习,其次利用基于GAN的对抗性损失,在迭代训练中促进了教师和学生网络之间的知识交流,提高学生网络的准确性和性能,最后引入注意力机制以确保准确信息交换,使模型聚焦于最相关和信息丰富的部分。通过整合注意力机制和基于GAN的对抗性损失,提供了全面的知识蒸馏方法,改善了网络之间的知识传递,提升了学生网络的学习和性能,实现了优化。

    一种基于码本先验和双域对齐的图像眩光去除方法

    公开(公告)号:CN119941564A

    公开(公告)日:2025-05-06

    申请号:CN202411930121.6

    申请日:2024-12-26

    Abstract: 本发明涉及一种基于码本先验和双域对齐的图像眩光去除方法,针对复杂眩光伪影问题,提出结合数据驱动先验知识、高维特征对齐与动态注意力机制的多阶段深度学习框架。通过向量量化技术提取清晰图像的离散潜在特征,构建高质量先验;利用编码器和解码器网络,在空间域与频域中对眩光图像特征进行对齐,分离眩光伪影与图像内容;基于差异图生成分布注意力图,对伪影区域进行动态加权并增强细节恢复;通过构建联合优化目标,确保全局一致性与局部细节精确修复。实验验证表明,本方法在合成与真实场景下均取得优异效果,适用于多种复杂眩光场景的图像处理任务。

    一种基于扩散模型的跨域渐进适应方法

    公开(公告)号:CN119851032A

    公开(公告)日:2025-04-18

    申请号:CN202510018963.2

    申请日:2025-01-07

    Abstract: 本发明公开了一种基于扩散模型的跨域渐进适应方法,属于深度学习技术领域。本方法通过基于能量的伪标签标注策略与混合特征引导的扩散模型,逐步实现目标域的渐进式域适应。首先,结合领域特征和实例的不确定性,生成目标域数据的伪标签,确保目标域类别信息的有效标注。接着,通过扩散模型对源域数据进行预训练,向目标域和中间域数据添加噪声,并通过反向去噪的方式,将目标域的特征逐步转化为源域的风格。在去噪过程中,采用混合特征引导策略,平衡图像的结构信息与类别信息,引导编码器在跨域特征转换中保持目标域的特征一致性和源域的风格特性。最终移除扩散模型,仅使用编码器和分类器对目标域数据进行分类识别。本发明显著降低了域间迁移的计算成本,增强了模型的适应能力,为域适应相关任务提供了一种高效且鲁棒的解决方案。

    一种基于对比学习和特征混合的动作识别领域自适应方法

    公开(公告)号:CN119007290A

    公开(公告)日:2024-11-22

    申请号:CN202411097540.6

    申请日:2024-08-12

    Abstract: 本发明公开了一种基于对比学习和特征混合的动作识别领域自适应方法,属于深度学习技术领域。本发明提出了一种新的用于动作识别任务的无监督视频领域自适应方法,通过使用对比学习和特征混合进行跨域学习,从而将模型在源域数据上获得的学习能力迁移到目标域数据上。本发明的动作识别网络基本结构由三维卷积网络和图神经网络组成,首先,通过三维卷积网络提取视频中的总体特征,紧接着,将这些特征输入图神经网络,获取视频内部的时间联系。在领域自适应部分,本发明提出了一种新的基于对比学习的领域自适应方法。首先,我们从同一个视频中提取前n个片段和最后n个片段,然后,最大化两者的特征相似性,实现了源域和目标域中每个视频的时间一致性,从而实现源域和目标域之间的特征对齐。

    一种基于消息队列和微服务架构的高效深度学习模型部署方案

    公开(公告)号:CN119690693A

    公开(公告)日:2025-03-25

    申请号:CN202411259619.4

    申请日:2024-09-10

    Abstract: 本发明提供了一种高效的深度学习模型部署方案,通过采用消息队列和微服务架构,实现大规模图像处理的高并发请求处理和批量推理。系统包括前端调用方、SpringBoot集群、RabbitMQ消息队列、基于PyTorch的算法实例和Redis缓存,多个组件的搭配旨在实现高效的请求处理、批量图像推理和快速结果查询。该方案能够显著提升系统的处理能力和响应速度,适用于大规模实时图像处理应用。相较于传统的单机处理方式在面对高并发请求时往往表现出效率低下和响应时间长的问题,该方案能有效提升集群的吞吐量,降低检测的延迟,并最终大幅提升集群的实时检测能力。

Patent Agency Ranking