-
公开(公告)号:CN118799665B
公开(公告)日:2024-11-22
申请号:CN202411273178.3
申请日:2024-09-12
Applicant: 烟台大学
Abstract: 本发明涉及计算机视觉技术领域,尤其是涉及一种基于跨模态解耦知识转移的三维目标检测方法及系统。所述方法,获取原始数据,包括获取立体图像和原始点云数据;基于获取的原始数据进行特征提取,根据划分的特征图进行特征增强网络的构建,利用特征增强网络进行结构保持提取,根据结构保持提取进行解耦分类头知识蒸馏,包括将logit KD方法进行解耦为目标分类蒸馏和非目标分类蒸馏,通过KL散度来计算目标分类蒸馏损失和非目标分类蒸馏损失;根据解耦分类头知识蒸馏定义损失函数,本发明通过解耦分类头知识蒸馏将目标分类和非目标分类分别考虑,能够更精细地调整学生模型的分类能力,进一步提高目标检测的准确性。
-
公开(公告)号:CN118780987A
公开(公告)日:2024-10-15
申请号:CN202411267055.9
申请日:2024-09-11
Applicant: 烟台大学
IPC: G06T3/4053 , G06T3/4046 , G06V10/44 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/0475 , G06N3/094
Abstract: 本发明涉及图像数据处理技术领域,尤其是涉及一种基于细节恢复的遥感图像超分辨重建方法及系统。方法,包括获取遥感图像;构建生成对抗网络模型,包括生成器和判别器;对生成器和判断器进行模型训练;利用生成器对遥感图像进行特征提取,生成重建图像;利用判别器对重建图像和遥感图像的高分辨率图像进行判别,得到判别结果;根据判别结果设定损失函数对生成器和判断器进行调优。通过采用动态密集残差块和动态卷积技术,它能显著提升图像的分辨率和细节,从而提供更清晰、更高质量的遥感图像。
-
公开(公告)号:CN118762245A
公开(公告)日:2024-10-11
申请号:CN202411252128.7
申请日:2024-09-09
Applicant: 烟台大学
IPC: G06V10/764 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及深度学习的多模态数据分类技术领域,尤其是涉及一种基于最大化编码率降低的多模态分类方法及系统。方法,包括以总体编码率最大化和压缩不同子空间的编码速率构建基于最大化编码率降低损失,优化不同视角的特定特征表示;以最大化特定特征表示与全局特征表示间的互信息为目标构建最大互信息损失;通过将特定特征表示映射到指定数量的类别维度得到每个类别的得分,来构建交叉熵损失;分别基于交叉熵损失、最大化编码率降低损失和最大互信息损失训练多模态分类网络模型。通过空间变换和跨样本融合来对齐和融合这些特定于视图的特征,以实现跨多个视图的一致特征。
-
公开(公告)号:CN118760913A
公开(公告)日:2024-10-11
申请号:CN202411237176.9
申请日:2024-09-05
Applicant: 烟台大学
IPC: G06F18/23 , G06F18/25 , G06N3/0895 , G06N3/0455
Abstract: 本发明涉及深度学习技术领域,尤其是涉及一种基于特征融合和标签对齐的多模态聚类方法及系统。方法,包括获取多视图样本数据和真实聚类标签;构建多视图对比学习神经网络模型;利用多视图样本数据对多视图对比学习神经网络模型进行训练,得到训练好的多视图对比学习神经网络模型;利用训练好的多视图对比学习神经网络模型对多视图样本数据进行特征提取,通过计算损失来优化模型输出的标签质量,得到多视图聚类模型;通过自我监督的方法有效地嵌入特征学习和标签学习任务到一个单一的框架。这种方法比两阶段深度多视图聚类方法更简单、更快,而且它还有效地利用了视图特定的信息来协助视图共识语义的生成。
-
公开(公告)号:CN118470333B
公开(公告)日:2024-10-01
申请号:CN202410939567.9
申请日:2024-07-15
Applicant: 烟台大学 , 山东(烟台)中日产业技术研究院(烟台市产业技术研究院)
IPC: G06V10/26 , G06V20/70 , G06V10/44 , G06V10/52 , G06V10/42 , G06V10/80 , G06V10/764 , G06V20/10 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/048
Abstract: 本发明涉及深度学习应用领域,尤其是涉及一种基于遥感图像的地理环境语义分割方法及系统。所述方法,包括获取遥感图像数据集,并对获取的遥感图像数据集进行预处理;基于获取的遥感图像数据集进行编码器构建,并利用编码器进行图像数据集的特征提取和编码;根据编码器的特征提取进行解码器构建,将构建完成的编码器和解码器组合为语义分割模型;利用遥感图像数据集对语义分割模型进行训练和优化,包括利用交叉熵损失函数计算输出值与预测值之间的误差,利用训练完成的语义分割模型进行预测结果输出。通过本发明的技术方案,能够提高遥感图像语义分割的精度、鲁棒性和泛化能力,为环境检测和城市规划提供更加高效和准确的技术。
-
公开(公告)号:CN118379296B
公开(公告)日:2024-09-27
申请号:CN202410831239.7
申请日:2024-06-26
Applicant: 烟台大学
IPC: G06T7/00 , G06V10/25 , G06V10/26 , G06V10/44 , G06V10/80 , G06V10/77 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/0985 , G06N3/048
Abstract: 本发明涉及计算机视觉技术领域,尤其是涉及一种基于视觉神经网络的圆形衬套缺陷检测方法及系统。所述方法,包括:获取训练用图像数据集,并对图像数据集进行预处理;基于获取的图像数据集进行图像分割网络搭建,包括利用线性投影将图像分割为不重叠的块;利用编码器提取分割后的图像特征注意力关系,并通过线性分类器对图像分割网络的输出进行分类;根据图像分割网络的输出分类进行缺陷检测网络搭建,对缺陷检测网络中的每个阶段引入通道注意力机制,并将所有注意力信息反馈至原特征图;利用缺陷检测网络进行检测结果的输出,本发明通过添加通道注意力机制可以帮助网络对图像中重要的目标信息进行突出,提高网络对目标部分的感知能力。
-
公开(公告)号:CN118643407A
公开(公告)日:2024-09-13
申请号:CN202411095472.X
申请日:2024-08-12
Applicant: 烟台大学
IPC: G06F18/2415 , G06F18/22 , G06F18/2321 , G06N3/0455 , G06N3/042 , G06N3/047 , G06N3/084 , G06Q50/00
Abstract: 本发明涉及社交数据分类技术领域,尤其是涉及一种基于贝叶斯原型图学习的用户归纳方法及系统。方法包括获取社交平台数据,并对社交平台数据进行预处理,得到图结构;基于社交平台数据构建贝叶斯推理模型,所述模型参数为具有先验和先验分布的随机变量;使用GCN作为模型编码器的主干部分,将图结构输入到编码器中,得到图结构的嵌入表示。本发明中,引入人工智能、深度学习算法,将社交网络与图神经网络结合利用图结构学习算法、原型学习思想、贝叶斯推理优化、残差连接等一系列技术,实现对社交平台用户群体进行智能分类和归纳。
-
公开(公告)号:CN118298491B
公开(公告)日:2024-08-06
申请号:CN202410710860.8
申请日:2024-06-04
Applicant: 烟台大学
IPC: G06V40/16 , G06V10/52 , G06V10/77 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本发明涉及表情识别技术领域,尤其是涉及一种基于多尺度特征和空间注意力的表情识别方法及系统。方法,包括利用HNFER神经网络模型对获取的面部图像数据进行特征提取,得到原始输入特征图;基于CoordAtt注意力机制对提取的特征进行池化拼接,得到特征图;对特征图进行深度卷积处理,得到注意力图,再通过元素相乘得到最终的特征图;通过对最终的特征图进行特征变换和归一化,得到表情类别概率并输出。本发明通过集成尺度感知和空间注意力技术,模型能够更精准地识别和分类不同的情绪状态,即使在复杂的环境条件下也能保持高性能。
-
公开(公告)号:CN117572376B
公开(公告)日:2024-04-19
申请号:CN202410056329.3
申请日:2024-01-16
Applicant: 烟台大学
IPC: G01S7/41 , G06F18/214 , G06F18/24 , G06N3/0464 , G06N3/084 , G06N3/09 , G06N5/04 , G06N5/046
Abstract: 本发明涉及无线电信号识别技术领域,具体公开了低信噪比弱小目标雷达回波信号识别装置及训练识别方法,雷达回波信号识别装置包括数据分块模块;数据分块模块后端设置有多通道深度神经网络模块;多通道深度神经网络模块后端设置有正向推理结果保存模块;正向推理结果保存模块后端设置有融合推理模块;融合推理模块后端设置有反馈训练接入模块;反馈训练接入模块后端连接在多通道深度神经网络模块上;多通道深度神经网络模块后端还设置有分类模型参数保存模块。采用该装置及训练和识别方法不仅可以得到很好的分类模型,还可以得到精确的分类识别结果,有效的区分信噪比低的强噪声和雷达弱小目标的回波数据。
-
公开(公告)号:CN117893895A
公开(公告)日:2024-04-16
申请号:CN202410294513.1
申请日:2024-03-15
Applicant: 山东省海洋资源与环境研究院(山东省海洋环境监测中心、山东省水产品质量检验中心) , 烟台大学
Abstract: 本发明涉及图像处理技术领域,具体为一种三疣梭子蟹的识别方法、系统、设备和存储介质,该识别方法将待识别水下图像进行增强处理,去除原图像的噪声影响,将预处理图经多层降采样处理和多层上采样处理后,进行融合,得到融合特征图;基于融合特征图,实现检测框的选取和分类识别,得到检测框区域集图再经交并比、置信度计算进行筛选,获得可靠性强的最优检测框图;最后,根据最优检测框图的中心点位置标记三疣梭子蟹位置,根据最优检测框图上的分类概率标记分类结果,提升了三疣梭子蟹水下图像识别准确度和识别效率。
-
-
-
-
-
-
-
-
-