-
公开(公告)号:CN118485908A
公开(公告)日:2024-08-13
申请号:CN202410555614.X
申请日:2024-05-07
Applicant: 哈尔滨工程大学
Abstract: 本发明公开了一种基于多模态融合的水下目标识别方法,本发明涉及海洋探测技术领域,一种基于多模态融合的水下目标识别方法,将声呐数据、光学数据和声呐图像数据分别进行预训练,本发明的优点在于:通过设计多模态融合网络,将声呐数据、光学数据和文本描述的特征表示进行融合,可以更全面地利用不同模态数据的信息,来提高水下目标识别的准确性和鲁棒性;通过多层感知机和注意力机制的学习,可以优化不同模态数据的特征表示,使网络能够更好地捕捉数据之间的相关性和重要性,从而能够提高水下目标识别的效率;通过针对声呐数据和光学数据的特点来进行改进,可以提高数据的质量和表征能力,使深度残差网络能够更好地理解和区分不同类型的水下目标,从而提升识别准确度。
-
公开(公告)号:CN117409308A
公开(公告)日:2024-01-16
申请号:CN202311355274.8
申请日:2023-10-18
Applicant: 哈尔滨工程大学
IPC: G06V20/05 , G06V10/774 , G06V10/82 , G06N3/0464 , G06V10/776
Abstract: 本发明属于水下图像增强技术领域,具体的说是声呐图像数据采集和水下光学图片数据分析方法,其中水下光学图片数据分析方法:步骤1:获取待分析的声呐图像数据集和光学水下图像数据集;步骤2:对步骤1中获取的所有声呐图像数据和光学水下图片数据进行预处理,去除质量不佳的图片;增强图像(LR)和SESR图像(HR)是由网络中不同阶段的不同输出层生成的,此高级图像是由紧随特征提取网络之后的卷积层生成的;它通过应用于浅层输出层的专用损失函数来学习增强,增强的特征也传播到另一个卷积层,然后解解层进行上采样;最终的SESR输出是根据给定的尺度:2x、3x或4x的上采样特征生成的,从而清晰化图像,进一步提高图像生成效果。
-
公开(公告)号:CN118570517A
公开(公告)日:2024-08-30
申请号:CN202410296931.4
申请日:2024-06-25
Applicant: 哈尔滨工程大学
IPC: G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于语义解耦的零样本辅助小样本图像分类方法,本发明涉及图像识别技术领域,小样本图像分类方法具体步骤为:构建语义矩阵、数据预处理、零样本模型分类、小样本基础模型分类和模型集成获得最终分类结果,本发明的优点在于:通过辅助类别与目标类别处于同一个大类,以便于构建更科学合理的语义矩阵,通过对辅助类别选取,保证能够获取到较多的辅助类别图像样本,便于后续零样本分类环节的运行,通过将所有图像的特征矩阵等验证集样本序号统一封装保存为mat格式,方便后续程序直接调用,通过在现有的广义零样本分类方法基础上引入了语义解耦的概念,解决了在水下图像分类任务中将专家领域知识直接应用于分类模型中提高模型性能。
-
公开(公告)号:CN119206461A
公开(公告)日:2024-12-27
申请号:CN202411257069.2
申请日:2024-09-09
Applicant: 哈尔滨工程大学
IPC: G06V20/05 , G06V10/30 , G06V10/32 , G06V10/774 , G06V10/764 , G06V10/82
Abstract: 本发明公开了基于主动学习和半监督学习算法的图像标签标定方法,本发明涉及半监督图像标签标定技术领域,数据预处理,数据划分,数据增强,基于Transductive‑VAT模型无标签样本标签预测,计算无标签样本的不确定性,基于主动学习标定不确定性大的样本,记录全部原处理和当前处理的方案,得出处理方案的成效值,本发明的优点在于:通过Active‑T‑VAT模型在所有给定的训练样本数下表现出较高的准确性,并且随着训练样本数的增加准确度同步提高,其准确率稳步提高,同时该Active‑T‑VAT模型的准确率波动更加稳定,能够对小样本数据的相关无标签数据进行有效地学习,提高小样本在水下场景中进行模拟识别的准确度和性能,为样本进行标签标定,降低获取有标签样本的困难程度和成本。
-
公开(公告)号:CN118351429A
公开(公告)日:2024-07-16
申请号:CN202410521780.8
申请日:2024-04-28
Applicant: 哈尔滨工程大学
IPC: G06V20/05 , G06V10/764 , G06V10/82 , G06N3/044 , G06N3/045 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/096
Abstract: 本发明公开了一种基于领域知识的水下小样本图像分类方法,本发明涉及图像分类技术领域,步骤一、构建语义矩阵;步骤二、对数据进行预处理;步骤三、零样本模型分类,在语义解耦的广义零样本模型基础上;步骤四、采用了较为常见的卷积神经网络模型作为小样本基础分类模型;步骤五、通过模型集成获得最终分类结果,可以替换成传统的多数投票为基础的集成方案,本发明的优点在于:通过最终的分类目标是利用六个辅助类别的图像和语义信息、三个目标类别的小样本图像信息和语义信息,使得最终集成模型在分类准确率上优于基础的小样本分类模型,方便将专家领域知识直接应用于分类模型中,为提高模型性能提供支撑。
-
公开(公告)号:CN117649571A
公开(公告)日:2024-03-05
申请号:CN202311362610.1
申请日:2023-10-19
Applicant: 哈尔滨工程大学
IPC: G06V10/774 , G06V10/77 , G06V10/764 , G06V10/80 , G06V10/82 , G06V20/05 , G06N3/042 , G06N3/0464 , G06N3/0895
Abstract: 本发明属于图结构标签标定技术领域,具体的说是基于流形学习的图结构标签标定UEGNN方法;所述图结构标签标定UEGNN方法步骤包括:第一步:数据预处理;收集水下图像数据,对图像大小进行统一,使用阈值分割算法对图像进行背景与目标物的分割;针对水下高维性图像,采用流形学习算法中UMAP模型,以识别图像高维空间中的关键结构并将它们保存在低维嵌入中,并且提出的半监督UMAP在训练时加入有标签数据的标签约束,相较于UMAP模型可以更快地推断新的未见数据;从而实现适用于高维性无标签数据的小样本半监督学习技术,并且提出基于流形学习的图结构标签标定算法,根据高维数据特征映射构造图中的度量关系,完成无标签数据的标记。
-
公开(公告)号:CN118506060A
公开(公告)日:2024-08-16
申请号:CN202410552776.8
申请日:2024-05-07
Applicant: 哈尔滨工程大学
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06V10/52 , G06N3/0464 , G06N3/0442 , G06N3/09
Abstract: 本发明公开了一种基于多尺度建模和上下文表示的小样本图像分类方法,本发明涉及图像分类处理技术领域,所述基于多尺度建模的上下文表示的小样本图像分类方法具体步骤如下:S10、根据声纳数据集的类别,收集并构建相应类别的光学图像作为数据域领域知识,本发明的优点在于:通过将三种不同尺度的表示特征实现逐层尺度间特征融合,使该小样本图像分类方法相较于传统的图像分类方法,能够有效的提高识别准确率和效率,节约人力成本,通过使模型从数据视角引入光学图像作为领域知识,能够快速有效的补充水下样本的信息量,通过在模型上设计了多尺度模型结构来充分提取信息,在样本维度进行信息传递,提高模型的特征提取能力。
-
公开(公告)号:CN118196607A
公开(公告)日:2024-06-14
申请号:CN202311355284.1
申请日:2023-10-18
Applicant: 哈尔滨工程大学
IPC: G06V20/05 , G06V10/42 , G06V10/44 , G06V10/771 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N20/00 , G06V10/80 , G06V10/764
Abstract: 本发明属于图像分类技术领域,具体的说是基于CONFORMER算法的向量机图像分类方法,本申请的CONFORMER算法由一个CNN分支和一个Transformer分支组成,这两个分支由局部卷积块、自我注意模块和MLP单元的组合而成。其中,CNN分支具有非常良好的性能,它以分层的方式收集局部特征以获得更好的图像表示。由于自注意力机制和多层感知机)结构,Vision Transformer能够反映复杂的空间变换和长距离特征依赖性,从而获得全局特征表示。在水下目标识别任务中,通过本申请提供的基于CONFORMER算法的向量机图像分类方法,相较于现有技术,能够更好的克服样本稀少与特征稀缺导致的不良影响,更加顺利对声纳图像进行分类处理,同时也提高了图像分类处理的准确率。
-
公开(公告)号:CN117671408A
公开(公告)日:2024-03-08
申请号:CN202311362612.0
申请日:2023-10-19
Applicant: 哈尔滨工程大学
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06T3/04 , G06N3/045 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/094
Abstract: 本发明涉及训练集扩充技术领域,具体说是训练集扩充技术多类别循环生成对抗方法,包括:采用生成式模型扩充训练样本;引入外源信息可以降低生成模型过拟合现象,提升分类神经网络的分类精度;但由于水下数据的稀少,采用传统的生成方式,仅依据原有的数据进行扩充,难以起到很好的效果;为了更好的扩充数据,本技术提出M‑CycleGAN网络来对训练集进行扩充;构建3D模型图像数据集,引入外源的分类目标信息,辅助生成模型生成与分类数据集相似的新数据。
-
-
-
-
-
-
-
-