基于串联模型的复原方法、装置
    2.
    发明公开

    公开(公告)号:CN118552447A

    公开(公告)日:2024-08-27

    申请号:CN202410685296.9

    申请日:2024-05-30

    Abstract: 本申请提供了一种基于串联模型的复原方法、装置、电子设备及存储介质,涉及计算机技术领域。其中,该方法包括:获取低质量图像,将所述低质量图像输入到预先训练的图像质量评价大语言模型中获取所述低质量图像对应的退化信息与语义信息,其中,语义信息包括详细语义信息和简略语义信息;调取预先训练完成的低频复原模型与高频复原模型,将所述低质量图像、退化信息以及简略语义信息输入到所述低频复原模型中,获取对应的低频复原图像;将所述低频复原图像与所述详细语义信息输入到高频复原模型,确定对应的目标复原图像。本申请解决了相关技术中存在的图像复原的质量不高的问题。

    基于多模态模型的管道缺陷视频检测方法、装置

    公开(公告)号:CN118366073A

    公开(公告)日:2024-07-19

    申请号:CN202410345170.7

    申请日:2024-03-25

    Inventor: 张轩 王亚立 乔宇

    Abstract: 本申请提供了一种基于多模态模型的管道缺陷视频检测方法、装置,涉及计算机技术领域。该方法包括:获取待识别管道缺陷视频;调取优化后的目标视频识别分支,目标视频识别分支优化过程包括:调取预训练模型,调取管道缺陷视频以及管道缺陷视频中缺陷对应的缺陷定义文本,获取对应的缺陷类型,获取对应的句向量,基于缺陷类型与句向量进行训练,对训练后的预训练模型中的视频识别分支进行微调后确定对应的目标视频识别分支;将待识别管道缺陷视频输入到目标视频识别分支进行识别,获取对应的目标管道缺陷类型。本申请解决了相关技术中管道缺陷视频检测的准确率不高的问题。

    一种视频目标检测方法、装置、设备以及存储介质

    公开(公告)号:CN112101114B

    公开(公告)日:2024-05-24

    申请号:CN202010819564.3

    申请日:2020-08-14

    Abstract: 本申请适用于计算机技术领域,提供了一种视频目标检测方法、视频目标检测装置、视频目标检测设备及存储介质,包括:获取待检测视频中的目标视频帧以及支撑视频帧;将目标视频帧以及支撑视频帧输入到已训练的视频目标检测模型中处理,得到目标物体对应的检测结果。上述方式,视频目标检测模型基于训练样本视频集中各个视频内的物体相似度以及训练样本视频集中各个视频间的物体相似度生成,不仅考虑到了各个视频内的物体相似度,还考虑到了各个视频间的物体相似度。使用该视频目标检测模型提取到的目标视频帧的目标物体对应的特征更准确、信息更丰富,进而根据目标物体对应的特征确定检测结果时,得到的检测结果更准确。

    视野图的识别方法、装置及计算机存储介质

    公开(公告)号:CN111179226B

    公开(公告)日:2024-04-19

    申请号:CN201911287450.2

    申请日:2019-12-14

    Inventor: 乔宇

    Abstract: 本申请公开了一种视野图的识别方法、装置及计算机存储介质。其中,视野图包括至少一种偏差概率符号,该方法包括:将视野图分割为多个小图,以使得每一小图包括一偏差概率符号;基于训练后的小图神经网络,识别小图的偏差概率符号;根据偏差概率符号的种类使用不同的数字对小图进行标记,以通过数字来表示视野图。通过上述方式,本申请能够提高对视野图的识别准确率。

    文字识别方法、装置、计算机设备及存储介质

    公开(公告)号:CN117877041A

    公开(公告)日:2024-04-12

    申请号:CN202311803668.5

    申请日:2023-12-25

    Abstract: 本申请涉及文字识别技术领域,揭示了一种文字识别方法、装置、计算机设备及存储介质,方法包括:获取待识别图像;根据待识别图像以及训练好的候选框识别模型,得到文本框图像以及字符框图像,其中,候选框识别模型包括:特征提取模型、区域生成网络、第一RoIAlign模型、第二RoIAlign模型、文本框生成模型、字符框生成模型;基于字符框图像中的字符框以及文本框图像中的文本框,确定第一重叠面积与字符框面积的第一比值,其中,第一重叠面积是指字符框与文本框的重叠区域的面积;根据文本框、字符框以及第一比值,得到目标文本,能够有效识别复杂场景下的待识别图像中的文字,得到目标文本,提高文字的识别效率以及准确率。

    图像文本检测方法、装置、计算机设备及存储介质

    公开(公告)号:CN117854083A

    公开(公告)日:2024-04-09

    申请号:CN202311848407.5

    申请日:2023-12-28

    Abstract: 本申请涉及图像文本检测技术领域,揭示了一种图像文本检测方法、装置、计算机设备及存储介质,方法包括:获取待检测图像;根据待检测图像以及特征提取模型中进行特征提取,得到图像特征;根据图像特征、关系矩阵以及训练好的字符联系模型,得到文本联系矩阵;根据图像特征、检测分割模型,得到预测字符框和文本掩码;根据文本联系矩阵、预测字符框以及文本掩码,确定目标文本,能够通过字符联系模型得到文本联系矩阵,并通过该文本联系矩阵、预测字符框以及文本掩码,实现对目标文本的准确预测,该文本联系矩阵具有字符之间的联系,意味着单个元素的预测错误不会直接影响总体结果,具有较高的鲁棒性,显著提升了图像文本检测的效果。

    数据分类方法、装置、终端设备及可读存储介质

    公开(公告)号:CN110929785B

    公开(公告)日:2023-12-05

    申请号:CN201911150175.X

    申请日:2019-11-21

    Abstract: 本申请适用于机器学习技术领域,提供了一种数据分类方法、装置、终端设备及可读存储介质,该数据分类方法,包括:先接收待分类数据,然后将待分类数据输入训练后的分类模型,得到待分类数据的至少一个数据标签。其中,分类模型是根据间距焦点损失函数训练得到的,间距焦点损失函数用于根据样本数据的预测标签、样本数据的预设标签的间隔距离,表示样本数据的预测标签、样本数据的预设标签之间的差距。在对样本数据进行分类训练时,可以无需考虑样本的数量,只需根据样本数据的预测标签、样本数据的预设标签之间的差距确定分类的边界,使得数据不平衡的情况能够有效减少,训练后的分类模型能够更加准确地对待分类数据进行标签分类。

    基于协同分割与数据增强的自监督三维重建方法及系统

    公开(公告)号:CN112767468B

    公开(公告)日:2023-11-03

    申请号:CN202110162782.9

    申请日:2021-02-05

    Abstract: 本发明提供了一种基于协同分割与数据增强的自监督三维重建方法及系统,方法包括:获取输入数据,根据输入数据获取多视角图像对;通过对多视角图像对进行深度估计处理,获取光度一致性损失;通过对多视角图像对进行协同分割处理,获取语义一致性损失;通过对多视角图像对进行数据增强处理,获取数据增强一致性损失;根据光度一致性损失、语义一致性损失和数据增强一致性损失构建损失函数;根据损失函数构建并训练神经网络模型,基于神经网络模型获取与输入数据对应的三维模型。本发明通过引入语义线索以及嵌入数据增强机制,增强了自监督信号在噪声扰动下的可靠性,提升了自监督算法的精度和性能,且成本低、泛化性高、应用场景广泛。

Patent Agency Ranking