用于对图像进行拼接的方法和装置

    公开(公告)号:CN107305682A

    公开(公告)日:2017-10-31

    申请号:CN201610258517.X

    申请日:2016-04-22

    Abstract: 本发明涉及一种对图像进行拼接的方法和装置。该方法包括:基于第一重叠图像中的像素的梯度信息确定其中的稠密区域;将稠密区域划分为多个块,并在第二重叠图像中确定与多个块分别对应的对应块;基于每个块中的每个像素的梯度值来确定候选样本块;针对每一个候选样本块,找到该候选样本块和第二重叠图像中的与其对应的对应块中的匹配特征点对;基于匹配特征点对之间的连线的倾斜角度来确定该候选样本块的所有匹配特征点中的稳定匹配特征点对;基于每个候选样本块中匹配特征点对的数目和倾斜角度来计算稳定匹配特征点对的置信度;选取预定比例置信度高的匹配特征点对来校正其余置信度低的匹配特征点对;以及基于所获得的匹配特征点对进行图像拼接。

    对象提取方法和对象提取设备

    公开(公告)号:CN106469432A

    公开(公告)日:2017-03-01

    申请号:CN201510497910.X

    申请日:2015-08-13

    Inventor: 刘威 范伟 孙俊

    CPC classification number: G06T3/0012 G06T2207/10004 G06T2207/10024

    Abstract: 公开了一种对象提取方法和对象提取设备。该对象提取方法包括:计算背景图像中像素的梯度和梯度方向,将梯度与第一阈值比较,提取背景图像的二值化边缘图;计算包括前景对象的当前帧中像素的梯度和梯度方向,将梯度与第二阈值比较,提取当前帧的二值化边缘图;基于背景图像和当前帧的二值化边缘图、以及背景图像和当前帧中的像素的梯度方向,提取前景对象的二值化边缘图;将前景对象的二值化边缘图中的包括前景对象的区域划分成具有预定大小的单元,找到前景对象的边界单元;以及将边界单元分割为前景边界部分和背景部分,得到前景对象的边界,从而得到前景对象的掩膜。根据本公开的实施例,能够实现无需任何用户交互的自动对象提取。

    用于处理多模态媒体片段的信息处理装置和方法

    公开(公告)号:CN118644798A

    公开(公告)日:2024-09-13

    申请号:CN202310244394.4

    申请日:2023-03-13

    Abstract: 公开了一种用于处理多模态媒体片段的信息处理装置、信息处理方法和计算机可读存储介质。该信息处理装置包括:匹配程度计算单元,被配置成针对多模态媒体片段包括的多个单元信号中的每一单元信号,计算该单元信号与关于关注目标的多个类别中的每个类别之间的匹配程度;类别确定单元,被配置成针对多个单元信号中的每一单元信号,基于匹配程度计算单元计算出的该单元信号与多个类别中的每个类别之间的匹配程度来确定该单元信号所涉及的类别;以及变化趋势确定单元,被配置成基于类别确定单元所确定的多个单元信号所涉及的类别或者多个单元信号所涉及的类别和相应的匹配程度,确定关注目标随时间的变化趋势。

    提取印章图像的方法和装置

    公开(公告)号:CN110533049B

    公开(公告)日:2023-05-02

    申请号:CN201810501423.X

    申请日:2018-05-23

    Inventor: 刘威 孙俊

    Abstract: 本发明涉及一种提取印章图像的方法,包括:在图像中识别印章区域;提取印章区域中的笔划;确定所提取的笔划的主颜色特征;扩大印章区域;确定扩大后的印章区域中的前景像素和背景像素,其中前景像素为对应于所述主颜色特征的像素,背景像素为除前景像素以外的像素;获得扩大后的印章区域的灰度图像;在灰度图像中相对于背景像素增强前景像素以获得增强图像;去除增强图像中的噪声以获得印章图像。

    图像处理装置和方法
    25.
    发明公开

    公开(公告)号:CN108573469A

    公开(公告)日:2018-09-25

    申请号:CN201710131001.3

    申请日:2017-03-07

    Inventor: 刘威 范伟 孙俊

    Abstract: 本公开涉及图像处理装置和方法。所述图像处理装置包括:缝线获取单元,用于获取将要被拼接的图像中的第一图像的缝线;分割单元,用于沿着所述第一图像的缝线的延伸方向,将所述第一图像的包括缝线的中心区域分割成块,使得块边界与所述第一图像的缝线的交叉点处于强梯度区域;匹配单元,用于基于所述交叉点进行关键点匹配,以在将要被拼接的图像中的第二图像的与所述缝线对应的位置区域寻找与所述交叉点相对应的坐标点;以及融合单元,用于基于所述交叉点和所述坐标点对所述第一图像和所述第二图像进行图像融合。使用根据本公开的图像处理装置和方法,可以拼接两个图像的公共区域的任何位置,并且具有无缝的拼接结果。

    图像视角变换装置以及方法

    公开(公告)号:CN107845068A

    公开(公告)日:2018-03-27

    申请号:CN201610829031.7

    申请日:2016-09-18

    Inventor: 刘威 范伟 孙俊

    Abstract: 本发明实施例提供一种图像视角变换装置以及方法。所述图像视角变换方法包括:基于文档图像的灰度图抽取多条直线并按照水平方向和垂直方向分类;基于所述文档图像的二值图抽取多条文本行线并按照水平方向和垂直方向分类;从抽取和分类后的直线以及文本行线中选择出两条垂直线和两条水平线;基于选择出的两条垂直线和两条水平线所形成的方框计算变换矩阵;以及使用该变换矩阵对文档图像进行变换以获得视角变换后的图像。由此,即使拍摄到的文档图像不完整,也能准确地获得透视变换矩阵,从而能够更好地进行图像视角变换。

    图像处理装置及方法
    27.
    发明公开

    公开(公告)号:CN106940877A

    公开(公告)日:2017-07-11

    申请号:CN201610007111.4

    申请日:2016-01-05

    CPC classification number: G06T3/4038 G06T5/40

    Abstract: 本发明提供了一种图像处理装置和方法。所述图像处理装置包括纹理调整单元和/或色调调整单元,其中,所述纹理调整单元被配置成对拼接在一起的两个图像的重叠区域中的前景像素和背景像素进行纹理调整处理,使得所述两个图像之间由于拼接而产生的所述重叠区域中的纹理是渐变的;所述色调调整单元被配置成对拼接在一起的两个图像的第一图像的背景像素的直方图与所述第二图像的背景像素的直方图进行匹配,使得所述两个图像之间的色调差在预定阈值内。根据本发明实施例的装置和方法,通过对对拼接在一起的两个图像的重叠区域进行纹理和/或色调调整,从而消除重叠区域中由图像拼接引起的明显畸变。

    图像处理装置、图像处理方法和机器可读存储介质

    公开(公告)号:CN114862882B

    公开(公告)日:2025-04-25

    申请号:CN202110154179.6

    申请日:2021-02-04

    Abstract: 本公开涉及一种图像处理装置、图像处理方法和机器可读存储介质。图像处理装置包括:信息提取部,其获取关于输入图像的图像信息以及关于用户对输入图像上的多个对象中的特定对象的单个点击的点击信息;第一获取部,其基于图像信息和点击信息得到包括点击点的边界框以及边界框所对应的原始掩膜;第二获取部,其利用原始掩膜和边界框得到将特定对象从输入图像中突显出来的中间掩膜;选择部,其从多个中间掩膜中选择最佳掩膜;以及标注部,其利用最佳掩膜将特定对象的边缘在输入图像中标注出来。通过该图像处理装置,用户可以通过仅单次点击就可以获取点击对象的轮廓。

    图像分类模型训练方法、图像分类方法及存储介质

    公开(公告)号:CN118736260A

    公开(公告)日:2024-10-01

    申请号:CN202310320735.1

    申请日:2023-03-28

    Inventor: 刘威 汪留安 孙俊

    Abstract: 本公开内容涉及图像分类模型训练方法、图像分类方法及存储介质。根据本公开内容的一个实施例,提供了一种用于训练图像分类模型的方法。该方法包括:由文本编码器确定候选分类集中的各候选分类的相应文本特征;由图像编码器确定图像样本的相应图像特征;由后模块基于相应文本特征和相应图像特征确定图像样本的分类概率向量;确定多个候选分类对中的各候选分类对中的两个文本特征的相似度的和作为第一损失;基于分类概率向量确定第二损失;以及基于与第一损失和第二损失相关联的复合损失调节文本编码器的网络参数。

    训练语义分割模型的方法和装置及图像检测方法

    公开(公告)号:CN116468885A

    公开(公告)日:2023-07-21

    申请号:CN202210021477.2

    申请日:2022-01-10

    Inventor: 刘威 张慧港 孙俊

    Abstract: 本公开内容涉及训练语义分割模型的方法和装置及图像检测方法。根据本公开内容的一个实施例,该训练语义分割模型的方法包括以迭代方式训练语义分割模型。语义分割模型包括语义分割网络。训练语义分割模型包括:由图神经网络生成针对分割类别集的外部知识特征;由解码器基于编码器的输出生成包括与训练样本集中的当前批次的至少一个样本图像对应的至少一个视觉特征的批次视觉特征;通过融合外部知识特征和批次视觉特征生成当前批次的批次融合特征;基于批次融合特征生成分割结果;以及基于分割结果调整语义分割模型和图神经网络。本公开内容的方法和装置的有益效果包括以下中的至少一个:扩大感受野、提高模型准确度性能。

Patent Agency Ranking