图像视角变换装置以及方法

    公开(公告)号:CN107845068A

    公开(公告)日:2018-03-27

    申请号:CN201610829031.7

    申请日:2016-09-18

    Inventor: 刘威 范伟 孙俊

    Abstract: 本发明实施例提供一种图像视角变换装置以及方法。所述图像视角变换方法包括:基于文档图像的灰度图抽取多条直线并按照水平方向和垂直方向分类;基于所述文档图像的二值图抽取多条文本行线并按照水平方向和垂直方向分类;从抽取和分类后的直线以及文本行线中选择出两条垂直线和两条水平线;基于选择出的两条垂直线和两条水平线所形成的方框计算变换矩阵;以及使用该变换矩阵对文档图像进行变换以获得视角变换后的图像。由此,即使拍摄到的文档图像不完整,也能准确地获得透视变换矩阵,从而能够更好地进行图像视角变换。

    神经网络系统及神经网络系统的训练装置和方法

    公开(公告)号:CN105654176B

    公开(公告)日:2018-03-27

    申请号:CN201410647710.3

    申请日:2014-11-14

    Inventor: 王淞 范伟 孙俊

    Abstract: 本发明涉及一种神经网络系统及神经网络系统的训练装置和方法。该神经网络系统包括:二值神经网络,二值神经网络被配置为当输入数据是二值数据时,将其直接输入二值神经网络,其中对于二值神经网络的每一层,通过对该层的节点的值和其对应的权重进行二值运算来得到下一层的节点,其中二值神经网络每层节点的值和其对应的权重都是二值数据。根据本发明的神经网络系统及其训练装置和方法,处理速度更快,占用存储空间更小。

    文档图像的字符真值获取装置及方法、电子设备

    公开(公告)号:CN107590155A

    公开(公告)日:2018-01-16

    申请号:CN201610535045.8

    申请日:2016-07-08

    Inventor: 范伟

    Abstract: 本发明实施例提供一种文档图像的字符真值获取装置及方法、电子设备,通过使用局部匹配的匹配方式,根据匹配误差和偏移量更新已标记图像块和活跃区域,并根据活跃区域中的特征更新变换矩阵,能够获取各种文档图像的字符真值,适用范围广且获取的真值准确度较高。

    手写粘连字符串的切分方法、切分装置和电子设备

    公开(公告)号:CN107341429A

    公开(公告)日:2017-11-10

    申请号:CN201610274847.8

    申请日:2016-04-28

    Inventor: 许亮 范伟 孙俊

    Abstract: 本申请实施例提供一种手写粘连字符串的切分方法、切分装置和电子设备,该方法包括:确定手写字符串图像中的候选切分区域,所述候选切分区域具有上端点和下端点;对于每个候选切分区域,基于该手写字符串图像的灰度值和代价值,在所述上端点和所述下端点之间生成与所述上端点和所述下端点中至少一者连接的线段,作为候选切分线段;从所述候选切分线段中选择出正确切分线段;根据所述正确切分线段,对所述手写字符串图像中粘连的字符进行切分。根据本申请实施例,能降低硬件规模,并且定位性能更稳定。本申请能够对手写粘连字符串进行更为准确的切分。

    字符串的识别方法和系统
    35.
    发明公开

    公开(公告)号:CN107092902A

    公开(公告)日:2017-08-25

    申请号:CN201610091505.2

    申请日:2016-02-18

    Inventor: 王淞 范伟 孙俊

    CPC classification number: G06K9/2054 G06K9/6277 G06K2209/01

    Abstract: 本公开内容提供一种字符串的识别方法和系统。根据本公开内容的一种实施方式的识别方法包括:将字符串图像过切分为多个连通区域;使用二类分类器对每个连通区域与邻近的预定数量的连通区域的组合进行分类,给出每个组合为字符的概率;对多个连通区域的各种组合形成的所有路径进行路径搜索,选择其中所有组合均为字符的概率最高的路径;以及使用全类分类器对所选出的路径中的组合进行字符识别。与现有技术相比,本公开内容提出的方法和系统对手写汉字字符串的识别率更高。

    图像识别方法和图像识别设备

    公开(公告)号:CN107025452A

    公开(公告)日:2017-08-08

    申请号:CN201610065491.7

    申请日:2016-01-29

    Abstract: 公开了一种图像识别方法和图像识别设备。一种用于对具有表格结构的输入图像进行识别的图像识别方法,其中输入图像包含有一个或多个预打印字符串以及一个或多个后打印字符串,该图像识别方法包括:提取步骤,用于从输入图像中提取出表格结构;定位步骤,用于基于表格结构的先验知识,获得一个或多个后打印字符串中的至少一个后打印字符串的位置信息;以及识别步骤,对于至少一个后打印字符串中的每个后打印字符,采用基于二值化图像的第一字符分类器和基于灰度图像的第二字符分类器来对该后打印字符进行识别。根据本公开的实施例,能够结合简单快速的字符分类器和复杂高精度的字符分类器对具有表格结构的图像进行识别。

    相似度计算装置和方法与对象识别设备和方法

    公开(公告)号:CN104123712B

    公开(公告)日:2017-07-28

    申请号:CN201310149461.0

    申请日:2013-04-26

    Abstract: 本申请公开了一种相似度计算装置和方法与对象识别设备和方法,该相似度计算装置包括:存储单元,被配置为存储针对检测对象的各个预定模板;匹配单元,被配置为使用存储单元中存储的预定模板与输入图像的边缘图进行匹配,针对预定模板中的每个边缘点获取在边缘图中距该边缘点最近的最近边缘点;距离计算单元,被配置为根据边缘点和最近边缘点的相对位置关系,在边缘点和最近边缘点中的一个的邻域中选择第二边缘点,并计算边缘点和最近边缘点中的另一个与第二边缘点之间的距离作为边缘点与最近边缘点的距离;以及相似度计算单元,被配置为基于预定模板中的每个边缘点的距离确定输入图像与预定模板的相似度。

    图像处理装置及方法
    38.
    发明公开

    公开(公告)号:CN106940877A

    公开(公告)日:2017-07-11

    申请号:CN201610007111.4

    申请日:2016-01-05

    CPC classification number: G06T3/4038 G06T5/40

    Abstract: 本发明提供了一种图像处理装置和方法。所述图像处理装置包括纹理调整单元和/或色调调整单元,其中,所述纹理调整单元被配置成对拼接在一起的两个图像的重叠区域中的前景像素和背景像素进行纹理调整处理,使得所述两个图像之间由于拼接而产生的所述重叠区域中的纹理是渐变的;所述色调调整单元被配置成对拼接在一起的两个图像的第一图像的背景像素的直方图与所述第二图像的背景像素的直方图进行匹配,使得所述两个图像之间的色调差在预定阈值内。根据本发明实施例的装置和方法,通过对对拼接在一起的两个图像的重叠区域进行纹理和/或色调调整,从而消除重叠区域中由图像拼接引起的明显畸变。

    识别视频中的对象的设备和方法

    公开(公告)号:CN103714094B

    公开(公告)日:2017-07-11

    申请号:CN201210380709.X

    申请日:2012-10-09

    Abstract: 本发明公开了一种识别视频中的对象的设备和方法。所述设备包括:对象特征提取装置,被配置为从视频中提取候选对象,并提取候选对象的特征;文本信息处理装置,被配置为提取视频中包含的文本信息,并且利用关键字数据库对所述文本信息进行过滤以得到与所述候选对象相关的过滤文本;在线图像搜索装置,被配置为在线搜索与过滤文本对应的图像,并提取图像的特征;匹配器,被配置为匹配候选对象的特征和图像的特征,并基于匹配结果确定候选对象或者过滤文本,或者同时确定二者。

Patent Agency Ranking