字符识别方法和字符识别设备

    公开(公告)号:CN106339704A

    公开(公告)日:2017-01-18

    申请号:CN201510413366.6

    申请日:2015-07-14

    CPC classification number: G06K9/2009

    Abstract: 公开了一种字符识别方法和字符识别设备。该字符识别方法包括:字符栏提取步骤,用于提取包括若干行字符串的字符栏;字符占位宽度和字符空白间隔确定步骤,用于对字符栏中的预定行字符串进行字符切分,通过投票确定字符占位宽度和字符空白间隔;字符切分模板生成步骤,用于基于字符占位宽度和字符空白间隔生成字符切分模板;字符串切分步骤,用于使用字符切分模板对字符栏中的除预定行字符串之外的字符串或全部字符串进行切分;以及字符识别步骤,用于对通过切分得到的字符进行识别。根据本公开的实施例,能够提高字符识别的速度和准确率。

    手写粘连字符串的切分方法、切分装置和电子设备

    公开(公告)号:CN107341429A

    公开(公告)日:2017-11-10

    申请号:CN201610274847.8

    申请日:2016-04-28

    Inventor: 许亮 范伟 孙俊

    Abstract: 本申请实施例提供一种手写粘连字符串的切分方法、切分装置和电子设备,该方法包括:确定手写字符串图像中的候选切分区域,所述候选切分区域具有上端点和下端点;对于每个候选切分区域,基于该手写字符串图像的灰度值和代价值,在所述上端点和所述下端点之间生成与所述上端点和所述下端点中至少一者连接的线段,作为候选切分线段;从所述候选切分线段中选择出正确切分线段;根据所述正确切分线段,对所述手写字符串图像中粘连的字符进行切分。根据本申请实施例,能降低硬件规模,并且定位性能更稳定。本申请能够对手写粘连字符串进行更为准确的切分。

    图像识别方法和图像识别设备

    公开(公告)号:CN107025452A

    公开(公告)日:2017-08-08

    申请号:CN201610065491.7

    申请日:2016-01-29

    Abstract: 公开了一种图像识别方法和图像识别设备。一种用于对具有表格结构的输入图像进行识别的图像识别方法,其中输入图像包含有一个或多个预打印字符串以及一个或多个后打印字符串,该图像识别方法包括:提取步骤,用于从输入图像中提取出表格结构;定位步骤,用于基于表格结构的先验知识,获得一个或多个后打印字符串中的至少一个后打印字符串的位置信息;以及识别步骤,对于至少一个后打印字符串中的每个后打印字符,采用基于二值化图像的第一字符分类器和基于灰度图像的第二字符分类器来对该后打印字符进行识别。根据本公开的实施例,能够结合简单快速的字符分类器和复杂高精度的字符分类器对具有表格结构的图像进行识别。

    提取文档中的文本行的方法和装置

    公开(公告)号:CN105574530B

    公开(公告)日:2019-11-22

    申请号:CN201410525023.4

    申请日:2014-10-08

    Abstract: 本发明涉及提取文档中的文本行的方法和装置。根据本发明的一个方面,提供了一种提取文档中的文本行的方法,包括:对文档中的多个文本块进行粗聚类,以形成多个类;计算每个类的特征;根据每个类的特征,确定所述文档的方向;以及根据所述文档的方向对所述多个文本块进行精细聚类,以提取出文本行。

    文档处理装置、方法以及确定文档图像的朝向的设备

    公开(公告)号:CN105335372A

    公开(公告)日:2016-02-17

    申请号:CN201410261004.5

    申请日:2014-06-12

    Abstract: 本公开提供了文档处理装置、方法以及确定文档图像的朝向的设备。文档处理装置包括:提取装置,用于从文档图像中提取出至少一个文本行;置信度获取装置,用于根据由所述提取装置提供的文本行的结构特征,获取所述文本行的、与第一类文本相关的置信度,所述置信度表示所述第一类文本相对于第二类文本的重要性程度;以及排序装置,用于至少根据所述置信度,对所述至少一个文本行中包含的文本的质量进行排序。

    手写粘连字符串的切分方法、切分装置和电子设备

    公开(公告)号:CN107341429B

    公开(公告)日:2020-09-01

    申请号:CN201610274847.8

    申请日:2016-04-28

    Inventor: 许亮 范伟 孙俊

    Abstract: 本申请实施例提供一种手写粘连字符串的切分方法、切分装置和电子设备,该方法包括:确定手写字符串图像中的候选切分区域,所述候选切分区域具有上端点和下端点;对于每个候选切分区域,基于该手写字符串图像的灰度值和代价值,在所述上端点和所述下端点之间生成与所述上端点和所述下端点中至少一者连接的线段,作为候选切分线段;从所述候选切分线段中选择出正确切分线段;根据所述正确切分线段,对所述手写字符串图像中粘连的字符进行切分。根据本申请实施例,能降低硬件规模,并且定位性能更稳定。本申请能够对手写粘连字符串进行更为准确的切分。

    文档处理装置、方法以及确定文档图像的朝向的设备

    公开(公告)号:CN105335372B

    公开(公告)日:2019-01-22

    申请号:CN201410261004.5

    申请日:2014-06-12

    Abstract: 本公开提供了文档处理装置、方法以及确定文档图像的朝向的设备。文档处理装置包括:提取装置,用于从文档图像中提取出至少一个文本行;置信度获取装置,用于根据由所述提取装置提供的文本行的结构特征,获取所述文本行的、与第一类文本相关的置信度,所述置信度表示所述第一类文本相对于第二类文本的重要性程度;以及排序装置,用于至少根据所述置信度,对所述至少一个文本行中包含的文本的质量进行排序。

    文字识别方法和装置
    8.
    发明公开

    公开(公告)号:CN105989341A

    公开(公告)日:2016-10-05

    申请号:CN201510086612.1

    申请日:2015-02-17

    Abstract: 本发明公开了一种文字识别方法和装置。根据本发明的一个方面,文字识别方法包括:从包含文字的图像中提取多个连通部件;对所述多个连通部件进行分类,以生成第一语言连通部件和/或非第一语言连通部件;将所述第一语言连通部件聚类为第一语言文本行,并将所述非第一语言连通部件聚类为非第一语言文本行;以及从所述第一语言文本行和所述非第一语言文本行中识别出第一语言文字和非第一语言文字。

    提取文档中的文本行的方法和装置

    公开(公告)号:CN105574530A

    公开(公告)日:2016-05-11

    申请号:CN201410525023.4

    申请日:2014-10-08

    Abstract: 本发明涉及提取文档中的文本行的方法和装置。根据本发明的一个方面,提供了一种提取文档中的文本行的方法,包括:对文档中的多个文本块进行粗聚类,以形成多个类;计算每个类的特征;根据每个类的特征,确定所述文档的方向;以及根据所述文档的方向对所述多个文本块进行精细聚类,以提取出文本行。

Patent Agency Ranking