-
公开(公告)号:CN1983302A
公开(公告)日:2007-06-20
申请号:CN200610066977.9
申请日:2006-03-30
Applicant: 富士通株式会社
IPC: G06K9/32
Abstract: 本发明的课题在于提高行方向判定的准确率。本行方向判定方法包含:取得由对纵写或横写文字组读取结果的纵方向文字识别处理所得到的第1识别文字数、和由对读取结果的横方向文字识别处理所得到的第2识别文字数的步骤;参照存储n(n是大于等于2的整数)个连续文字的出现概率的n-gram数据存储部,算出由纵方向文字识别处理所得到的n个连续识别文字的第1平均出现概率、和由横方向文字识别处理所得到的n个连续识别文字的第2平均出现概率的步骤;以及在第1识别文字数和第2识别文字数满足规定条件的情况下,根据第1平均出现概率和第2平均出现概率的大小判定纵写或横写的判定步骤。这样通过使用n-gram,即使在识别出不是单词的用语的情况下,也能准确判定行方向。
-
公开(公告)号:CN1467682A
公开(公告)日:2004-01-14
申请号:CN03102102.6
申请日:2003-01-30
Applicant: 富士通株式会社
IPC: G06K9/20
CPC classification number: G06K9/00463
Abstract: 在一个用于分析文件版面布局的设备中,一个字符候选元素生成器根据文件图像的黑像素链接分量生成字符候选元素。一个水平方向行矩形生成器在水平行方向上排列的字符候选元素之中当字符候选元素在垂直方向上相对于水平行方向的偏移量都小于或等于一个阈值时,将这多个字符候选元素设置为一个候选行矩形。一个水平方向段落块生成器将垂直方向上长度基本相同的多个候选行元素设置为一个段落候选元素。
-
公开(公告)号:CN102024138B
公开(公告)日:2013-01-23
申请号:CN200910173692.9
申请日:2009-09-15
Applicant: 富士通株式会社
Abstract: 本发明公开了一种字符识别方法和字符识别装置。根据本发明的一个实施例的字符识别方法包括:根据要识别的字符图像中标记字符上的标记的位置和形状特征提取所述标记的部分标记像素;通过包含具有相同方向的相邻像素将所述提取的部分标记像素扩展为标记线段;获取要识别的所述字符图像的细化图像;沿着所述细化图像的轨迹将所述扩展的标记线段生长为识别的标记;将所述识别的标记与所述字符图像分离;以及识别所述分离的字符图像。
-
公开(公告)号:CN101430761B
公开(公告)日:2012-10-10
申请号:CN200810174108.7
申请日:2008-11-07
Applicant: 富士通株式会社
IPC: G06K9/20
CPC classification number: G06K9/00449
Abstract: 本发明涉及计算机可读记录介质、表格数据提取装置和方法。即使输入了不具有存储在公共逻辑结构数据库中的逻辑结构的输入表格,表格数据提取装置借助现有的逻辑结构中的逻辑元素和在逻辑结构、逻辑元素的位置信息和逻辑元素之间的关系基础上获得的登记表格而从输入表格中提取出逻辑元素和逻辑结构,并且可以将提取出的逻辑结构定义为新的登记表格或者新的逻辑结构。
-
公开(公告)号:CN102024138A
公开(公告)日:2011-04-20
申请号:CN200910173692.9
申请日:2009-09-15
Applicant: 富士通株式会社
Abstract: 本发明公开了一种字符识别方法和字符识别装置。根据本发明的一个实施例的字符识别方法包括:根据要识别的字符图像中标记字符上的标记的位置和形状特征提取所述标记的部分标记像素;通过包含具有相同方向的相邻像素将所述提取的部分标记像素扩展为标记线段;获取要识别的所述字符图像的细化图像;沿着所述细化图像的轨迹将所述扩展的标记线段生长为识别的标记;将所述识别的标记与所述字符图像分离;以及识别所述分离的字符图像。
-
公开(公告)号:CN101430761A
公开(公告)日:2009-05-13
申请号:CN200810174108.7
申请日:2008-11-07
Applicant: 富士通株式会社
IPC: G06K9/20
CPC classification number: G06K9/00449
Abstract: 本发明涉及计算机可读记录介质、表格数据提取装置和方法。即使输入了不具有存储在公共逻辑结构数据库中的逻辑结构的输入表格,表格数据提取装置借助现有的逻辑结构中的逻辑元素和在逻辑结构、逻辑元素的位置信息和逻辑元素之间的关系基础上获得的登记表格而从输入表格中提取出逻辑元素和逻辑结构,并且可以将提取出的逻辑结构定义为新的登记表格或者新的逻辑结构。
-
公开(公告)号:CN1264113C
公开(公告)日:2006-07-12
申请号:CN03102102.6
申请日:2003-01-30
Applicant: 富士通株式会社
IPC: G06K9/20
CPC classification number: G06K9/00463
Abstract: 在一个用于分析文件版面布局的设备中,一个字符候选元素生成器根据文件图像的黑像素链接分量生成字符候选元素。一个水平方向行矩形生成器在水平行方向上排列的字符候选元素之中当字符候选元素在垂直方向上相对于水平行方向的偏移量都小于或等于一个阈值时,将这多个字符候选元素设置为一个候选行矩形。一个水平方向段落块生成器将垂直方向上长度基本相同的多个候选行元素设置为一个段落候选元素。
-
-
-
-
-
-