-
公开(公告)号:CN101356541A
公开(公告)日:2009-01-28
申请号:CN200680050931.6
申请日:2006-01-13
Applicant: 富士通株式会社
IPC: G06K9/72
CPC classification number: G06K9/2054 , G06K9/72 , G06K2209/01
Abstract: 自动提取关键字。当输入扫描的帐票图像时,布局识别单元(11)提取帐票图像的读取区域,字符识别单元(13)对该读取区域进行字符识别。在帐票逻辑定义体数据库(14)中存储根据相同种类的帐票中共同的逻辑结构而定义了构成关键字的字符串的帐票逻辑定义体。字符串候选提取单元(15)将字符识别出的字符满足已定义的字符串关系的组合作为字符串候选提取。并且,对应单元(16)将字符串候选根据位置关系进行对应,确定构成关键字的字符串候选的组合。
-
公开(公告)号:CN101246549A
公开(公告)日:2008-08-20
申请号:CN200810005567.2
申请日:2008-02-15
Applicant: 富士通株式会社
IPC: G06K9/20
CPC classification number: G06K9/4604 , G06K9/00449 , G06K2209/01
Abstract: 本发明涉及用于识别图像信息中的边界线的方法和装置。根据本实施方式的一个方面,提供一种检测包含在图像信息中的边界线信息的方法,所述图像信息包括在第一状态和第二状态中的任一状态下的多个像素,所述方法包括以下步骤:检测连续布置在所述图像信息中的第一状态下的第一组像素以判定第一线信息,并检测彼此相邻布置并由第二状态下的像素包围的第一状态下的第二组像素以基于该第二组像素的轮廓来判定边缘信息;以及基于所述线信息和所述边缘信息的相对位置与第一和第二组像素的尺寸之间的关系的信息,来判定边界线信息。
-
公开(公告)号:CN101236609A
公开(公告)日:2008-08-06
申请号:CN200810004819.X
申请日:2008-02-02
Applicant: 富士通株式会社
IPC: G06K9/72
CPC classification number: G06K9/00463
Abstract: 本发明涉及用于分析并确定文档中信息的相关性的装置和方法。该文档可为指定表格,其中包含多个模块,该多个模块中的至少一个模块包含表示表头的数据,该多个模块中的其余模块包含与表头信息关联的数据,该装置包括:用于存储多个模板的存储器,各模板具有多个节点、分别与该多个节点关联的字符数据以及该多个节点之间的相对位置信息;和根据一处理来分析并确定信息的相关性的处理器,该处理包括:获取该指定表格中的多个模块中包含的数据,确定该多个模块的相对位置以生成相对位置信息;与该模板的字符数据和该多个节点的相对位置信息相比较地,分析从该多个模块获取的数据及该多个模块的相对位置信息;以及确定该多个模块中包含的数据的相关性。
-
公开(公告)号:CN101118597A
公开(公告)日:2008-02-06
申请号:CN200610166798.2
申请日:2006-11-30
Applicant: 富士通株式会社
CPC classification number: G06K9/00449
Abstract: 本发明提供了一种帐票处理方法、帐票处理装置以及计算机产品。该帐票处理装置从帐票文件提取版面信息和字符信息。候选提取单元从字符信息提取候选单词。频率数字化单元根据各个元素计算候选单词的出现概率。关系数字化单元计算建立候选单词之间关系的迁移概率。评价单元计算表示各逻辑元素中的候选单词的出现概率的评价值。确定单元根据该评价值,将该元素及其候选单词确定为帐票文件中的元素及其字符串。
-
公开(公告)号:CN1226693C
公开(公告)日:2005-11-09
申请号:CN03145300.7
申请日:2003-06-30
Applicant: 富士通株式会社
IPC: G06F19/00
CPC classification number: G06F17/30247
Abstract: 本发明提供了一种适于管理和检索大量备注图像的备注图像管理装置、系统和方法。备注图像管理装置可连接到能够执行备注图像交换和备注图像显示的便携终端,该管理装置包括:适于管理备注图像的管理服务器和适于识别备注图像的字符信息的字符信息识别服务器。该管理服务器包括:备注图像累积部分,适于累积备注图像;和备注图像检索部分,适于从累积的备注图像中检索一预定备注图像以响应一请求。字符信息识别服务器包括适于从备注图像中识别字符信息的字符信息识别部分。
-
公开(公告)号:CN1471055A
公开(公告)日:2004-01-28
申请号:CN03145746.0
申请日:2003-07-02
Applicant: 富士通株式会社
CPC classification number: H04N1/387 , G06T3/0031 , H04N1/047 , H04N1/195 , H04N1/19594 , H04N2201/0434 , H04N2201/0436 , H04N2201/04787
Abstract: 图像失真校正方法和设备。本发明公开了一种图像失真校正设备,该图像失真校正设备包括:图像输入部分,用于输入由成像部分成像的平坦矩形纸面的图像以作为输入图像;成像位置估计部分,用于根据输入图像内的矩形纸面的四个顶点,估计成像部分对于纸面的相对成像位置;矩形纸面估计部分,用于根据成像位置,估计矩形纸面在一个三维空间内的四个顶点;以及图像校正部分,用于根据成像位置和三维空间内的四个顶点,校正输入图像内纸面的透视变换失真,以输出一个输出图像。
-
公开(公告)号:CN1374623A
公开(公告)日:2002-10-16
申请号:CN01143306.X
申请日:2001-12-18
Applicant: 富士通株式会社
IPC: G06T5/50
CPC classification number: G06K9/38 , G06K2209/01 , G06T5/002 , G06T5/50 , G06T7/194 , G06T2207/30176
Abstract: 由彩色或黑白图像转换成的多层图像被输入,并且稍显模糊的二值图像生成单元生成包括稍显模糊的线图形和不包括背景干扰的稍显模糊的二值图像。而且,形状被保留的二值图像生成单元生成保留了线图形的形状并且包括背景干扰的二值图像。对于每个像素,这些图像被施以“与”操作,使得保留了该线图形的形状并且不包括背景干扰的二值图像被生成。
-
公开(公告)号:CN101430761B
公开(公告)日:2012-10-10
申请号:CN200810174108.7
申请日:2008-11-07
Applicant: 富士通株式会社
IPC: G06K9/20
CPC classification number: G06K9/00449
Abstract: 本发明涉及计算机可读记录介质、表格数据提取装置和方法。即使输入了不具有存储在公共逻辑结构数据库中的逻辑结构的输入表格,表格数据提取装置借助现有的逻辑结构中的逻辑元素和在逻辑结构、逻辑元素的位置信息和逻辑元素之间的关系基础上获得的登记表格而从输入表格中提取出逻辑元素和逻辑结构,并且可以将提取出的逻辑结构定义为新的登记表格或者新的逻辑结构。
-
公开(公告)号:CN101520852B
公开(公告)日:2011-09-07
申请号:CN200810080951.9
申请日:2008-02-29
Applicant: 富士通株式会社
CPC classification number: G06K9/4604 , G06K9/00624
Abstract: 本发明提供了消失点检测装置和检测方法。该消失点检测装置包括:线段检测单元,其获得输入的图像的水平线段或垂直线段;交点集合获得装置,其获得所述水平线段的交点的集合或垂直线段的交点的集合;候选消失点检测单元,确定候选消失点;消失点确定单元,根据候选消失点检测单元确定的候选消失点,确定最终的消失点,其中,候选消失点检测单元是以下的一种或更多种:基于扇形束投影与密度估计的候选消失点检测单元,对输入的图像进行扇形束投影,将高密度扇束区中的点密度最大的交点作为候选消失点;基于扇形束投影与聚类的候选消失点检测单元,进行扇形束投影,并得到高密度扇束区中的交点的多个聚类,将各聚类的中心作为候选消失点。
-
公开(公告)号:CN101256631B
公开(公告)日:2011-06-01
申请号:CN200710078767.6
申请日:2007-02-26
Applicant: 富士通株式会社
IPC: G06K9/62
Abstract: 本发明提供一种字符识别的方法、装置、程序和可读存储介质。所述方法包括:对输入的字符样本进行识别,产生识别结果;生成所述识别结果的置信度;根据所述置信度判断所输入的字符样本是否属于变形样本;若为非变形样本,则将所述识别结果作为最终识别结果;若为变形样本,则对变形样本进行识别并生成最终识别结果。本发明的技术方案通过将第一级识别错误的样本直接作为第二级的基本训练样本,能有效的处理那些变形的样本,从而提高系统的识别精度。
-
-
-
-
-
-
-
-
-