-
公开(公告)号:CN105608453B
公开(公告)日:2019-05-03
申请号:CN201510785494.3
申请日:2015-11-16
Applicant: 株式会社日立信息通信工程
Abstract: 本发明提供即使在包括字符种类不同的复式记录的票据时也能提高精度和效率并能减轻用户的作业负担的字符识别系统及字符识别方法。字符识别系统包括:票据输入部,获得票据的图像数据;字符识别部,根据票据的图像数据,对作为两个字段的两个字符串的第一字段的第一字符串和第二字段的第二字符串进行字符识别,获得识别结果字符数据;转换部,根据识别结果字符数据,当第一字符串的字符种类与第二字符串的字符种类不同时,将一个字符串转换成与另一个字符串字符种类匹配,获得转换结果字符数据;比较部,根据转换结果字符数据,比较第一字符串和第二字符串,判断一致或不一致,获得比较结果数据;及输出部,向用户输出包括比较结果数据的输出数据。
-
公开(公告)号:CN105320971A
公开(公告)日:2016-02-10
申请号:CN201510313899.7
申请日:2015-06-09
Applicant: 株式会社日立信息通信工程
IPC: G06K9/68
CPC classification number: G06K9/6814 , G06K2209/01
Abstract: 提供高精度且高速地识别包括简体文字和繁体文字的汉字的字符识别装置和字符识别方法。运算部(150)将同形字符表保存在字符辨别用辞典(165)中,参照该同形字符表中保存的候选字符来进行字符识别,其中,该同形字符表是将以下字符图像作为相似度高的同形字符进行分组而得到的:将由多个区域的汉字要素构成的汉字按每个区域进行分割所得到的汉字结构相同、且同一区域位置的汉字要素之间的基于余弦相似度的相似度高于规定值的字符图像;以及汉字要素之间的通过欧几里德距离值计算步骤计算出的欧几里德距离值小于规定值的字符图像。
-
公开(公告)号:CN105320971B
公开(公告)日:2018-11-16
申请号:CN201510313899.7
申请日:2015-06-09
Applicant: 株式会社日立信息通信工程
IPC: G06K9/68
Abstract: 提供高精度且高速地识别包括简体文字和繁体文字的汉字的字符识别装置和字符识别方法。运算部(150)将同形字符表保存在字符辨别用辞典(165)中,参照该同形字符表中保存的候选字符来进行字符识别,其中,该同形字符表是将以下字符图像作为相似度高的同形字符进行分组而得到的:将由多个区域的汉字要素构成的汉字按每个区域进行分割所得到的汉字结构相同、且同一区域位置的汉字要素之间的基于余弦相似度的相似度高于规定值的字符图像;以及汉字要素之间的通过欧几里德距离值计算步骤计算出的欧几里德距离值小于规定值的字符图像。
-
公开(公告)号:CN105608453A
公开(公告)日:2016-05-25
申请号:CN201510785494.3
申请日:2015-11-16
Applicant: 株式会社日立信息通信工程
CPC classification number: G06K9/2054 , G06K9/6878 , G06K2209/01
Abstract: 本发明提供即使在包括字符种类不同的复式记录的票据时也能提高精度和效率并能减轻用户的作业负担的字符识别系统及字符识别方法。字符识别系统包括:票据输入部,获得票据的图像数据;字符识别部,根据票据的图像数据,对作为两个字段的两个字符串的第一字段的第一字符串和第二字段的第二字符串进行字符识别,获得识别结果字符数据;转换部,根据识别结果字符数据,当第一字符串的字符种类与第二字符串的字符种类不同时,将一个字符串转换成与另一个字符串字符种类匹配,获得转换结果字符数据;比较部,根据转换结果字符数据,比较第一字符串和第二字符串,判断一致或不一致,获得比较结果数据;及输出部,向用户输出包括比较结果数据的输出数据。
-
-
-