-
公开(公告)号:CN104112135B
公开(公告)日:2017-06-06
申请号:CN201310136363.3
申请日:2013-04-18
Applicant: 富士通株式会社
IPC: G06K9/46
Abstract: 本公开提供一种文本图像提取装置和方法。该装置包括边缘极性确定单元,根据输入图像中检测到的每个边缘的亮度变化趋势确定每个边缘的极性;笔划宽度确定单元,将极性相反的两个边缘确定为匹配边缘对,并且基于用户指定区域中的各个匹配边缘对中的两个匹配边缘之间的距离确定该用户指定区域中的文本的笔划宽度;前景像素确定单元,将输入图像的匹配边缘对中两个匹配边缘之间的距离与笔划宽度之差在第一预定范围之内的匹配边缘对之间的像素确定为输入图像的前景像素;以及文本图像区域获取单元,利用前景像素对用户指定区域进行扩展,从而获取文本图像区域。本公开能够以简单、快速的方式实现对文本图像区域的提取。
-
公开(公告)号:CN106485192A
公开(公告)日:2017-03-08
申请号:CN201510556368.0
申请日:2015-09-02
Applicant: 富士通株式会社
Abstract: 本发明涉及用于图像识别的神经网络的训练方法和装置。该方法包括:将样本图像表示为高维空间中的点集,高维空间的大小为样本图像的空间域的大小×样本图像的强度域的大小;生成大小与高维空间的大小相同的第一随机扰动矩阵;对第一随机扰动矩阵进行平滑;用平滑后的第一随机扰动矩阵对高维空间中的点集进行扰动得到扰动后的点集;以及将扰动后的点集作为新的样本来训练神经网络。根据本发明,改进了传统的卷积神经网络的分类性能,产生更多的训练样本,减轻过拟合的影响,增强了卷积神经网络的泛化性能。
-
公开(公告)号:CN106296577A
公开(公告)日:2017-01-04
申请号:CN201510257323.3
申请日:2015-05-19
Applicant: 富士通株式会社
IPC: G06T3/40
Abstract: 公开了一种图像拼接方法和图像拼接设备。该图像拼接方法包括:对第一图像和第二图像进行粗对准,以得到两者的矩形重叠区域;将重叠区域的左下角与右上角之间的对角线的左侧部分作为第一图像的第一拼缝的左侧部分,并基于第一拼缝的左侧部分在第二图像中估计第二拼缝的左侧部分;将重叠区域的对角线的右侧部分作为第二图像的第二拼缝的右侧部分,并基于第二拼缝的右侧部分在第一图像中估计第一拼缝的右侧部分;基于第一拼缝和第二拼缝对重叠区域执行局部平滑变换;将第一图像和第二图像的非重叠区域与变换后的重叠区域进行组合,从而形成第一图像和第二图像的拼接图像。根据本公开的实施例,能够去除局部错误对准并且不需多次变换图像。
-
公开(公告)号:CN106157250A
公开(公告)日:2016-11-23
申请号:CN201510136941.2
申请日:2015-03-26
Applicant: 富士通株式会社
IPC: G06T5/00
CPC classification number: G06K9/4604 , G06K9/38 , G06K9/4638 , G06K9/6218 , G06T5/002 , G06T2207/30176
Abstract: 本发明公开了一种去除文档图像中的印记的方法和设备。根据本发明的去除文档图像中的印记的方法包括:从文档图像对应的二值图像中提取连通分量;基于连通分量的灰度特征,聚类连通分量,以得到一个聚类中心;在聚类半径R和灰度阈值T的取值范围内,搜索使得基于连通分量的灰度特征的评价值高于第一评价阈值的组合(R,T);以及基于所述组合中的灰度阈值,去除文档图像中的印记。根据本发明的方法和设备能够有效地、准确地去除文档图像中的印记。
-
公开(公告)号:CN106156715A
公开(公告)日:2016-11-23
申请号:CN201510200995.0
申请日:2015-04-24
Applicant: 富士通株式会社
IPC: G06K9/00
CPC classification number: G06K9/00463
Abstract: 本发明公开了一种分析表格图像的布局的方法和设备。根据本发明的分析表格图像的布局的方法包括:提取候选前景行;提取空白列;以及基于空白列,从候选前景行中,选择前景行;其中,所述空白列和所述前景行表明了表格图像的布局。根据本发明的方法和设备能够准确地确定表格图像的表头、表尾、正文等的位置,便于后续对表格的内容进行提取和分析。
-
公开(公告)号:CN103376890B
公开(公告)日:2016-08-31
申请号:CN201210121832.X
申请日:2012-04-16
Applicant: 富士通株式会社
Abstract: 本发明公开了一种基于视觉的手势遥控系统,该基于视觉的手势遥控系统包括:图像捕获设备,用于捕获对象的一系列图像;手势识别设备,用于从图像捕获设备所捕获的一系列图像识别对象的手势并将识别结果发送给操作命令触发设备;以及操作命令触发设备,用于根据从手势识别设备发送来的识别结果来触发预定操作命令。所述手势识别设备包括:手检测部件,用于从图像捕获设备所捕获的图像检测对象的手;手跟踪部件,用于在当手检测部件在一图像中检测到对象的手时,在接下来的图像中跟踪对象的手;手势识别部件,用于根据手检测部件检测到的对象的手和手跟踪部件跟踪到的对象的手来确定对象的手的运动并根据所确定的对象的手的运动来识别对象的手势。
-
-
公开(公告)号:CN104732188A
公开(公告)日:2015-06-24
申请号:CN201310705512.3
申请日:2013-12-19
Applicant: 富士通株式会社
Abstract: 本发明涉及一种文本提取方法和装置。一种文本提取方法,包括:获取用户对图像上感兴趣的文本的指定;确定文本的大小;确定文本的排列方向;估计文本的排列方向的偏移角度;根据文本的大小、排列方向和偏移角度来确定包含文本的图像片段;对图像片段中的种子连通部件进行种子连通部件生长以提取用户感兴趣的文本。
-
公开(公告)号:CN104680123A
公开(公告)日:2015-06-03
申请号:CN201310667202.7
申请日:2013-11-26
Applicant: 富士通株式会社
IPC: G06K9/00
CPC classification number: G06K9/00355 , G06K9/4671 , G06K9/6267
Abstract: 本申请公开了一种识别输入图像中的对象的装置、方法和程序,该装置包括:图像特征提取单元,被配置为提取所述输入图像中的待识别对象的图像特征;主题获取单元,被配置为基于所述图像特征采用生成主题模型获得与所述待识别对象有关的主题;语义主题模型生成单元,被配置为基于图像特征和主题生成与待识别对象有关的语义主题模型,其中,语义主题模型包括图像特征的分布以及各个图像特征相对于各个主题的分布。
-
-
-
-
-
-
-
-