-
公开(公告)号:CN106326895B
公开(公告)日:2020-07-07
申请号:CN201510333843.8
申请日:2015-06-16
Applicant: 富士通株式会社
Abstract: 本公开提供了图像处理装置和图像处理方法。该图像处理装置包括:提取单元,其从彩色图像中提取文字区域;识别单元,其将所述文字区域识别为前景区域,并且将所述彩色图像中的所述文字区域外围的区域识别为背景区域;计算单元,其计算颜色空间中的前景中心和背景中心,其中所述前景中心代表所述前景区域的像素的集合在所述颜色空间中的位置,而所述背景中心代表所述背景区域的像素的集合在所述颜色空间中的位置;获得单元,其通过计算所述彩色图像的每个像素的灰度值来获得所述彩色图像的灰度图像,所述灰度值取决于所述颜色空间中所述像素在所述前景中心和所述背景中心的连线上的投影位置;和二值化单元,其对当前获得的所述灰度图像进行二值化。
-
公开(公告)号:CN106611406B
公开(公告)日:2019-08-16
申请号:CN201510707594.4
申请日:2015-10-27
Applicant: 富士通株式会社
IPC: G06T5/00
CPC classification number: G06T5/20 , G06T5/009 , G06T2207/30176
Abstract: 公开了一种图像校正方法和图像校正设备。该图像校正方法包括:区分步骤,用于分别将图像中的各个像素区分为前景像素或背景像素;背景填充步骤,用于基于与前景像素相邻的背景像素的亮度和亮度的梯度来估计与前景像素相对应的背景的亮度、从而填充前景像素的位置处的背景,以根据所填充的背景连同背景像素获得图像的背景照明图;以及校正步骤,用于基于图像中的各个像素的亮度值和背景照明图,对图像进行校正。根据本公开的实施例,能够有效地对非均匀光照图像进行校正。
-
公开(公告)号:CN105205448B
公开(公告)日:2019-03-15
申请号:CN201510522576.9
申请日:2015-08-24
Applicant: 中国科学院自动化研究所 , 富士通株式会社
Abstract: 一种基于深度学习的文字识别方法,包括:设计更深的多层卷积神经网络结构,把每一个字符作为一个类别;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后根据现有识别出的字符,采用维特比算法从词典中找出最有可能的词语。在测试的时候,给定一个输入,需要先进行滑动窗口扫描获得备选字符,再从备选字符中找出最可能的词语。本方法利用更深的卷积神经网络来学习文字特征,对于文字的颜色、大小、光照、模糊具有鲁棒性,字符识别和词语识别能够保持较高的准确率。
-
公开(公告)号:CN106296745B
公开(公告)日:2019-03-12
申请号:CN201510276320.4
申请日:2015-05-26
Applicant: 富士通株式会社
Abstract: 本发明涉及对文档图像进行校正的方法和装置。该方法包括:输入文档图像及其对应的三维空间上的三维数据点;利用文档图像提取文档图像中的文档页面的边界并估计边界上的三维数据点;对三维空间上的三维数据点进行采样并基于采样的三维数据点构建三维网格;基于三维网格来估计二维网格;以及利用所估计的二维网格对文档图像进行校正。根据本发明的方法和装置,能够重构和展平扭曲的文档图像。
-
公开(公告)号:CN106157250B
公开(公告)日:2019-03-01
申请号:CN201510136941.2
申请日:2015-03-26
Applicant: 富士通株式会社
IPC: G06T5/00
Abstract: 本发明公开了一种去除文档图像中的印记的方法和设备。根据本发明的去除文档图像中的印记的方法包括:从文档图像对应的二值图像中提取连通分量;基于连通分量的灰度特征,聚类连通分量,以得到一个聚类中心;在聚类半径R和灰度阈值T的取值范围内,搜索使得基于连通分量的灰度特征的评价值高于第一评价阈值的组合(R,T);以及基于所述组合中的灰度阈值,去除文档图像中的印记。根据本发明的方法和设备能够有效地、准确地去除文档图像中的印记。
-
公开(公告)号:CN108345827A
公开(公告)日:2018-07-31
申请号:CN201710060219.4
申请日:2017-01-24
Applicant: 富士通株式会社
CPC classification number: G06K9/00469 , G06K9/00456 , G06N3/08
Abstract: 本发明公开了一种识别文档方向的方法、系统和神经网络。该方法包括:提取文档中的文本行;计算文本行为正向的第一正向结果和为反向的第一反向结果;计算旋转180度后的文本行为正向的第二正向结果和为反向的第二反向结果;以及根据第一正向结果和第一反向结果以及第二正向结果和第二反向结果确定文档的方向。
-
公开(公告)号:CN108268947A
公开(公告)日:2018-07-10
申请号:CN201611255449.8
申请日:2016-12-30
Applicant: 富士通株式会社
Abstract: 提供了一种用于提高神经网络的处理速度的方法和装置及其在神经网络中的应用。该装置包括处理器,该处理器被配置成:根据预定的处理速度提高目标,确定训练得到的神经网络中的一个或多个参数矩阵中的每个参数矩阵的维度降低量;根据每个参数矩阵的维度降低量对每个参数矩阵进行预处理;以及根据预处理的结果对神经网络进行重新训练得到一个或多个维度降低后的参数矩阵,以保证神经网络的性能满足预定要求。根据本公开的实施例,可以在保证神经网络的性能满足预定要求的情况下,大大提高神经网络的处理速度。
-
公开(公告)号:CN108133222A
公开(公告)日:2018-06-08
申请号:CN201611095599.7
申请日:2016-12-01
Applicant: 富士通株式会社
CPC classification number: G06N3/0454 , G06N3/08
Abstract: 本发明涉及为数据库确定卷积神经网络CNN模型的装置和方法。根据本发明的为数据库确定CNN模型的装置包括:选取单元,用于从多个已知分类能力的CNN模型中选取至少两个CNN模型;拟合单元,用于根据至少两个CNN模型的分类能力和第一参数拟合以分类能力和第一参数为变量的曲线,其中,第一参数用于表征CNN模型的性能;预测单元,用于根据曲线预测其它CNN模型的第一参数;以及确定单元,用于根据每一个CNN模型的第一参数从多个CNN模型中确定适用于数据库的CNN模型。使用根据本发明的为数据库确定CNN模型的装置和方法,无需对所有CNN模型进行训练,大大降低了计算量,简化了设计CNN模型的流程。
-
公开(公告)号:CN107436608A
公开(公告)日:2017-12-05
申请号:CN201610357114.0
申请日:2016-05-26
Applicant: 富士通株式会社
Abstract: 本公开涉及一种用于无人机的控制装置及用于导游的系统。根据本公开的一个实施例,该用于无人机的控制装置包括:识别单元,被配置成在接收的来自无人机的摄像机所拍摄的图像中识别出游客标志;以及导航单元,被配置成响应于识别出游客标志,根据接收自无人机的当前位置信号和导游计划生成并向无人机发送导航信号以引导无人机到达景区内的目标地点,从而为游客导游;其中,游客标志是由可穿戴指示器所显示的预定标志图案,可穿戴指示器在其顶部具有用于显示预定标志图案的LED阵列。该控制装置和系统能够实现诸如无人机自动跟踪游客、引导游客、为游客讲解景点信息的导游功能。
-
公开(公告)号:CN107305683A
公开(公告)日:2017-10-31
申请号:CN201610256932.1
申请日:2016-04-22
Applicant: 富士通株式会社
IPC: G06T3/40
Abstract: 本公开提供一种用于图像拼接的图像处理方法、图像处理设备和图像处理装置,该图像处理方法包括:获取待拼接图像的图像序列,并且针对图像序列中的每帧图像,提取该图像中的特征点并获取特征点的分布;基于特征点的分布对图像序列中的各帧图像进行排列,并且基于特征点的分布从排列后的各帧图像形成多个图像拼接组,其中每个图像拼接组中包括图像序列中的多帧图像;以及针对每个图像拼接组中的第一帧图像,基于特征点的分布选择最优拼接图像以及最优拼接区域,从而基于各个最优拼接图像和最优拼接区域形成与所述待拼接图像对应的拼接图像。根据本公开的图像处理方法、设备和装置能够提高拼接图像的质量。
-
-
-
-
-
-
-
-
-