-
公开(公告)号:CN108345827B
公开(公告)日:2021-11-30
申请号:CN201710060219.4
申请日:2017-01-24
Applicant: 富士通株式会社
Abstract: 本发明公开了一种识别文档方向的方法、系统和神经网络。该方法包括:提取文档中的文本行;计算文本行为正向的第一正向结果和为反向的第一反向结果;计算旋转180度后的文本行为正向的第二正向结果和为反向的第二反向结果;以及根据第一正向结果和第一反向结果以及第二正向结果和第二反向结果确定文档的方向。
-
公开(公告)号:CN108140144B
公开(公告)日:2021-06-01
申请号:CN201680061886.8
申请日:2016-03-31
Applicant: 富士通株式会社
IPC: G06N3/08
Abstract: 一种对神经网络模型进行训练的方法、装置和电子设备。该方法包括:提取神经网络模型的一部分,以形成神经网络子模型;对所述神经网络子模型进行训练,以形成优化的神经网络子模型;根据所述优化的神经网络子模型中的各权值,初始化所述神经网络模型中的各权值,以形成初始化神经网络模型,并且,所述初始化神经网络模型与所述优化的神经网络子模型具有相同的输出特性;基于已知训练集,对所述初始化神经网络模型中的各权值进行调整。根据该方法,能够缩短大规模神经网络的训练时间并避免过拟合问题。
-
公开(公告)号:CN107845068B
公开(公告)日:2021-05-11
申请号:CN201610829031.7
申请日:2016-09-18
Applicant: 富士通株式会社
Abstract: 本发明实施例提供一种图像视角变换装置以及方法。所述图像视角变换方法包括:基于文档图像的灰度图抽取多条直线并按照水平方向和垂直方向分类;基于所述文档图像的二值图抽取多条文本行线并按照水平方向和垂直方向分类;从抽取和分类后的直线以及文本行线中选择出两条垂直线和两条水平线;基于选择出的两条垂直线和两条水平线所形成的方框计算变换矩阵;以及使用该变换矩阵对文档图像进行变换以获得视角变换后的图像。由此,即使拍摄到的文档图像不完整,也能准确地获得透视变换矩阵,从而能够更好地进行图像视角变换。
-
公开(公告)号:CN106940877B
公开(公告)日:2021-04-20
申请号:CN201610007111.4
申请日:2016-01-05
Applicant: 富士通株式会社
Abstract: 本发明提供了图像处理装置和图像处理方法。图像处理装置包括:纹理调整单元,被配置成对拼接在一起的第一图像和第二图像的重叠区域中的前景像素和背景像素进行纹理调整处理,使得第一图像与第二图像之间由于拼接而产生的重叠区域中的纹理是渐变的。纹理调整单元包括确定模块。确定模块用于确定重叠区域中的像素的经过纹理调整的像素值,并且被配置成:针对前景像素,基于对第一图像的像素插值所获得的相对应像素的像素值来确定所述前景像素的经过纹理调整的像素值;针对背景像素,基于对第一图像的像素插值所获得的相对应像素的像素值和第二图像的相对应像素的像素值的加权组合,来确定所述背景像素的经过纹理调整的像素值。
-
公开(公告)号:CN107305683B
公开(公告)日:2021-01-12
申请号:CN201610256932.1
申请日:2016-04-22
Applicant: 富士通株式会社
IPC: G06T3/40
Abstract: 本公开提供一种用于图像拼接的图像处理方法、图像处理设备和图像处理装置,该图像处理方法包括:获取待拼接图像的图像序列,并且针对图像序列中的每帧图像,提取该图像中的特征点并获取特征点的分布;基于特征点的分布对图像序列中的各帧图像进行排列,并且基于特征点的分布从排列后的各帧图像形成多个图像拼接组,其中每个图像拼接组中包括图像序列中的多帧图像;以及针对每个图像拼接组中的第一帧图像,基于特征点的分布选择最优拼接图像以及最优拼接区域,从而基于各个最优拼接图像和最优拼接区域形成与所述待拼接图像对应的拼接图像。根据本公开的图像处理方法、设备和装置能够提高拼接图像的质量。
-
公开(公告)号:CN106557526B
公开(公告)日:2020-06-30
申请号:CN201510640999.0
申请日:2015-09-30
Applicant: 富士通株式会社
IPC: G06F16/55 , G06F16/583
Abstract: 本公开涉及一种处理图像的装置和方法。在一个实施方式中该装置包括:定位模块,其被配置为定位第一图像和第二图像的特征点;特征描述子提取模块,其被配置为提取表征第一图像和第二图像的每个特征点的特征描述子;分类模块,其被配置为根据分类特征集的所有特征,确定第一图像和第二图像的每个特征点的特征点分类;以及相似度计算模块,其被配置为基于第一图像和第二图像的每个特征点的特征点分类,使用相似度计算特征集的所有特征计算第一图像和第二图像之间的相似度。该装置和方法能够快速、准确地检索出与查询图相似的图像。
-
公开(公告)号:CN105184312B
公开(公告)日:2018-09-25
申请号:CN201510522970.2
申请日:2015-08-24
Applicant: 中国科学院自动化研究所 , 富士通株式会社
Abstract: 本发明公开了一种基于深度学习的文字检测方法及装置。所述方法包括:设计多层卷积神经网络结构,把每一个字符作为一个类别,这样就形成了一个多类别分类问题;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后用前端的特征提取层进行权值初始化,把最后一个全连接层结点数目改为2,使得网络成为一个二分类模型,用文字和非文字样本训练网络。经过以上步骤,一个文字检测分类器就完成了。在测试的时候,把全连接层转化为卷积层,给定一张输入图像,需要先进行多尺度滑动窗口扫描获得文字的概率图,再进行非极大值抑制得到最终的文字区域。
-
公开(公告)号:CN105719243B
公开(公告)日:2018-09-07
申请号:CN201410734194.8
申请日:2014-12-04
Applicant: 富士通株式会社
CPC classification number: G06T7/0081 , G06K9/4647 , G06K2209/01 , G06T5/005 , G06T7/11 , G06T7/194 , G06T11/60 , G06T2207/10024 , G06T2207/30176
Abstract: 本公开涉及图像处理装置和方法,图像处理装置包括:图像获取单元,其获取包含像素的图像;图片查找单元,其从图像中查找图片区域;背景获取单元,其在图像的不包括图片区域的非图片区域和图片区域中,分别执行背景连通域获取过程以分别获取非图片背景连通域和图片背景连通域;前景获取单元,其分别通过将非图片背景连通域和图片背景连通域从非图片区域和图片区域中去除,来分别获取非图片区域的非图片前景区域和图片区域的图片前景区域;以及合并单元,其将非图片区域的非图片前景区域和图片区域的图片前景区域进行合并,以获取最终图像前景区域。本公开可以更有效地提取文档前景区域。
-
公开(公告)号:CN108334800A
公开(公告)日:2018-07-27
申请号:CN201710042059.0
申请日:2017-01-20
Applicant: 富士通株式会社
IPC: G06K9/00
Abstract: 本发明实施例提供一种印章图像的处理装置、方法以及电子设备。所述处理方法包括:在两个或以上印章所对应的相同文档的数量大于或等于预设的数量阈值的情况下,将所述两个或以上印章作为相关联的候选印章;基于所述候选印章的印章内容确定两个或以上的所述候选印章是否为相关印章;以及在确定为相关印章的情况下,为两个或以上的候选印章建立印章和印章之间的关系。由此,不但能够挖掘和建立印章之间的关联,从而获得大量新的信息;而且能够大大地提高印章和文档之间关系信息的准确性,从而获得更加可靠的信息。
-
公开(公告)号:CN104573683B
公开(公告)日:2018-02-16
申请号:CN201310495142.5
申请日:2013-10-21
Applicant: 富士通株式会社
Abstract: 本发明涉及一种字符串识别方法和装置。一种字符串识别方法,包括:将包含字符串的图像切分为多个基本单元,每个基本单元包含一个字符或者一个字符的部件;以一个基本单元或多个相邻基本单元的组合构成候选字符模式,以形成切分候选网格;由多个识别器分别对所述切分候选网格中的每个所述候选字符模式进行识别,以得到切分识别候选网格;根据所述多个识别器对每个所述候选字符模式的识别结果,对所述切分识别候选网格中的候选路径进行过滤;以及在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果。通过本发明,可以简化切分识别候选网格,加速路径搜索过程。
-
-
-
-
-
-
-
-
-