-
公开(公告)号:CN112036221A
公开(公告)日:2020-12-04
申请号:CN201910481906.2
申请日:2019-06-04
Applicant: 富士通株式会社
Abstract: 公开了一种对字符图像进行处理的装置、方法和介质。所述装置包括:第一识别单元,其利用第一字符识别模型对所述字符图像进行第一粗识别处理,以获得第一字符识别结果;第二识别单元,其利用第二字符识别模型对所述字符图像进行第二分割处理,以获得第二字符识别结果;对齐单元,其使所述第一字符识别结果与所述第二字符识别结果对齐;以及调整单元,其基于所述第二字符识别结果对所述第一粗识别处理过程中的每个粗识别结果进行调整,以获得调整后的字符识别结果,其中,所述第一识别单元还通过路径估计及搜索算法的方式,对所述调整后的字符识别结果进行处理,以获得最终的字符识别结果。
-
公开(公告)号:CN106845474B
公开(公告)日:2020-05-08
申请号:CN201510889151.1
申请日:2015-12-07
Applicant: 富士通株式会社
Abstract: 本公开提供了图像处理装置和方法。图像处理装置包括:构建单元,用于根据预定约束、按照预定方向以有向边连接待处理图像中的连通部件,以构建有向图;以及获取单元,用于基于所述有向图中的有向边获取所述待处理图像中的文本行,以便用于后续的文本处理,其中,对于任意两个连通部件,所述预定约束包括与所述两个连通部件之间的距离有关的距离约束以及与所述两个连通部件在所述预定方向上的重叠度有关的重叠度约束。
-
公开(公告)号:CN110889487A
公开(公告)日:2020-03-17
申请号:CN201811052825.2
申请日:2018-09-10
Applicant: 富士通株式会社
IPC: G06N3/02
Abstract: 公开了一种神经网络架构搜索装置和方法及计算机可读记录介质。神经网络架构搜索方法包括:限定作为描述神经网络架构的架构参数的集合的搜索空间;基于控制单元的参数,对搜索空间中的架构参数进行采样,以生成至少一个子神经网络架构;计算类间损失和中心损失,通过使包括类间损失和中心损失的损失函数最小来对每个子神经网络架构进行训练;计算分类精度和特征分布得分,并且基于分类精度和特征分布得分计算每个子神经网络架构的奖励得分;以及调整步骤,将奖励得分反馈到控制单元,并使得朝向奖励得分更大的方向调整控制单元的参数,其中,迭代地进行控制步骤、训练步骤、奖励计算步骤以及调整步骤中的处理,直到满足预定迭代终止条件为止。
-
公开(公告)号:CN106295484B
公开(公告)日:2019-11-22
申请号:CN201510325050.1
申请日:2015-06-12
Applicant: 富士通株式会社
IPC: G06K9/00
Abstract: 本发明提供了一种提取文档边界的方法和装置。根据一个实施例的提取文档边界的方法包括:获取基准平面的深度;获取放置在基准平面上的文档的文档图像;获取文档图像的三维点的深度;基于基准平面的深度以及文档图像的三维点的深度在文档图像中提取文档的边界。根据本发明实施例的提取文档边界的方法和装置,可以利用基准平面和文档图像中的三维点的深度在文档图像中提取文档的边界,从而可以降低文档的内容对边界提取的影响。
-
公开(公告)号:CN113449729B
公开(公告)日:2024-12-10
申请号:CN202010224697.6
申请日:2020-03-26
Applicant: 富士通株式会社
IPC: G06V30/148 , G06V30/146 , G06T5/70 , G06T7/90 , G06V30/164
Abstract: 本公开内容涉及图像处理装置、图像处理方法及存储介质。根据本公开内容的一个实施例,该图像处理装置,包括:二值化单元,用于将灰度文档图像二值化作为目标图像;划分单元,用于通过划分目标图像得到沿第一方向布置的多个条形区域;有向图确定单元,用于基于多个条形区域的区域内连通域确定针对整个目标图像的有向图;目标路径确定单元,用于基于有向图确定与有向图的单源最短路径有关的目标路径;以及线消除单元,用于消除灰度文档图像中的与目标路径对应的线。本公开内容的方法、装置和存储介质至少能有助于实现以下效果之一:消除文档图像中的噪声线,处理速度快、占用计算资源少,以及改善文字识别引擎的识别性能。
-
公开(公告)号:CN117495901A
公开(公告)日:2024-02-02
申请号:CN202210887240.2
申请日:2022-07-26
Applicant: 富士通株式会社
Abstract: 本公开内容涉及用于多目标跟踪的后处理的方法、装置及存储介质。根据本公开内容的一个实施例,该方法包括通过执行以下操作尝试切分指示单个目标的轨迹的跟踪小片段:通过确定跟踪小片段的图像块序列中的每个图像块的重识别特征来确定图像块序列的重识别特征集;基于重识别特征集中的多个重识别特征对的特征相似度确定在跟踪小片段中是否存在候选标识切换图像块;在确定结果为“是”的情况下,验证在候选标识切换图像块处发生了标识切换是否可信;以及在验证结果为“可信”的情况下,基于候选标识切换图像块将跟踪小片段切分为两个跟踪小片段。本公开内容的方法和装置的有益效果包括以下中的至少一个:减少标识切换,提高多目标跟踪的准确度。
-
公开(公告)号:CN117409032A
公开(公告)日:2024-01-16
申请号:CN202210793867.1
申请日:2022-07-07
Applicant: 富士通株式会社
Abstract: 本公开内容涉及用于多目标多摄像头跟踪的方法、装置及存储介质。根据本公开内容的一个实施例,该用于多目标多摄像头跟踪的方法包括:通过对多个摄像头中的每个摄像头提供的相应图像序列进行单摄像头多目标跟踪来确定总局部目标轨迹集;以及通过对总局部目标轨迹集进行多摄像头多目标匹配来确定针对多个摄像头的全局目标轨迹集;其中,确定全局目标轨迹集包括:通过对总局部目标轨迹集中的局部目标轨迹进行聚类确定聚类匹配全局轨迹集;通过对以聚类匹配全局轨迹集中的每个轨迹为顶点构造的有向图实施代价最小路径算法来确定代价最小路径集;以及基于代价最小路径集合并聚类匹配全局轨迹集中的相应轨迹。
-
公开(公告)号:CN116415587A
公开(公告)日:2023-07-11
申请号:CN202111581637.0
申请日:2021-12-22
Applicant: 富士通株式会社
Abstract: 本申请公开一种信息处理装置和信息处理方法。该信息处理装置包括:第二文本生成单元,利用多个文本生成模型生成与每个第一文本对应的多个第二文本;候选模型选择单元,被配置成基于多个第二文本与相应的第一文本之间的语义匹配程度从多个文本生成模型中选择候选模型;相似度计算单元,被配置成针对每个第一文本、计算利用候选模型生成的与该第一文本对应的多个第二文本彼此之间的文本相似度,以及基于第二文本彼此之间的文本相似度,计算候选模型彼此之间的模型相似度;目标模型选择单元,被配置成基于模型相似度从候选模型中选择目标模型;以及第四文本生成单元,被配置成利用目标模型生成与待处理文本对应的第二预定数目的第四文本。
-
公开(公告)号:CN114998917A
公开(公告)日:2022-09-02
申请号:CN202110192493.3
申请日:2021-02-20
Applicant: 富士通株式会社
IPC: G06V30/413 , G06V30/18 , G06V30/19 , G06V10/82 , G06F40/263
Abstract: 本申请公开一种图像处理装置、图像处理方法和计算机可读存储介质。该图像处理装置包括:特征提取单元,被配置成提取输入图像的特征;文本检测单元,被配置成基于通过所述特征提取单元所提取的所述特征检测所述输入图像中的文本;语种识别单元,被配置成识别所述文本检测单元所检测到的文本的语种;文本识别单元,被配置成基于所述语种识别单元的识别结果来识别所检测到的所述文本,以获得至少一个字符串集合;以及第一分类单元,被配置成通过将所述至少一个字符串集合和预定字符串集合进行匹配,来对所述输入图像进行分类,以获得表示所述输入图像所涉及的对象的类别的第一分类结果,以供获取所述对象的类别的最终分类结果。
-
公开(公告)号:CN113901856A
公开(公告)日:2022-01-07
申请号:CN202010572846.8
申请日:2020-06-22
Applicant: 富士通株式会社
Abstract: 公开了图像语义分割的方法和装置以及存储介质。一种在图像中分割地块的方法,包括:获取第一标记图像,其中该第一标记图像是通过对预定图像进行人工标注而生成的;基于该第一标记图像,通过执行数学形态学运算而生成第二标记图像;利用第一标记图像训练第一神经网络,使得第一神经网络输出分割预测图像;利用第二标记图像训练第二神经网络,使得第二神经网络输出道路预测图像;通过将第一神经网络输出的分割预测图像与第二神经网络输出的道路预测图像进行合并,生成分割图像。
-
-
-
-
-
-
-
-
-