-
公开(公告)号:CN113807377A
公开(公告)日:2021-12-17
申请号:CN202010549063.8
申请日:2020-06-16
Applicant: 富士通株式会社
Abstract: 本申请公开一种信息处理装置、信息处理方法和计算机可读存储介质。该信息处理装置包括:概率向量获取单元,获取待分类对象被划分成的N个区段的M维概率向量;候选类别选择单元,选择各个区段的M维概率向量中的除第H元素之外的元素中的前K个最大的元素所对应的类别作为相应的区段的候选类别;路径向量生成单元,基于各个区段的候选类别生成路径向量,并且基于每个路径向量所包括的元素所对应的概率和相邻元素之间的关联度计算相应的路径向量的分数;以及分类结果获取单元,获取分数最高的路径向量作为待分类对象的分类结果,其中,基于相邻元素之间的语义信息以及与相邻元素所对应的区段之间的距离有关的可变权重计算相邻元素之间的关联度。
-
公开(公告)号:CN113627420A
公开(公告)日:2021-11-09
申请号:CN202010386382.1
申请日:2020-05-09
Applicant: 富士通株式会社
IPC: G06K9/32
Abstract: 本申请公开了一种用于定位已识别的文本行中的每个字符的方法和设备以及计算机可读存储介质。该方法包括:步骤S1:给所述文本行中的每个字符标记核心笔画,所述标记指示笔画属于所述文本行中的哪个字符;步骤S2:基于已标记的笔画,对与该已标记的笔画粘连的未标记的粘连笔画和未标记的孤立笔画进行标记,其中,所述孤立笔画是指在两个已标记笔画之间仅有的一个未标记笔画;和步骤S3:将前N对或前M%对彼此相隔最近的两个相邻笔画合并在一起,其中,所述两个相邻笔画没有被标记至不同的字符,以及其中,N是大于或等于1的整数,并且M是0至100之间的任意数值,重复进行步骤S2和S3,直到所有笔画都被标记到所述文本行中的字符为止。
-
公开(公告)号:CN113269181A
公开(公告)日:2021-08-17
申请号:CN202010093279.8
申请日:2020-02-14
Applicant: 富士通株式会社
Abstract: 公开了一种信息处理装置、信息处理方法及计算机可读记录介质。信息处理装置包括:检测单元,被配置成检测图像中包括的至少一个文本行中的每个文本行的起始点和末尾点;预测单元,被配置成针对每个文本行,根据基于该文本行的起始点从图像提取出的与起始点对应的图像块来预测该文本行的第一基线点,并且根据基于第N基线点从图像提取出的与第N基线点对应的图像块来预测该文本行的第N+1基线点,从而预测出用于表示该文本行的路径轨迹的多个基线点,其中,N=1,2,…,M,M为大于等于2的正整数;以及获得单元,被配置成基于每个文本行的起始点、多个基线点以及末尾点,获得该文本行的修正图像。
-
公开(公告)号:CN113128661A
公开(公告)日:2021-07-16
申请号:CN202010043531.4
申请日:2020-01-15
Applicant: 富士通株式会社
Abstract: 本公开内容涉及信息处理装置和信息处理方法。根据本公开的信息处理装置包括:生成单元,被配置成基于教师神经网络模型生成多个候选学生神经网络模型;训练单元,被配置成通过注意力传输处理基于教师神经网络模型对多个候选学生神经网络模型进行训练;以及选择单元,被配置成基于预定标准从经训练的多个候选学生神经网络模型中选择学生神经网络模型。根据本公开的信息处理装置和信息处理方法能够自动地对规模较大的教师神经网络模型进行压缩以获得规模较小的学生神经网络模型,该学生神经网络模型的性能接近教师神经网络模型但是处理速度更快。
-
公开(公告)号:CN112989897A
公开(公告)日:2021-06-18
申请号:CN201911310367.2
申请日:2019-12-18
Applicant: 富士通株式会社
Abstract: 公开了训练多分支网络的方法和对象检测方法。该多分支网络用于在图像中检测对象,并且包括针对图像提取特征图的骨干网络以及连接至骨干网络的至少两个子网络,每个子网络包括区域建议网络(RPN)和检测器。训练方法包括:在每个子网络中,由RPN基于从骨干网络输出的特征图,确定多个候选区域的位置以及每个候选区域中包含有对象的概率,并且输出确定结果;以及由检测器基于RPN的输出,在图像中确定包含对象的区域以及对象的类别,其中,通过深度相互学习来训练各个子网络中的各个RPN,使得各个RPN所输出的确定结果彼此接近。
-
公开(公告)号:CN111985601A
公开(公告)日:2020-11-24
申请号:CN201910423683.4
申请日:2019-05-21
Applicant: 富士通株式会社
Abstract: 本公开涉及一种计算机实现的用于增量学习的数据识别方法,包括:获取新的训练样本集,将新的训练样本集与已有的训练样本集进行合并以得到更新后的训练样本集,计算更新后的训练样本集的复杂度并基于复杂度计算要基于更新后的训练样本集生成的数据识别模型的网络结构的规模,确定要生成的数据识别模型的网络结构的参数空间并基于要识别的数据从网络结构的参数空间中采样得到具有该规模的子网络结构的参数,并根据子网络结构的参数构建用于数据识别模型的网络结构,得到子网络结构的每个结点处的操作;使用更新后的训练样本集对具有子网络结构的数据识别模型进行训练以确定子网络结构中每个节点处的操作所涉及的参数,从而生成数据识别模型,以及基于数据识别模型进行数据识别。
-
公开(公告)号:CN111339695A
公开(公告)日:2020-06-26
申请号:CN201811553495.5
申请日:2018-12-18
Applicant: 富士通株式会社
Abstract: 本公开涉及用于电磁场仿真的装置和方法。根据一个实施例的图像处理装置包括电磁场仿真部分和分辨率提升部。电磁场仿真部分被配置为以第一分辨率获得仿真区域的第一电磁场仿真结果。分辨率提升部分被配置为利用基于深度学习方法训练的模型,根据第一电磁场仿真结果得出具有第二分辨率的第二电磁场仿真结果。第二分辨率高于第一分辨率。
-
公开(公告)号:CN118940791A
公开(公告)日:2024-11-12
申请号:CN202310524691.4
申请日:2023-05-10
Applicant: 富士通株式会社
Abstract: 公开了更新双路多模态模型的方法和装置及介质。方法包括:获得包括唯一标识符和待更新类别的名称的第一文本集合、仅包括待更新类别的名称的第二文本集合和包括非更新类别的名称的第三文本集合;通过使基于第一文本集合获得的、属于待更新类别的更新文本特征均值与属于该待更新类别的训练样本特征之间的距离最小,构建第一损失函数;通过使基于第二文本集合获得的原始文本特征与更新文本特征之间的距离最小,构建第二损失函数;通过使基于第三文本集合获得的、属于非更新类别的原始文本特征均值与上述更新文本特征均值之间的距离最大,构建第三损失函数;通过使由第一、第二和第三损失函数的加权之和构成的总损失函数最小,更新双路多模态模型。
-
公开(公告)号:CN118469358A
公开(公告)日:2024-08-09
申请号:CN202310095958.2
申请日:2023-02-07
Applicant: 富士通株式会社
IPC: G06Q10/0639 , G06F17/18 , G06F18/24 , G06N3/04 , G06N3/088
Abstract: 公开了一种用于分析内容的方法和装置及计算机可读存储介质。该方法包括:获得分别与任务描述的多个类别描述中的每个类别描述相关的多个提示集合;利用多模态模型提取内容的特征以及包括多个类别描述及多个提示集合的文本的特征;基于内容的特征与和该内容属于同一类别的文本的加权的特征之间的距离的上界和内容的特征与和该内容属于不同类别的文本的加权的特征之间的距离的下界之差,来构建指示损失函数,其中,通过使指示损失函数最小来获得文本的特征的权重;和,利用多模态模型,基于内容的特征以及文本的具有所获得的权重的特征来检测与任务描述匹配的内容。
-
公开(公告)号:CN117474947A
公开(公告)日:2024-01-30
申请号:CN202210870624.3
申请日:2022-07-22
Applicant: 富士通株式会社
IPC: G06T7/246 , G06T7/73 , G06V10/44 , G06V10/764
Abstract: 公开了用于目标跟踪的方法、装置和存储介质。用于跨摄像头多目标跟踪的方法包括:针对多个摄像头中的每一个所拍摄的图像序列执行多目标跟踪,以提取在图像序列中出现的每个目标的轨迹片段;针对所提取的多个轨迹片段中的每一个提取特征;基于提取的特征计算多个轨迹片段中的任意两个轨迹片段之间的相似性,以建立相似性矩阵;基于相似性矩阵执行聚类,以使与每个目标潜在相关的轨迹片段聚类为一个集合;对集合内的多个轨迹片段以时间上从早到晚的顺序进行排序,以生成轨迹片段序列;基于轨迹片段之间的相似性、时间距离和空间距离中的至少一个,对集合内的多个轨迹片段进行筛选;使用经筛选的集合内的轨迹片段作为针对相应目标的跟踪信息。
-
-
-
-
-
-
-
-
-