-
公开(公告)号:CN115705745A
公开(公告)日:2023-02-17
申请号:CN202110769261.X
申请日:2021-07-07
Applicant: 富士通株式会社
IPC: G06V40/16 , G06V10/778 , G06V10/82 , G06N3/0464
Abstract: 本公开涉及信息处理装置和信息处理方法。根据本公开的信息处理装置用于训练人脸活动单元识别模型。该信息处理装置包括:第一训练单元,被配置成使用第一样本数据进行训练以获得第一识别模型;以及第二训练单元,被配置成对第二样本数据进行上采样处理,并且使用经上采样的第二样本数据对第一识别模型进行进一步训练以获得人脸活动单元识别模型,其中,第一样本数据和第二样本数据中的每个表示人脸活动单元并且包括正标签样本数据和负标签样本数据,以及第一样本数据的出现频率高于第二样本数据的出现频率。根据本公开的信息处理技术,能够在保持高频类人脸活动单元的检测性能的同时,提高低频类人脸活动单元识别的性能。
-
公开(公告)号:CN117152804A
公开(公告)日:2023-12-01
申请号:CN202210538374.3
申请日:2022-05-18
Applicant: 富士通株式会社
Abstract: 本公开内容涉及训练面部检测模型的方法和装置及面部检测方法。根据本公开内容的一个实施例,该训练模型的方法包括:提取当前批次的多个样本图像的全局特征;确定预测注意力掩码;确定图像的与各面部动作单元对应的局部特征;基于多个样本图像的与各面部动作单元对应的局部特征确定与面部动作单元集相关联的检测结果;基于检测结果确定检测损失;基于多个样本图像的各预测注意力掩码与相应预定注意力掩码的差别确定注意力损失;以及通过基于总损失调整面部检测模型的参数来优化面部检测模型。本公开内容的方法和装置的有益效果包括以下中的至少一个:改善模型的准确度鲁棒性。
-
公开(公告)号:CN119516296A
公开(公告)日:2025-02-25
申请号:CN202311069437.6
申请日:2023-08-23
Applicant: 富士通株式会社
IPC: G06V10/774
Abstract: 公开了图像处理装置和方法、模型训练装置及计算机可读存储介质。图像处理装置可以包括:图像生成单元,被配置成对输入数据设置多个运动相关参数来使输入数据变化,利用预先训练的扩散生成模型基于变化过程中的输入数据来生成第二图像。多个运动相关参数包括位移、速度和加速度。预先训练的扩散生成模型是通过如下方式得到的:对训练图像集中的每个原始训练图像的各个像素点设置多个运动相关参数来使像素点变化,并且基于在变化过程中的多个阶段的经变化的训练图像来对基于分数的扩散生成模型进行训练,以获得预先训练的扩散生成模型。
-
公开(公告)号:CN118736540A
公开(公告)日:2024-10-01
申请号:CN202310325584.9
申请日:2023-03-29
Applicant: 富士通株式会社
IPC: G06V20/60 , G06V20/40 , G06V10/764 , G07G1/00
Abstract: 本申请实施例提供一种物品识别装置和方法以及电子设备。所述装置包括:检测器,其对视频数据的图像帧中的参考区域进行物品检测;追踪器,其对多个图像帧中检测到的物品进行追踪;其中以不同时间窗对所述多个图像帧中的所述物品进行多层级判定;以及分类器,其根据所述追踪器的判定结果识别所述物品。由此,即使在某些场景下物品被短暂移动,该物品也不会被识别为两个不同的物品,能够减少物品被重复识别的情况,提升物品检测的准确性和鲁棒性。
-
-
-