用于生成带有异常目标的图像的装置、方法和存储介质

    公开(公告)号:CN119445269A

    公开(公告)日:2025-02-14

    申请号:CN202310960741.3

    申请日:2023-08-01

    Inventor: 王平 汪留安 孙俊

    Abstract: 本公开涉及用于生成带有异常目标的图像的装置、方法和存储介质。装置包括:生成单元,其在第一图像的待生成图像区域中随机生成第一掩膜的外接框,其中,第一掩膜的外接框不与第一图像中的现有检测目标交叠,并且旨在向第一掩膜的外接框中添加异常目标;第一获取单元,其基于第一图像的包括外接框的部分区域得到第二图像和对应的第二掩膜,第二图像的尺寸符合图像添加单元所需模型的输入要求;图像添加单元,其将异常目标添加至第二图像中的第二掩膜中的外接框内;以及第二获取单元,其基于添加了异常目标的第二图像得到添加有异常目标的第一图像作为生成图像。该装置可以在不影响原检测目标质量的前提下,生成带有异常目标的图像。

    定位已识别文本行中的每个字符的方法、设备和存储介质

    公开(公告)号:CN113627420B

    公开(公告)日:2025-01-03

    申请号:CN202010386382.1

    申请日:2020-05-09

    Abstract: 本申请公开了一种用于定位已识别的文本行中的每个字符的方法和设备以及计算机可读存储介质。该方法包括:步骤S1:给所述文本行中的每个字符标记核心笔画,所述标记指示笔画属于所述文本行中的哪个字符;步骤S2:基于已标记的笔画,对与该已标记的笔画粘连的未标记的粘连笔画和未标记的孤立笔画进行标记,其中,所述孤立笔画是指在两个已标记笔画之间仅有的一个未标记笔画;和步骤S3:将前N对或前M%对彼此相隔最近的两个相邻笔画合并在一起,其中,所述两个相邻笔画没有被标记至不同的字符,以及其中,N是大于或等于1的整数,并且M是0至100之间的任意数值,重复进行步骤S2和S3,直到所有笔画都被标记到所述文本行中的字符为止。

    用于生成轨迹片段的方法、装置和存储介质

    公开(公告)号:CN119107340A

    公开(公告)日:2024-12-10

    申请号:CN202310682973.7

    申请日:2023-06-09

    Inventor: 王平 汪留安 孙俊

    Abstract: 公开了用于生成轨迹片段的方法、装置和存储介质。用于生成目标的轨迹片段的方法包括:基于轨迹片段的开始时间,将多个摄像装置拍摄的目标的多个轨迹片段按照从早到晚的顺序进行排序;基于多个轨迹片段中的任何两个相邻轨迹片段之间的时间距离和空间距离,确定是否要生成虚拟轨迹片段,该虚拟轨迹片段用于连接该相邻轨迹片段,以形成目标的在时间和空间上连续的轨迹;在确定要生成虚拟轨迹片段的情况下,基于预先生成的区域分割图和最优路径表来生成虚拟轨迹片段。区域分割图指示对目标所处场景的平面布局图的分割,并且包括多个顶点以及相连顶点之间的连接线。最优路径表指示区域分割图中任何两个顶点之间的最优路径。

    神经网络及其训练方法
    64.
    发明授权

    公开(公告)号:CN113554042B

    公开(公告)日:2024-11-08

    申请号:CN202010271823.3

    申请日:2020-04-08

    Abstract: 公开了神经网络及其训练方法。该神经网络用于图像中的对象检测,并且包括骨干网络、特征网络和预测模块,特征网络包括第一模块和第二模块。骨干网络对图像进行处理以输出不同尺寸的N个第一特征。特征网络的第一模块基于尺寸最小的第一特征执行N‑1次反卷积,以输出不同尺寸的N个第二特征。特征网络的第二模块对N个第一特征执行合并以输出不同尺寸的N个第三特征。通过将N个第二特征与N个第三特征进行组合来生成不同尺寸的N个第四特征,对N个第四特征分别执行不同次数的卷积。预测模块基于N个第四特征进行预测并且计算第一损失,以及基于卷积后得到的特征进行预测并且计算第二损失。基于第一损失与第二损失的组合来训练该神经网络。

    信息处理装置、信息处理方法和机器可读存储介质

    公开(公告)号:CN118644695A

    公开(公告)日:2024-09-13

    申请号:CN202310244361.X

    申请日:2023-03-13

    Inventor: 刘威 汪留安 孙俊

    Abstract: 本公开涉及一种信息处理装置、信息处理方法和机器可读存储介质。信息处理装置包括:获得单元,其获得针对视频的要描述的概念的封闭集标签组以及与封闭集标签组对应的提示集合,其中,封闭集标签组包括关于概念的所有标签,并且提示集合包括与封闭集标签组中的每个标签对应的提示;CLIP单元,其提取视频中的每帧图像的特征,并且基于提取的特征和提示集合,判定每帧图像属于封闭集标签组中的每个标签的得分;以及标签确定单元,其基于视频中的所有图像的得分,确定视频的标签。该信息处理装置可以实现视频级属性描述的封闭集概念标注。

    处理目标轨迹的方法、装置及存储介质

    公开(公告)号:CN117710405A

    公开(公告)日:2024-03-15

    申请号:CN202211048484.8

    申请日:2022-08-30

    Abstract: 本公开内容涉及处理目标轨迹的方法、装置及存储介质。根据本公开内容的一个实施例,该处理目标轨迹的方法包括:确定对应多个购物收据中的一个购物收据的收据数据组的候选顾客轨迹集;针对候选顾客轨迹集中的每条轨迹,统计在收据数据组指示的售出物品集中在位置上与该轨迹匹配的售出物品的数量作为该轨迹的第一位置匹配计数;针对候选顾客轨迹集中的每条轨迹,统计在售出物品集中在位置上与该轨迹的感兴趣轨迹点集中的感兴趣轨迹点匹配的售出物品的数量作为该轨迹的第二位置匹配计数;以及基于候选顾客轨迹集中的多条轨迹的第一位置匹配计数和第二位置匹配计数在候选顾客轨迹集中确定与收据数据组对应的顾客轨迹。

    图像分割方法、装置和存储介质
    67.
    发明公开

    公开(公告)号:CN116664472A

    公开(公告)日:2023-08-29

    申请号:CN202210153314.X

    申请日:2022-02-18

    Abstract: 公开了图像分割方法、装置和存储介质。一种利用神经网络对多模态病理图像执行图像分割的方法,该多模态病理图像至少包括第一和第二模态图像,该神经网络至少包括第一模态图像处理部分、第二模态图像处理部分和特征融合部分,该方法包括:由第一和第二模态图像处理部分分别针对第一和第二模态图像提取第一和第二特征;由特征融合部分通过融合第一特征和第二特征而生成第一融合特征和第二融合特征;第一和第二模态图像处理部分分别基于第一和第二融合特征对相应模态图像执行图像分割,分割预测结果被合并作为最终分割结果;分别基于第一和第二损失函数训练第一和第二模态图像处理部分;利用经训练的神经网络对待分割的多模态图像执行图像分割。

    选择波段的方法和装置及生成光谱图像处理模型的方法

    公开(公告)号:CN116263939A

    公开(公告)日:2023-06-16

    申请号:CN202111507978.3

    申请日:2021-12-10

    Abstract: 本公开内容涉及选择波段的方法和装置及生成光谱图像处理模型的方法。根据本公开内容的一个实施例,该选择波段的方法包括:基于使用包含与N个波段的第一波段集对应的光谱响应的作为训练样本的第一类对象训练的第一光谱图像处理模型的第一个二维卷积层,生成表征N个波段中的各波段之间的相似性的第一波段集相似性矩阵;以及至少基于第一波段集相似性矩阵从N个波段中选择n个波段作为与第二光谱图像处理模型相关联的第二波段集;其中,N>n。本公开内容的方法和装置的有益效果包括以下中的至少一个:减少计算成本,改善模型的准确度性能,减少测试数据的采集时间,以及降低测试数据采集成本。

    用于图像处理的方法、设备和存储介质

    公开(公告)号:CN115294417A

    公开(公告)日:2022-11-04

    申请号:CN202110411425.1

    申请日:2021-04-16

    Abstract: 公开了用于图像处理的方法、设备和存储介质。该方法包括:通过预处理获得图像的概率图;对概率图进行降采样,然后基于不同的降采样方法、阈值和分辨率的组合对概率图进行多维度特征提取;将提取的特征输入全图分类模型,并且获得不同的阈值和分辨率的所有参数组合中的前N个分类精度最高的组合;基于前N个组合,利用全图分类模型从提取的特征中选择前M维重要性分数最高的特征;基于M维特征,利用全图分类模型从所有参数组合中选择前N’个分类精度最高的组合;和基于在前N’个组合中的一种组合下的前M维重要性分数最高的特征,利用全图分类模型对图像进行分类,其中N、N’和M是大于零的整数。

    图像处理装置、图像处理方法和计算机可读存储介质

    公开(公告)号:CN114764882A

    公开(公告)日:2022-07-19

    申请号:CN202110044743.9

    申请日:2021-01-13

    Abstract: 本公开内容涉及图像处理装置和图像处理方法以及计算机可读存储介质。该图像处理装置包括:检测单元,被配置成从图像中检测目标物体的位置和类别,其中目标物体的位置由在图像中包围目标物体的边框表示;以及调整单元,被配置成基于关于类别之间的关系的先验知识对位置和类别进行调整以获得目标物体的最终位置和最终类别,其中调整单元使用基于先验知识的图注意力网络模型对位置和类别进行调整。根据本公开内容的图像处理技术,可以提高图像中的目标检测的精度。

Patent Agency Ranking