搜索神经网络架构的方法和装置
    51.
    发明公开

    公开(公告)号:CN113924578A

    公开(公告)日:2022-01-11

    申请号:CN201980097238.1

    申请日:2019-07-15

    Abstract: 公开了搜索神经网络架构的方法和装置。神经网络架构包括骨干网络和特征网络。该方法包括:a.构建针对骨干网络的第一搜索空间和针对特征网络的第二搜索空间;b.利用第一控制器在第一搜索空间中采样骨干网络模型,利用第二控制器在第二搜索空间中采样特征网络模型;c.通过将采样的骨干网络模型和特征网络模型的熵和概率进行相加来组合第一控制器和第二控制器,以获得联合控制器;d.利用联合控制器获得联合模型;e.评估联合模型并且根据评估结果更新联合模型的参数;f.确定更新的联合模型的验证精度并且根据验证精度来更新联合控制器;g.迭代地执行步骤d‑f,将达到预定验证精度的联合模型作为搜索到的神经网络架构。

    用于进行多目标优化的装置、方法以及存储介质

    公开(公告)号:CN113822281A

    公开(公告)日:2021-12-21

    申请号:CN202010565659.7

    申请日:2020-06-19

    Inventor: 孙利 汪留安 孙俊

    Abstract: 本公开内容涉及用于对模型进行多目标优化的装置、方法以及存储介质。根据本公开内容的一个实施例,该装置包括:存储器,存储有指令;以及处理器,处理器被配置从存储器获取指令,并执行指令以:确定模型的模型损失函数;基于模型损失函数和模型的速度指标确定模型的多目标优化函数;以及求解多目标优化函数以确定满足预定要求的选定模型;其中,模型包括用于完成图像任务的多个子模型;模型损失函数为多个子模型中的各子模型的子模型损失函数的加权和;各子模型损失函数的用于加权和的损失权重是通过基于训练样本集以迭代更新方式被确定。本公开内容的方法、装置和存储介质的有益效果至少包括:能够筛选出综合性能良好的模型。

    二维码检测装置、二维码检测方法及存储介质

    公开(公告)号:CN113515965A

    公开(公告)日:2021-10-19

    申请号:CN202010274347.0

    申请日:2020-04-09

    Abstract: 本公开内容涉及二维码检测装置、二维码检测方法及存储介质。根据本公开内容的一个实施例,该二维码检测装置包括:确定单元,被配置成确定包括二值化图像中的多个矩形图块的第一图块集;移除单元,被配置成通过基于第一图块集中的图块的图块特征从第一图块集移除满足预定条件的矩形图块得到第二图块集;以及检测单元,被配置成检测第二图块集中各图块以确定二值化图像的与快速反应码、阿兹特克码和数据矩阵码中的至少一种有关的二维码信息。本公开内容的方法、装置和存储介质至少能有助于实现以下效果之一:能够检测多种二维码、召回率高、准确率高、执行速度快以及占用资源少。

    用于消除线的图像处理装置、图像处理方法及存储介质

    公开(公告)号:CN113449729A

    公开(公告)日:2021-09-28

    申请号:CN202010224697.6

    申请日:2020-03-26

    Inventor: 汪留安 孙俊

    Abstract: 本公开内容涉及图像处理装置、图像处理方法及存储介质。根据本公开内容的一个实施例,该图像处理装置,包括:二值化单元,用于将灰度文档图像二值化作为目标图像;划分单元,用于通过划分目标图像得到沿第一方向布置的多个条形区域;有向图确定单元,用于基于多个条形区域的区域内连通域确定针对整个目标图像的有向图;目标路径确定单元,用于基于有向图确定与有向图的单源最短路径有关的目标路径;以及线消除单元,用于消除灰度文档图像中的与目标路径对应的线。本公开内容的方法、装置和存储介质至少能有助于实现以下效果之一:消除文档图像中的噪声线,处理速度快、占用计算资源少,以及改善文字识别引擎的识别性能。

    图像处理方法和信息处理设备

    公开(公告)号:CN112381079A

    公开(公告)日:2021-02-19

    申请号:CN201910689370.3

    申请日:2019-07-29

    Abstract: 本公开提供了图像处理方法和信息处理设备。图像处理方法包括:将包含文本的待处理图像输入到用于字符识别的卷积神经网络模型,以提取文本特征;将所提取的文本特征输入到与卷积神经网络模型连接的、用于语义识别的循环神经网络模型,以识别待处理图像中的文本,其中,卷积神经网络模型和循环神经网络模型是通过基于彼此连接的、具有待定层的初始卷积神经网络模型以及具有待定层的初始循环神经网络模型,在预定义的候选模型空间中针对每个待定层进行搜索并以端到端的方式对彼此连接的卷积神经网络模型和循环神经网络模型进行联合训练而获得的。

    深度学习加速的方法和设备及深度神经网络

    公开(公告)号:CN110533175A

    公开(公告)日:2019-12-03

    申请号:CN201810502897.6

    申请日:2018-05-23

    Inventor: 汪留安 孙俊

    Abstract: 本发明公开了一种深度学习加速的方法和设备及深度神经网络。所述方法包括:将深度神经网络的权重和偏差随机地初始化为n位定点数;将深度神经网络中计算量大于预定的第一阈值的层中的数据削减为m位定点数,其中m和n为整数且m

    图像处理方法和装置
    57.
    发明公开

    公开(公告)号:CN108073924A

    公开(公告)日:2018-05-25

    申请号:CN201611013599.8

    申请日:2016-11-17

    Inventor: 汪留安 范伟 孙俊

    Abstract: 本发明涉及图像处理方法和装置,该方法用于处理通过对图像进行三维扫描而得到的三维数据,包括:针对三维数据中的预定扫描线上的每个预定抽样点,获取通过预定抽样点和另一扫描线上的候选抽样点的直线作为预定抽样点的候选规则线,找到满足预定条件的候选规则线作为每个预定抽样点的最终规则线;选定任一最终规则线上的一个点作为初始准线点,将与初始准线点相邻的最终规则线上与初始准线点的距离最近的点确定为该最终规则线上的准线点,依次迭代确定所有最终规则线上的准线点;以及基于所确定的所有准线点,通过曲线拟合获得准线。

    文本图像提取装置以及方法

    公开(公告)号:CN104112135B

    公开(公告)日:2017-06-06

    申请号:CN201310136363.3

    申请日:2013-04-18

    Abstract: 本公开提供一种文本图像提取装置和方法。该装置包括边缘极性确定单元,根据输入图像中检测到的每个边缘的亮度变化趋势确定每个边缘的极性;笔划宽度确定单元,将极性相反的两个边缘确定为匹配边缘对,并且基于用户指定区域中的各个匹配边缘对中的两个匹配边缘之间的距离确定该用户指定区域中的文本的笔划宽度;前景像素确定单元,将输入图像的匹配边缘对中两个匹配边缘之间的距离与笔划宽度之差在第一预定范围之内的匹配边缘对之间的像素确定为输入图像的前景像素;以及文本图像区域获取单元,利用前景像素对用户指定区域进行扩展,从而获取文本图像区域。本公开能够以简单、快速的方式实现对文本图像区域的提取。

    文本提取方法和装置
    59.
    发明公开

    公开(公告)号:CN104732188A

    公开(公告)日:2015-06-24

    申请号:CN201310705512.3

    申请日:2013-12-19

    Abstract: 本发明涉及一种文本提取方法和装置。一种文本提取方法,包括:获取用户对图像上感兴趣的文本的指定;确定文本的大小;确定文本的排列方向;估计文本的排列方向的偏移角度;根据文本的大小、排列方向和偏移角度来确定包含文本的图像片段;对图像片段中的种子连通部件进行种子连通部件生长以提取用户感兴趣的文本。

    文本图像提取装置以及方法

    公开(公告)号:CN104112135A

    公开(公告)日:2014-10-22

    申请号:CN201310136363.3

    申请日:2013-04-18

    Abstract: 本公开提供一种文本图像提取装置和方法。该装置包括边缘极性确定单元,根据输入图像中检测到的每个边缘的亮度变化趋势确定每个边缘的极性;笔划宽度确定单元,将极性相反的两个边缘确定为匹配边缘对,并且基于用户指定区域中的各个匹配边缘对中的两个匹配边缘之间的距离确定该用户指定区域中的文本的笔划宽度;前景像素确定单元,将输入图像的匹配边缘对中两个匹配边缘之间的距离与笔划宽度之差在第一预定范围之内的匹配边缘对之间的像素确定为输入图像的前景像素;以及文本图像区域获取单元,利用前景像素对用户指定区域进行扩展,从而获取文本图像区域。本公开能够以简单、快速的方式实现对文本图像区域的提取。

Patent Agency Ranking