监播系统的控制方法、装置和存算一体系统

    公开(公告)号:CN119678192A

    公开(公告)日:2025-03-21

    申请号:CN202380009259.X

    申请日:2023-05-31

    Inventor: 王婷婷 黄光伟

    Abstract: 本公开提供一种监播系统的控制方法、装置、计算机设备和存储介质,属于图像识别和终端监播技术领域,其中,监播系统的控制方法包括获取待检测图像;根据拍摄待检测图像的拍摄设备的拍摄视角,将待检测图像划分为多个目标子图像;针对多个目标子图像中的各个目标子图像,利用预先训练好的目标神经网络模型,对目标子图像进行处理,得到目标子图像的识别结果;基于各个目标子图像对应的识别结果,得到待检测图像中是否存在目标对象的检测结果,并将检测结果发送至终端,以使终端至少基于检测结果确定显示状态。

    Transformer网络模型的训练方法、装置、电子设备及介质

    公开(公告)号:CN119067169A

    公开(公告)日:2024-12-03

    申请号:CN202310637322.6

    申请日:2023-05-31

    Abstract: 本发明提供一种Transformer网络模型的训练方法、装置、电子设备及介质,该训练方法包括:获取原始Transformer网络模型;采用第一训练数据集对所述原始Transformer网络模型进行训练,得到教师模型;对所述教师模型进行剪枝,得到学生模型;采用所述教师模型和第二训练数据集对所述学生模型进行训练,其中,所述采用所述教师模型和第二训练数据集对所述学生模型进行训练包括:对所述教师模型的中间层和最后输出层的输出进行蒸馏,并根据所述中间层和最后输出层的蒸馏损失,确定训练所述学生模型过程中使用的损失。本发明在降低Transformer模型参数量和计算复杂度的同时,能够减小模型的精度损失。

    人脸识别方法及装置、存内计算系统

    公开(公告)号:CN119068519A

    公开(公告)日:2024-12-03

    申请号:CN202310639397.8

    申请日:2023-05-31

    Abstract: 本公开提供了一种人脸识别方法及装置、存内计算系统,涉及计算机技术领域,可用于计算机视觉、图像处理、机器学习等技术领域,该方法包括:获取待处理图像;将所述待处理图像输入到配置有人脸检测模型的存内计算芯片,利用预设的人脸检测模型对待处理图像进行人脸检测处理,得到待处理图像中的初始人脸检测框;根据初始人脸检测框获取目标人脸图像;在存内计算芯片中利用存内计算芯片预先配置的人脸识别模型对目标人脸图像进行人脸识别处理,得到目标人脸图像对应的目标人脸特征向量;将目标人脸特征向量与预设人脸图像对应的特征向量进行比对,获得人脸识别结果。本公开还提供一种电子设备及计算机可读存储介质。

    生产线的质量控制方法、系统和制造平台

    公开(公告)号:CN119404218A

    公开(公告)日:2025-02-07

    申请号:CN202380008915.4

    申请日:2023-04-28

    Inventor: 孔岳 黄光伟

    Abstract: 本公开实施例提供了一种生产线的质量控制方法、系统和制造平台,属于制造技术领域,旨在提高生产线中进行质检的效率和自动化水平,所述方法包括:响应于第一预设条件的触发,对所述目标生产线上所产出的多个待检对象进行质检;将所述质检的结果反馈到与所述目标生产线关联的控制对象,所述控制对象用于控制所述目标生产线的工艺流程;响应于所述控制对象上被触发的第二预设条件,基于至少一个所述待检对象各自的质检结果,对所述目标生产线进行调控;其中,所述质检包括:对所述目标生产线产出的待检对象进行至少一次图像采集,并将采集得到的至少一张图像输入至缺陷检测模型,以对所述待检对象进行质检。

    文本识别方法、装置、电子设备及存储介质

    公开(公告)号:CN112541494B

    公开(公告)日:2025-02-07

    申请号:CN202011521439.0

    申请日:2020-12-21

    Inventor: 胡鹏 黄光伟

    Abstract: 本申请公开了一种文本识别方法、装置、电子设备及存储介质,该方法包括获取待识别文本图像;基于预先构建的文本检测网络,提取待识别文本图像的特征图,并对经过融合的特征图进行文字像素分类,生成至少一个候选文本框,其中文本检测网络包括第一特征提取层、第二特征提取层和第三特征提取层,第二特征提取层上采样第一特征提取层的输出结果,第三特征提取层下采样第二特征提取层的输出结果;根据预设目标文本格式,筛选候选文本框得到目标文本框,并对目标文本框进行识别,得到识别结果。基于此,本申请能够同时利用低层特征的高分辨率信息以及高层特征的高语义信息,使得文本像素位置检测更加精确,提升了文本识别准确度和效率。

    生成模型的训练方法、识别方法、装置、终端设备及介质

    公开(公告)号:CN118736607A

    公开(公告)日:2024-10-01

    申请号:CN202310325426.3

    申请日:2023-03-29

    Inventor: 刘兴宸 黄光伟

    Abstract: 本申请公开了一种生成模型的训练方法、识别方法、装置、终端设备及介质,涉及字符识别领域,方法包括:获取多个第一真实样本;基于第一真实标签获取笔画轨迹数据以作为第一真实笔画轨迹数据;将第一真实笔画轨迹数据输入至预设网络模型的生成器,得到重建图片;将重建图片和第一真实图片输入至预设网络模型的鉴别器,得到第一鉴别结果及第二鉴别结果;最后,基于第一鉴别结果和第二鉴别结果进行模型更新,以得到字符样本的生成模型。如此,本申请通过真实样本的图片和标签,训练了相应的字符样本的生成模型,并且,图片样本和真实样本之间,字符和书写轨迹均相似,也因此,在训练如手写文字识别模型等模型时,能基于足够多的样本以进行训练。

Patent Agency Ranking