图像高亮区域的信息补偿方法、装置、设备及存储介质

    公开(公告)号:CN113781321A

    公开(公告)日:2021-12-10

    申请号:CN202110883140.8

    申请日:2021-08-02

    Abstract: 本申请提供一种图像高亮区域的信息补偿方法、装置、设备及存储介质,涉及图像处理技术领域。图像高亮区域的信息补偿方法包括:获取待处理图像的过曝掩模图像和初始优化图像,过曝掩模图像用于指示待处理图像的高亮区域;根据初始优化图像获取全局曝光信息;根据过曝掩模图像和全局曝光信息确定高亮区域的过曝光信息;利用过曝光信息对初始优化图像的高亮区域进行补偿,得到初始优化图像的补偿图像。本申请提供的图像高亮区域的信息补偿方法可以解决图像优化处理任务中图像的高亮区域内容丢失的问题。

    一种图像处理方法、装置、终端设备及存储介质

    公开(公告)号:CN113781320A

    公开(公告)日:2021-12-10

    申请号:CN202110882192.3

    申请日:2021-08-02

    Abstract: 本申请提供一种图像处理方法、装置、终端设备及存储介质,应用于图像处理领域。本申请提供的图像处理方法包括:利用已训练的优化模型对待处理图像进行目标类型优化处理,得到初始优化图像;通过已训练的局部增强模型对初始优化图像进行局部增强处理,得到增强图像;将增强图像和待处理图像的过曝掩模图像输入到已训练的补偿模型中进行处理,对增强图像的高亮区域进行信息补偿,得到补偿图像,过曝掩模图像指示高亮区域。本申请提供的图像处理方法、装置、终端设备及存储介质可以提高图像优化处理任务中优化图像的质量。

    一种文本识别方法及相关装置

    公开(公告)号:CN113627243A

    公开(公告)日:2021-11-09

    申请号:CN202110740206.8

    申请日:2021-06-30

    Inventor: 李明 付彬 乔宇

    Abstract: 本申请公开了一种文本识别方法及相关装置。该方法包括:获取文本图片;文本图片为包括目标文本的图片;将文本图片输入至文本识别网络进行识别,得到目标文本;文本识别网络的各个层级同时利用文本图片的局域信息和序列信息对目标文本进行识别,局域信息包括目标文本的结构信息,序列信息包括目标文本的上下文序列信息。本方法在基于文本识别网络对文本图片进行识别的过程中,通过并行提取文本图片的局域视觉信息和上下文序列信息,并将文本图片的局域视觉信息和上下文序列信息交互融合,使得在文本识别网络的各个层级都能同时利用文本图片的二元信息,解决了识别过程中文本字符遗漏或是错位的问题,提高了文本识别的准确率及效率。

    一种文本处理方法及相关装置

    公开(公告)号:CN113627242A

    公开(公告)日:2021-11-09

    申请号:CN202110738496.2

    申请日:2021-06-30

    Inventor: 李明 付彬 乔宇

    Abstract: 本申请公开了一种文本处理方法及相关装置。该方法包括:获取第一文本图片;第一文本图片为包括第一文本的图片;将第一文本图片输入至文本矫正网络进行文本矫正,得到包括第二文本的第二文本图片;文本矫正网络为利用第一文本中的每个字符的位置信息进行矫正的网络,第二文本的文本内容与第一文本的文本内容相同,第二文本图片中的第二文本为水平文本。本方法对于输入的文本图片,通过检测其包含的文本信息得到每个字符的位置信息,并利用该位置信息重构出每个字符的坐标框,再根据该坐标框对字符进行更精细的控制点采样,使得矫正后的文本更加水平,提高了文本矫正的准确率及效率,进而提高文本识别的准确率及效率。

    一种基于图神经网络推理的可解释推荐方法

    公开(公告)号:CN113158045A

    公开(公告)日:2021-07-23

    申请号:CN202110426669.7

    申请日:2021-04-20

    Inventor: 吕子钰 乔宇

    Abstract: 本发明公开了一种基于图神经网络推理的可解释推荐方法。该方法包括:针对用户行为的交互矩阵,构建多关系用户行为图;对于用户行为图,利用用户行为偏好理解模型学习高阶的关联关系并传播用户行为偏好,得到用户、物品、用户‑物品间关联的向量表示;将用户行为偏好理解模型输出的用户状态表示、物品状态表示、用户‑物品关联表示输入至用户行为偏好理解模型,获得给定用户的物品推荐;将用户行为偏好理解模型输出的用户偏好状态表示、物品状态表示、用户‑物品关联表示的融合作为解释生成模型的输入,并结合文本评论集合,获得为给定用户所推荐物品的相关解释。本发明能够在提供高性能的推荐结果的同时生成高质量、易于理解的推荐解释。

    一种超分辨率方法、装置、终端设备及存储介质

    公开(公告)号:CN112862681A

    公开(公告)日:2021-05-28

    申请号:CN202110130561.3

    申请日:2021-01-29

    Abstract: 本申请提供一种超分辨率方法、装置、终端设备及存储介质,涉及深度学习技术领域,能够降低计算量。该超分辨率方法包括:将待处理的低分辨率图像输入已训练的分类超分网络模型中处理,输出得到与低分辨率图像对应的高分辨率图像;其中,分类超分网络模型包括分类模型和复杂度不同的多个超分辨网络模型,分类超分网络模型对低分辨率图像的处理过程包括:将低分辨率图像切割为多个子图像;针对每个子图像,根据分类模型确定子图像的复杂度,并将子图像输入到多个超分辨网络模型中与子图像的复杂度对应的超分辨网络模型中处理,输出得到子图像的重建图像;将每个子图像的重建图像进行拼接,得到高分辨率图像。

    机器人的自主情感生成方法、系统及应用

    公开(公告)号:CN112733994A

    公开(公告)日:2021-04-30

    申请号:CN202011440726.9

    申请日:2020-12-10

    Inventor: 乔宇 李英

    Abstract: 本发明提供了机器人的自主情感生成方法、系统及应用,包括:收集包含目标人物和目标人物以外其他人物的视频,对视频进行情感标注得到标注向量;根据标注向量准备训练数据,通过长短期记忆网络进行训练以得到目标人物的情感生成模型;获取当前场景的人物情感作为机器人情感输入,并根据情感生成模型模型生成当前的机器人自主情感。该方法基于大量的音视频材料,通过深度学习技术,建立视频中特定人物的情感模型,从而使机器人拥有类似特定人物的情感,在机器人运行中,根据当前用户的情感,自主生成机器人当前的情感。预测准确度更高,方法更简单,自动化程度更高。

    一种表情识别的方法、装置、终端设备及存储介质

    公开(公告)号:CN109522818B

    公开(公告)日:2021-03-30

    申请号:CN201811268476.8

    申请日:2018-10-29

    Abstract: 本发明实施例适用于信息技术领域,提供了一种表情识别的方法、装置、终端设备及存储介质,所述方法包括:获取包含人脸图像的待识别的视频信息;从待识别的视频信息中分别提取多帧视频序列和音频信息;识别多帧视频序列对应的图像表情识别概率和动态表情识别概率;以及,识别音频信息对应的音频情感识别概率;基于图像表情识别概率、动态表情识别概率和音频情感识别概率,生成与待识别的视频信息中人脸图像相对应的表情识别结果。本实施例通过将音频信息作为重要的互补信息,并减少视频序列中不显著表情和质量不好的视频帧对识别带来的负面影响,关注视频帧中的显著表情,提高了视频表情识别的准确率和鲁棒性。

    一种视频目标检测方法、装置、设备以及存储介质

    公开(公告)号:CN112101114A

    公开(公告)日:2020-12-18

    申请号:CN202010819564.3

    申请日:2020-08-14

    Abstract: 本申请适用于计算机技术领域,提供了一种视频目标检测方法、视频目标检测装置、视频目标检测设备及存储介质,包括:获取待检测视频中的目标视频帧以及支撑视频帧;将目标视频帧以及支撑视频帧输入到已训练的视频目标检测模型中处理,得到目标物体对应的检测结果。上述方式,视频目标检测模型基于训练样本视频集中各个视频内的物体相似度以及训练样本视频集中各个视频间的物体相似度生成,不仅考虑到了各个视频内的物体相似度,还考虑到了各个视频间的物体相似度。使用该视频目标检测模型提取到的目标视频帧的目标物体对应的特征更准确、信息更丰富,进而根据目标物体对应的特征确定检测结果时,得到的检测结果更准确。

Patent Agency Ranking