面向机器视觉编码的目标级别恰可识别失真的生成方法

    公开(公告)号:CN116233429A

    公开(公告)日:2023-06-06

    申请号:CN202310223615.X

    申请日:2023-02-28

    Inventor: 林浩钦 李娜

    Abstract: 本发明涉及图像视觉技术领域,具体是涉及面向机器视觉编码的目标级别恰可识别失真的生成方法。本发明首先将原始图像采用各个预设量化参数压缩得到各个压缩图像。之后将原始图像和压缩图像上裁剪下来得到目标的原始图像和目标的压缩图像分别输入至失真判别模型,本发明的容错策略纠错失真判别模型的判别结果,并基于纠错之后的判别结果判断哪个预设量化参数所对应的目标的压缩图像满足恰可识别失真,将其作为目标的量化参数,采用目标的量化参数对原始图像的目标所在区域压缩以满足解码端的识别需求;对原始图像的非目标区域进行压缩时,采用更大的量化参数对原始图像非目标区域压缩以减少比特。本发明提高了筛选出的目标的量化参数的准确性。

    基于Transformer的目标级别恰可识别失真的预测方法及终端

    公开(公告)号:CN116193123A

    公开(公告)日:2023-05-30

    申请号:CN202310260104.5

    申请日:2023-03-07

    Inventor: 林浩钦 李娜

    Abstract: 本发明公开了基于Transformer的目标级别恰可识别失真的预测方法及终端,方法包括:通过预测模型提取原始图像中图像块的token特征和类别属性token特征,并根据获取的特征得到每个图像块的重要性权重;预测所述原始图像的恰可识别失真的概率分布,并根据高斯函数概率化的软标签计算损失;选取概率最高的量化参数作为所述原始图像的恰可识别失真,并输出所述原始图像的恰可识别失真。本发明只通过一个多分类模型和原图像即可完成更高精度和高细粒度恰可识别失真的预测。

Patent Agency Ranking