一种基于图像修复模型的文本驱动主体个性化补全方法

    公开(公告)号:CN119722872A

    公开(公告)日:2025-03-28

    申请号:CN202510227784.X

    申请日:2025-02-28

    Abstract: 一种基于图像修复模型的文本驱动主体个性化补全方法,属于图像的生成和编辑领域。步骤一为个性化微调图像修复模型;步骤二为两阶段的图像补全。本发明通过进一步优化基于DreamBooth的个性化微调方法解决主体特征属性耦合问题,并提出向量分解进一步解决耦合问题,以及提出了两阶段图像个性化补全框架来提高图像修复质量,最终实现了高质量的文本驱动主体个性化补全方法。

    灵活视角下的工业零件分类测量的方法

    公开(公告)号:CN117232401A

    公开(公告)日:2023-12-15

    申请号:CN202311164933.X

    申请日:2023-09-08

    Abstract: 本发明提供一种灵活视角下的工业零件分类测量的方法,包括:深度传感器获取放置于桌子一侧的零件的彩色图像和深度图像,并将彩色图像和深度图像对齐得到点云图;根据彩色图像获取桌子的信息;将桌子的信息输入yolact‑edge模型,yolact‑edge模型判断零件的类别;若判断零件的类别为螺栓,根据桌子的信息和点云图得到零件的尺寸;若判断零件的类别为垫片,根据桌子的信息得到零件的尺寸。通过综合彩色图像和深度图像,选用yolact‑edge模型和深度学习算法实现任意视角下的零件的判断,并在判断零件类型后,进行零件的准确测量,低成本、低功耗、高灵活性。

    用于图像伪装目标检测的方法
    3.
    发明公开

    公开(公告)号:CN117132760A

    公开(公告)日:2023-11-28

    申请号:CN202311064182.4

    申请日:2023-08-21

    Abstract: 本发明提供一种用于图像伪装目标检测的方法,包括:将原始图像输入Resnet模型得到第2特征图至第4特征图和最终特征图;将原始图像输入Swin‑Transformer模型得到第9特征图;将最终特征图和第9特征图融合得到第5特征图;根据第2特征图至第5特征图生成边界;根据边界、第2特征图至第5特征图得到第2伪装对象预测图,第2伪装对象预测图为最终伪装对象预测图。通过使用Resnet模型和Swin‑Transformer模型可以很好地完成针对RGB图像的伪装目标检测任务,准确地检测出完整、轮廓准确的伪装目标。

Patent Agency Ranking