文生图大模型安全漏洞检测方法、系统、设备及介质

    公开(公告)号:CN119150300A

    公开(公告)日:2024-12-17

    申请号:CN202411236151.7

    申请日:2024-09-04

    Abstract: 本发明属于图像处理领域,公开了一种文生图大模型安全漏洞检测方法、系统、设备及介质,包括获取输入文本并提取输入文本中的敏感词和关键词;文本替换步骤:进行若干次词替换步骤得到若干替换文本;词替换步骤:根据预设的基于高相似度的敏感词替换策略获取敏感替换词并采用敏感替换词替换敏感词,并根据预设的基于低置信度的关键词替换策略获取关键替换词并采用关键替换词替换关键词;检测步骤:根据预设的目标安全过滤器和参考安全过滤器从若干替换文本中选取最优替换文本,并通过最优替换文本对文生图大模型进行安全漏洞检测;重复预设重复次数或检测到安全漏洞。无须过多先验知识,对于过滤器的种类与漏洞类型均无特定的限制,普适性强。

Patent Agency Ranking