一种基于文本驱动的高效弱监督语义分割方法及装置
Abstract:
本发明公开了一种基于文本驱动的高效弱监督语义分割方法及装置,包括如下步骤:(1)将图片和对应的类别名输入预训练好的视觉‑语言模型,使用基于梯度的类激活映射得到初始的类激活图;(2)基于视觉transformer中的多头自注意力机制对初始的类激活图进行改进;(3)使用条件随机场对改进后的类激活图进行后处理,得到语义分割的伪标签;(4)利用生成的伪标签训练语义分割模型,并利用训练好的语义分割模型对待分割的图片进行语义分割。本发明通过引入基于视觉transformer架构的视觉‑语言模型来高效地为语义分割生成高质量的伪标签,从而提高语义分割模型的分割效率和效果。
Public/Granted literature
Patent Agency Ranking
0/0