一种基于Transformer特征聚类的缺省位置标签下图像目标定位方法
Abstract:
本发明公开了一种基于Transformer特征聚类的缺省位置标签下图像目标定位方法。本发明通过基于Transformer深度学习的Vit模型获取融合特征图,并以融合类别信息特征向量为基准通过聚类的方式生成图像中的目标物体的粗略范围图,再进一步训练相应的直接判别模型来生成精确范围图,从而在不使用位置标签的情况下获得良好的物体目标定位准确度。本发明极大地减少了深度学习目标检测应用中的数据获取成本,减小了深度学习方法的应用难度。
Patent Agency Ranking
0/0