一种基于Transformer特征聚类的缺省位置标签下图像目标定位方法

Invention Publication

CN116543142A 一种基于Transformer特征聚类的缺省位置标签下图像目标定位方法审中-实审

Please log in to see more content

Patent Title: 一种基于Transformer特征聚类的缺省位置标签下图像目标定位方法
Application No.: CN202310255057.5

Application Date: 2023-03-16
Publication No.: CN116543142A

Publication Date: 2023-08-04
Inventor: 谢磊 , 李明 , 苏宏业
Applicant: 浙江大学
Applicant Address: 浙江省杭州市西湖区余杭塘路866号
Assignee: 浙江大学
Current Assignee: 浙江大学
Current Assignee Address: 浙江省杭州市西湖区余杭塘路866号
Agency: 杭州求是专利事务所有限公司
Agent 傅朝栋; 张法高
Main IPC: G06V10/25
IPC: G06V10/25 ; G06V10/80 ; G06V10/762 ; G06V10/774 ; G06V10/82 ; G06N3/0464 ; G06N3/08

Abstract:

本发明公开了一种基于Transformer特征聚类的缺省位置标签下图像目标定位方法。本发明通过基于Transformer深度学习的Vit模型获取融合特征图，并以融合类别信息特征向量为基准通过聚类的方式生成图像中的目标物体的粗略范围图，再进一步训练相应的直接判别模型来生成精确范围图，从而在不使用位置标签的情况下获得良好的物体目标定位准确度。本发明极大地减少了深度学习目标检测应用中的数据获取成本，减小了深度学习方法的应用难度。

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06V	图像或视频识别或理解
G06V10/00	图像或视频识别或理解的安排（图像或视频中的字符识别 G06V30/10）
G06V10/20	.图像预处理
G06V10/25	..确定感兴趣区域 [ROI] 或感兴趣体积