Invention Publication
- Patent Title: 一种基于Transformer特征聚类的缺省位置标签下图像目标定位方法
-
Application No.: CN202310255057.5Application Date: 2023-03-16
-
Publication No.: CN116543142APublication Date: 2023-08-04
- Inventor: 谢磊 , 李明 , 苏宏业
- Applicant: 浙江大学
- Applicant Address: 浙江省杭州市西湖区余杭塘路866号
- Assignee: 浙江大学
- Current Assignee: 浙江大学
- Current Assignee Address: 浙江省杭州市西湖区余杭塘路866号
- Agency: 杭州求是专利事务所有限公司
- Agent 傅朝栋; 张法高
- Main IPC: G06V10/25
- IPC: G06V10/25 ; G06V10/80 ; G06V10/762 ; G06V10/774 ; G06V10/82 ; G06N3/0464 ; G06N3/08

Abstract:
本发明公开了一种基于Transformer特征聚类的缺省位置标签下图像目标定位方法。本发明通过基于Transformer深度学习的Vit模型获取融合特征图,并以融合类别信息特征向量为基准通过聚类的方式生成图像中的目标物体的粗略范围图,再进一步训练相应的直接判别模型来生成精确范围图,从而在不使用位置标签的情况下获得良好的物体目标定位准确度。本发明极大地减少了深度学习目标检测应用中的数据获取成本,减小了深度学习方法的应用难度。
Information query