-
公开(公告)号:CN119515752A
公开(公告)日:2025-02-25
申请号:CN202411591856.0
申请日:2024-11-08
Applicant: 安徽工程大学
IPC: G06T5/94 , G06T5/60 , G06T5/50 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/088
Abstract: 本发明公开了一种工业产品图像的数据增强方法、装置、介质和设备,涉及数据增强技术领域。本发明先基于产品图像裁剪拼接得到初始增强后的图像并将其作为样本图像,然后构建改进的循环生成对抗网络,并以改进的循环生成对抗网络基于样本图像进行数据增强的生成对抗学习,使得改进的循环生成对抗网络能够消除初始增强图像中不和谐的地方,使其生成图像趋近视觉采集得到的产品图像。其中,改进加入的实例归一化模块能够更关注每个样本自身的特征分布,提高了对每个初始增强图像的特征提取的准确性;同时通过加入卷积块注意力模块提高通道和空间上特征的抓取能力,以在生成最终增强图像时很好地消除初始增强图像中不和谐的地方,提高数据增强的效果。
-
公开(公告)号:CN119152492A
公开(公告)日:2024-12-17
申请号:CN202411360846.6
申请日:2024-09-27
Applicant: 安徽工程大学
IPC: G06V20/64 , G06V10/22 , G06V10/26 , G06V10/42 , G06V10/44 , G06V10/56 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及物体位姿估计技术领域,具体为基于多通道注意力机制的物体6D位姿估计方法及系统,包括:S1,语义分割及特征提取,对输入的RGB‑D图像,通过语义分割从输入的RGB图像和深度图像中裁剪出目标物体的彩色图和深度图,并利用相机内参将深度图转换为点云图。本发明中,通过引入位置和通道两个注意力模块,设计了一种多通道注意力机制DA2Net,在关联特征和全局信息重分布方面具有优势,同时增强其捕获局部和全局上下文信息的能力。在DenseFusion的基础上,在特征融合网络和迭代细化网络中添加该注意力机制,增强对局部细节的理解,并从全局信息中推断出被遮挡的部分。
-
公开(公告)号:CN118037831A
公开(公告)日:2024-05-14
申请号:CN202311821659.9
申请日:2023-12-27
Applicant: 安徽工程大学
IPC: G06T7/73 , G06T7/80 , G06N3/0464 , G06N3/0455 , G06N3/0475 , G06N3/094
Abstract: 本发明涉及反光金属对象的机器人2D视觉6DOF位姿测量与定位抓取方法,利用6DOF系统中单目摄像头采集的反光金属对象图形通过虚拟引擎建立虚拟图形数据集;使用Unet作为生成对抗网络的生成器,并利用Transformer模块与cycleGAN网络结合以提高图像的特征的质量;使用KLD损失函数与YOLOv7网络结合对YOLOv7网络输出的坐标和角度进行优化,减小角度误差;通过固定放置的标定板进行拍照计算出标定板相对机器人底坐的位姿,通过转置矩阵计算出标定平面在单目摄像头坐标系下的位姿,并配合单目摄像头内参实现2D位姿向3D位姿的转化。本发明对YOLOv7目标检测网络进行改进,实现了YOLOv7目标检测网络对旋转对像的定位,实现了机器人抓取2D抓取位姿的高精度计算。
-
-