-
公开(公告)号:CN112560918B
公开(公告)日:2024-02-06
申请号:CN202011430608.X
申请日:2020-12-07
Applicant: 杭州电子科技大学
IPC: G06V20/68 , G06V10/764 , G06V10/40 , G06V10/82 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种基于改进YOLO v3的菜品识别方法,该方法使用基于深度学习的目标检测算法,识别出菜品的种类并回归出目标的边界框,为机器人打菜操作提供类别信息与相对位置信息。该方法基于One‑Stage算法YOLO V3,并基于ResNet和SENet对其特征提取网络进行优化设计,使用一种Seblock53的特征提取网络替换Darknet53,并引入可变形卷积DCN构成新的Backbone。基于高校的菜品窗口场景的识别结果表明,该方法能够快速准确地对菜品进行定位与分类,可以实现餐厅服务机器人菜品识别功能。
-
公开(公告)号:CN111126404B
公开(公告)日:2023-08-22
申请号:CN201911277782.2
申请日:2019-12-11
Applicant: 杭州电子科技大学
IPC: G06V20/62 , G06V30/148 , G06V30/19 , G06V10/80 , G06V10/82 , G06T3/40 , G06T5/00 , G06N3/045 , G06N3/0495 , G06N3/082
Abstract: 本发明公开了一种基于改进YOLO v3的古文字及字体识别方法。该方法基于深度学习的目标检测方法,利用深层的神经网络结构,学习到古文字图像中“整体‑部分”的分解关系,通过特征提取网络获得有用的特征信息,并进行检测定位,再将图片的特征信息送入分类器进行分类识别,并使用包围框在图像中框选出古文字的位置。该方法解决了古文字具有复杂的内部结构,以及使用这些特征进行识别时精度低的问题。本方法提出的改进YOLO v3使用ShuffleNet v2作为模型的主干结构,使其更加高效。在对古文字及字体的识别上准确率达到98.81%,并且具有较好的稳定性和良好的鲁棒性,能够应用于古文字文本、碑帖等古文字识别场景。
-
公开(公告)号:CN112560918A
公开(公告)日:2021-03-26
申请号:CN202011430608.X
申请日:2020-12-07
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于改进YOLO v3的菜品识别方法,该方法使用基于深度学习的目标检测算法,识别出菜品的种类并回归出目标的边界框,为机器人打菜操作提供类别信息与相对位置信息。该方法基于One‑Stage算法YOLO V3,并基于ResNet和SENet对其特征提取网络进行优化设计,使用一种Seblock53的特征提取网络替换Darknet53,并引入可变形卷积DCN构成新的Backbone。基于高校的菜品窗口场景的识别结果表明,该方法能够快速准确地对菜品进行定位与分类,可以实现餐厅服务机器人菜品识别功能。
-
公开(公告)号:CN111126404A
公开(公告)日:2020-05-08
申请号:CN201911277782.2
申请日:2019-12-11
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于改进YOLO v3的古文字及字体识别方法。该方法基于深度学习的目标检测方法,利用深层的神经网络结构,学习到古文字图像中“整体-部分”的分解关系,通过特征提取网络获得有用的特征信息,并进行检测定位,再将图片的特征信息送入分类器进行分类识别,并使用包围框在图像中框选出古文字的位置。该方法解决了古文字具有复杂的内部结构,以及使用这些特征进行识别时精度低的问题。本方法提出的改进YOLO v3使用ShuffleNet v2作为模型的主干结构,使其更加高效。在对古文字及字体的识别上准确率达到98.81%,并且具有较好的稳定性和良好的鲁棒性,能够应用于古文字文本、碑帖等古文字识别场景。
-
-
-