一种基于多层次学习模型的菜品识别与计价系统及方法

    公开(公告)号:CN111461694A

    公开(公告)日:2020-07-28

    申请号:CN202010189968.9

    申请日:2020-03-17

    Applicant: 上海大学

    Abstract: 本发明公开了一种基于多层次学习模型的菜品识别与计价系统及方法。本系统在运行逻辑上由自下而上的多层次结构组成,包括终端交互层、餐厅识别层和云端优化层,层次之间存在信息流闭环迭代更新机制,协同完成上层模型优化融合以及下层模型迭代更新与识别。系统以餐厅识别层为功能核心,其与下层组成菜品图像信息交互以及菜品识别模型迭代训练更新的闭环通路;与上层组成全局菜品识别模型优化、融合的闭环通路。系统层次结构设计解耦了菜品识别复杂系统功能,以不同层次模型分布迭代更新与优化的方式提高菜品识别模型丰富度和准确率。随着时间的推移,系统识别的各项指标会逐步提高,系统使用的时间越长,识别的准确度越高。

    一种机器人的五指灵巧手执行装置

    公开(公告)号:CN106335074A

    公开(公告)日:2017-01-18

    申请号:CN201610888236.2

    申请日:2016-10-12

    Applicant: 上海大学

    CPC classification number: B25J15/0009 B25J15/10

    Abstract: 本发明公开了一种机器人的五指灵巧手执行装置,包括手掌单元和五根手指,手指包括四个指节,使用弹簧片、手指盖板和螺钉螺母连接,手掌包括底板、盖板,用于固定电机和手指。本发明使用力传感器与角度传感器组成的闭环反馈系统,能够实现简单的抓、捏动作。本发明的特点是基于欠驱动原理使用一个电机通过腱传动的方式控制单根手指,使得手指在抓取不同物体时能够自适应地包络物体,其有结构简单、抓取控制难度低、可靠性高的优点。

    基于FPGA的Roberts边沿检测器

    公开(公告)号:CN102841773A

    公开(公告)日:2012-12-26

    申请号:CN201210219234.6

    申请日:2012-06-29

    Applicant: 上海大学

    Abstract: 本发明涉及一种基于FPGA的Roberts边沿检测器。它包括:一个16寄存器、一个同步FIFO、一个核心控制器模块、一个梯度计算模块和一个图像分割模块。在发送端,输入数据经过一个16为寄存器和深度640的同步FIFO缓存后实现两个像素同时输入到梯度计算模块,然后当梯度计算模块中的正方形窗为满时计算该点像素梯度值,并输入到图像分割模块实现边沿提取,最终从输出端口输出像素数据,整个过程的时序由核心控制模块控制。

    一种无线网络智能视频监控系统的实现方法

    公开(公告)号:CN102413320A

    公开(公告)日:2012-04-11

    申请号:CN201110430027.0

    申请日:2011-12-21

    Applicant: 上海大学

    Abstract: 本发明提供了一种无线网络智能视频监控系统的实现方法,包括以下步骤:(1)视频实时采集;(2)视频图像编码及实时发送;(3)数据转发;(4)视频接收、解压缩及显示;(5)运动物体检测;(6)摄像头角度任意调整。本发明能够实现一个视频监控系统对一定范围场景的实时监控,而且摄像头的角度可根据工作人员的需要任意调整,增大了视频监控的范围;加入了对运动物体的检测和框定,并增加了对特定图像的保存和录像功能,增强了监控系统的智能性,减少了工作人员的工作量;本发明的视频采集系统与数据转发模块采用wifi相连接,数据转发模块与监控系统采用公共网络连接,简化了系统的搭建步骤,减少了系统搭建成本,增强了系统的可扩展性。

    基于优化算法的科技服务资源数据处理方法、系统及其计算机可读存储介质

    公开(公告)号:CN115794985A

    公开(公告)日:2023-03-14

    申请号:CN202211526404.5

    申请日:2022-12-01

    Applicant: 上海大学

    Abstract: 本发明提供了一种基于智能优化算法的文本数据处理方法,该数据处理方法能够将科技资源的文本数据进行数据提取、数据预处理、特征选择和特征分析,最终得到准确率最高、特征量少的特征向量和词库数据,有效提高了运行分类器的效率和性能。还涉及一种相应的系统,包括:数据提取模块,从科技服务资源数据库中提取各类服务数据并根据行业添加分类标签;数据预处理模块,清洗原始数据,处理得到特征向量和特征词库并根据交叉验证划分训练和测试数据集;特征选择模块,使用二进制榕树生长优化算法进行特征选择,以获得分类准确率及特征量最优的解集;特征分析模块,从初始文本特征向量的特征词中得到最优特征词,并显示在特征热力图和词云中。最终处理后的数据实现将科技服务资源文本数据转换为有利于分类器处理的最优特征向量。

    一种仓储货物多QR码一体化视觉定位方法

    公开(公告)号:CN109977714B

    公开(公告)日:2022-06-10

    申请号:CN201910006108.4

    申请日:2019-01-04

    Applicant: 上海大学

    Abstract: 本发明公开了一种仓储货物多QR码一体化视觉定位方法,涉及图像检测领域,更具体地,涉及一种多QR码一体化视觉定位的方法。本发明解决由于QR码所处环境复杂以及多角度拍摄等因素导致现有检测方法无法精准定位QR码的技术问题。本发明首先对图像进行滤波,转灰度图,二值化等预处理操作,然后根据二值图像中的闭合轮廓信息粗略定位出位置探测图形的位置,根据同一个QR码中3个位置探测图形在图像中所呈现的面积相似的特点对位置探测图形进行精定位,进而最终定位出QR码。该方法能在复杂的环境中从多个拍摄角度精准地定位出场景中的多个二维码,具有较强的鲁棒性,在实际使用中具有很好的表现。

    基于递归卷积神经网络实现视线估计与注意力分析的系统及其方法

    公开(公告)号:CN114387679A

    公开(公告)日:2022-04-22

    申请号:CN202210040206.1

    申请日:2022-01-14

    Applicant: 上海大学

    Abstract: 本发明公开了一种基于递归卷积神经网络实现视线估计与注意力分析的系统,包括视线特征提取模块、视线回归模块、视线落点映射模块和注意力可视化与分析模块。还涉及一种相应的方法,在实现中,同时提取双眼表观特征和头部姿态特征,进行空间域特征融合;对于连续多帧视线特征,通过Bi‑LSTM网络层将注视行为的时序特征联合编码,完成时域特征融合,进而回归出中间帧的视线向量;还提出了一种基于单目相机的视线落点解算方法,可实时获取视线落点坐标,且不受场景限制;以底层模块提供数据支撑,在注意力可视化与分析模块,提供了丰富的实时视线追踪可视化以及相关视线参数可视化的形式。本技术方案能满足使用场景的准确性和稳定性要求,应用场景广泛。

    基于卷积神经网络的多物体抓取区域定位方法

    公开(公告)号:CN110796700A

    公开(公告)日:2020-02-14

    申请号:CN201910998195.6

    申请日:2019-10-21

    Applicant: 上海大学

    Abstract: 本发明公开了一种基于卷积神经网络的多物体抓取区域定位方法,包括图像平面抓取检测部分和抓取位姿定位部分,属于图像检测和定位领域。所述图像平面抓取检测部分对Cornell Grasping Dataset进行数据增强,并按照所述旋转直径圆的抓取表示方式构建图像的抓取标签,得到训练集和验证集;构建卷积神经网络模型并通过所述训练集训练,利用训练好的卷积神经网络模型为图像中每个物体预测可行的抓取圆。所述抓取位姿定位部分通过配准的点云得到抓取点的空间位置,然后计算抓取点的法线向量,结合物体抓取圆的参数,确定物体的抓取位姿。本发明可以在多物体场景下快速而准确的得到每个物体的抓取位姿,从而实现对未知物体的高准确度抓取。

    一种表单任意区域字符识别与信息录入方法

    公开(公告)号:CN109886108A

    公开(公告)日:2019-06-14

    申请号:CN201910041872.5

    申请日:2019-01-17

    Applicant: 上海大学

    Abstract: 本发明属于图像检测与识别领域,涉及一种表单中任意区域字符识别与信息录入方法。本发明采用图像采集相机镜头对准表单,照明光源对表单照明,表单置于传动带或置物台上,采集相机连接电脑,从而进行采集模板表单图像,离线构建表单区域于兴趣区域的模板特征参数库,表单图像在线采集与待识别图像筛选,表单区域提取与位姿标准化,表单兴趣区域提取与字符录入操作。本发明较传统信息识别录入方法,在功能方面更具灵活性,在效益方面更具经济性,在实际场景应用中有着良好的表现。

    基于递归卷积神经网络实现视线估计与注意力分析的系统及其方法

    公开(公告)号:CN114387679B

    公开(公告)日:2024-09-24

    申请号:CN202210040206.1

    申请日:2022-01-14

    Applicant: 上海大学

    Abstract: 本发明公开了一种基于递归卷积神经网络实现视线估计与注意力分析的系统,包括视线特征提取模块、视线回归模块、视线落点映射模块和注意力可视化与分析模块。还涉及一种相应的方法,在实现中,同时提取双眼表观特征和头部姿态特征,进行空间域特征融合;对于连续多帧视线特征,通过Bi‑LSTM网络层将注视行为的时序特征联合编码,完成时域特征融合,进而回归出中间帧的视线向量;还提出了一种基于单目相机的视线落点解算方法,可实时获取视线落点坐标,且不受场景限制;以底层模块提供数据支撑,在注意力可视化与分析模块,提供了丰富的实时视线追踪可视化以及相关视线参数可视化的形式。本技术方案能满足使用场景的准确性和稳定性要求,应用场景广泛。

Patent Agency Ranking