基于人工智能模型的售货柜商品识别算法

    公开(公告)号:CN119904792A

    公开(公告)日:2025-04-29

    申请号:CN202510372893.0

    申请日:2025-03-27

    Inventor: 张维 洪旺生 张威

    Abstract: 本发明涉及售货柜商品识别技术领域,具体涉及基于人工智能模型的售货柜商品识别算法。基于单摄像头视频数据,通过连续帧间特征跟踪后构造消费者交互图,再利用图神经网进行局部特征聚合,随后通过捕捉全局时空依赖,预测出每个商品的潜在购买意向指数,利用交互图结构化描述消费者行为,保留每次交互的详细特征,通过图卷积和Transformer实现多层次信息融合,在仅依靠单一视觉数据的前提下实现高精度的行为建模和购买意向预测,以便对商品布局进行迭代优化,使高购买意向商品优先分配至更合理的陈列位置,实现售货柜商品的陈列配置,亦提高用户购买体验。

    一种基于立体扫描进行扫码矩阵识别的医疗智能仓储系统

    公开(公告)号:CN119904791A

    公开(公告)日:2025-04-29

    申请号:CN202411932923.0

    申请日:2024-12-26

    Inventor: 刘锦初

    Abstract: 本申请涉及一种基于立体扫描进行扫码矩阵识别的医疗智能仓储系统,基于本发明的实施,利用立体扫描系统对出入库的医疗器械或者是药品包装进行立体扫描,可以同时获取多个角度的包装图片并上传后台服务器,后台遍历各个包装图像,利用图像识别技术从某个包装图像上识别到当前医疗器械或者药品包装的条码信息,进行出入库记录;同时能够利用后台上预先部署的破损识别检测模型,遍历并识别各个包装图像上是否存在外观破损特征,若存在,则由后台生成相应的记录并发送至仓储终端,在仓储终端上进行盘点管理。只需要一次图片采集,即可进行条码信息识别提取以及外观破损状态检测,提高出入库检测效率,降低人工检查工作量,降低操作难度。

    一种基于双环策略的杂乱堆叠场景长序列物体抓放决策的方法

    公开(公告)号:CN119407795B

    公开(公告)日:2025-04-29

    申请号:CN202510014281.4

    申请日:2025-01-06

    Applicant: 浙江大学

    Inventor: 王越 许可淳 熊蓉

    Abstract: 本发明公开了一种基于双环策略的杂乱堆叠场景长序列物体抓放决策的方法,包含两个闭环策略,内环策略负责通过主动感知提高物体匹配的准确性,当机械臂抓取到物体后,该策略会通过旋转物体从多个视角进行感知,增加物体与目标场景内物体匹配的置信度。外环策略则负责执行抓取和放置操作,结合不确定的物体匹配和抓取能力进行抓取动作的预测,并根据当前物体的匹配情况决定是否直接放置到目标位置,或者将物体暂时放置在缓冲区,该方法利用预训练视觉基础模型进行物体匹配、内环策略学习和内环终止机制的实现,该方法对感知噪声的影响更加鲁棒,且通过强化学习闭环优化考虑了任务层级的最优性,从而达到更好的任务成功率和效率。

    一种搬运货物异常检测方法、电子设备及存储介质

    公开(公告)号:CN119863746A

    公开(公告)日:2025-04-22

    申请号:CN202411724983.3

    申请日:2024-11-27

    Abstract: 本发明公开了一种搬运货物异常检测方法、电子设备及存储介质,方法包括:获取货物在初始位置的基准点云,以及获取货物搬运过程中的场景点云;将基准点云和场景点云转换至自车坐标系,并获取基准点云的第一目标范围点云,以及场景点云的第二目标范围点云;将其中一者进行栅格化处理,确定出栅格图像;利用栅格图像和另一者进行比对,确定货物搬运过程中的检测情况;即本申请通过获取不同位置的基准点云和场景点云,转换至同一坐标系中并确定出各自的第一目标范围点云和第二目标范围点云,并对其一进行栅格化处理,另一者则与栅格图像进行比对,进而确定出货物的检测情况,能有效提升货物搬运过程中的检测准确度,并提升相应的检测效率。

    一种基于人工智能的图像场景识别方法、装置及电子设备

    公开(公告)号:CN119851190A

    公开(公告)日:2025-04-18

    申请号:CN202411619667.X

    申请日:2024-11-13

    Abstract: 本发明提供了一种基于人工智能的图像场景识别方法、装置及电子设备,应用于数据处理技术领域。本申请获取训练样本集、待识别图像信息、图像用途信息和拍摄影响因子;对训练样本集进行预处理,生成带有标识信息的训练样本集;获取与标识信息相匹配的预设图像场景识别模型;基于带有标识信息的训练样本集对预设图像场景识别模型进行训练,生成目标图像场景识别模型;对待识别图像信息进行处理,生成待识别图像所属的类别信息;对与待识别图像信息相匹配的图像用途信息和拍摄影响因子进行处理,生成图像场景识别影响因子;基于目标图像场景识别模型对待识别图像所属的类别信息和所属图像场景识别影响因子进行处理,生成图像场景识别结果。

    一种基于物联网的智慧工地节能控制方法及系统

    公开(公告)号:CN119849880A

    公开(公告)日:2025-04-18

    申请号:CN202510324526.3

    申请日:2025-03-19

    Abstract: 本发明公开一种基于物联网的智慧工地节能控制方法及系统,该方法通过获取工地的实时图像、储能设备运行状态及人员定位数据,构建动态网络模型进行图像特征提取,并经由场景识别模型获得场景识别结果;随后提取能源需求特征,通过功率预测模型获取预测需求功率。系统根据需求匹配度与预设阈值比较结果,自适应调整非关键设备的运行时序;同时采用卡尔曼滤波算法对人员定位数据进行去噪处理,结合图像特征计算人员与设备的作业距离。当作业距离超出预设阈值时,系统自动触发待机节能模式,并通过能耗监测实现节能模式的精准控制。本方法解决因场景识别精度不足、储能设备切换时机不合理以及待机节能模式误判导致的能源浪费和运行效率低下问题。

    基于图生文模型的宠物脑机文字翻译方法、装置

    公开(公告)号:CN119828882A

    公开(公告)日:2025-04-15

    申请号:CN202411555043.6

    申请日:2024-11-04

    Abstract: 一种基于图生文模型的宠物脑机文字翻译方法、装置,其包括以下步骤:S1、实时采集宠物的生物学信号,所述生物学信号包括脑电信号、心率信号及基于宠物视觉的图像信息;S2、对采集到的宠物的生物学信号进行预处理;S3、基于图生文模型TransBLIP对采集到的图像信息进行文字转换,S3‑1、通过编码器Transformer,从序列到序列预测的角度建立自注意力机制,提取图像信息中的图像特征;S3‑2、通过语言模型BERT从输入文本中提取文本特征;S3‑3、利用跨模态交互层实现图像特征和文本特征之间的交互;S3‑4、根据S3‑1中提取的图像特征生成相应的文本;S4、采用了双流网络架构对收集到的宠物脑电信号与S3中生成的文字进行映射。即以视觉信息为媒介将宠物的脑电信息以文本形式翻译出来,可为脑机接口中的宠物行为解读提供技术支持,通过翻译宠物脑电信号为人类可理解的语言文字,有助于宠物主人准确判断宠物的情绪、意图和需求,改善人与宠物的沟通体验。

    基于高频微波探地感应雷达的探测方法及装置

    公开(公告)号:CN119828133A

    公开(公告)日:2025-04-15

    申请号:CN202410586465.3

    申请日:2024-05-13

    Inventor: 黄源远

    Abstract: 本发明公开了基于高频微波探地感应雷达的探测方法及装置,涉及雷达探测技术领域,通过向目标区域发射第一信号,并接收第一信号所反射的反射信号,得到最初反射信号,根据最初反射信号得到第一目标图像,再识别第一目标图像中各个层结构,确定该层结构的深度和介电常数,根据深度和介电常数得到该层结构的发射频率,再对目标区域发射各层结构对应的发射频率,并接收对应的反射信号,根据各反射信号得到最终图像,得到的不同密度的结构对应的发射频率考虑到实际高频微波探地感应雷达发射天线频率对测量不同密度的结构的影响,能根据实际的地下不同密度的结构动态的调节高频微波探地感应雷达的发射频率,使得最终不同密度的结构测量的误差较小。

Patent Agency Ranking