机械臂控制方法及装置
    11.
    发明公开

    公开(公告)号:CN117532610A

    公开(公告)日:2024-02-09

    申请号:CN202311666755.0

    申请日:2023-12-06

    Abstract: 本发明提出一种机械臂控制方法及装置,该方法包含:构建机械臂控制的模拟环境,获取环境状态信息,所述环境状态信息包含机械臂的位姿与速度,以及待操作物体位置;以所述环境状态信息作为输入信息,输入至符号网络中,所述符号网络的输出为机械臂动作值,包含机械臂的关节速度;从所述符号网络中选择合适的路径生成符号策略;依据所述符号策略部署机械臂的控制任务。该方法能够提高符号策略学习的效率,从而使用更少的交互数据学习到机械臂控制,提高了机械臂控制的精度。

    基于自动梯度混合的神经网络模型知识蒸馏方法及系统

    公开(公告)号:CN115019085A

    公开(公告)日:2022-09-06

    申请号:CN202210544252.5

    申请日:2022-05-18

    Abstract: 本发明提出一种基于自动梯度混合的神经网络模型知识蒸馏方法和系统,包括通过损失函数,将教师网络的知识蒸馏至学生网络,得到任务损失和蒸馏损失;对该任务损失和该蒸馏损失进行反向传播,得到任务梯度向量和蒸馏梯度向量,以及任务梯度向量和蒸馏梯度向量间的夹角;以任务梯度向量约束总梯度向量,选择效果最优的候选偏转系数作为最终偏转系数以计算权重系数,将该权重系数加到损失函数,得到最终损失函数,并以该最终损失函数将该教师网络的知识蒸馏至该学生网络。由此本发明可自动调节权重系数超参。

    一种基于联合聚类域自适应的图片分类方法和系统

    公开(公告)号:CN113936167A

    公开(公告)日:2022-01-14

    申请号:CN202111088083.0

    申请日:2021-09-16

    Abstract: 本发明提出一种基于联合聚类域自适应的图片分类方法和系统,包括:通过特征提取网络可分别提取源域图片数据和目标域图片数据的特征,得到源域特征和目标域特征;基于源域特征和目标域特征到聚类中心的距离显式表达域内类别条件分布概率;最小化源域数据标签与域内类别条件分布概率的相对熵距离,更新特征提取网络与类别聚类中心;最小化目标域数据的标签分配与域内类别条件分布概率的相对熵距离,再次更新特征提取网络与聚类中心;将待分类图片输入经过再次更新的特征提取网络,得到待分类图片的图片特征,计算图片特征与经过再次更新的类别聚类中心中所有类别中心的概率,取概率最大的类别作为待分类图片的图片分类结果。

    融合局部信息的场景分割修正方法与系统

    公开(公告)号:CN107564013B

    公开(公告)日:2020-06-26

    申请号:CN201710650541.2

    申请日:2017-08-02

    Inventor: 唐胜 张蕊 李锦涛

    Abstract: 本发明涉及一种场景分割修正方法,通过局部边界修正网络,以完全残差卷积网络作为前端模型,将该前端模型的置信度图和原始图像按通道拼接起来,作为该局部边界修正网络的输入,从而输出该置信度图所有位置的局部聚合系数,将该局部聚合系数与该置信度图的对应位置相乘,聚合到中心点,得到场景分割的局部边界修正结果;使用已知的场景分割数据集对该局部边界修正网络进行训练。同时本发明还提出了将全局残差修正网络和该局部边界修正网络串联起来,形成级联的框架,该级联的框架可以对前端模型的分割结果进行全局修正和局部修正,从而得到更加精确的场景分割修正结果。

    基于在线域自适应深度学习的图片分类方法及系统

    公开(公告)号:CN113936168B

    公开(公告)日:2024-11-01

    申请号:CN202111088084.5

    申请日:2021-09-16

    Abstract: 本发明提出一种基于在线域自适应深度学习的图片分类方法和系统,包括通过特征提取网络提取源域图片数据和目标域图片数据的特征,得到源域特征和目标域特征;基于源域特征和目标域特征到聚类中心的距离显式表达域内类别条件分布概率;通过最小化源域数据标签与域内类别条件分布概率的相对熵距离,更新特征提取网络与类别聚类中心;通过求解运输问题,得到目标域样本的类别分配,通过最小化类别分配与域内类别条件分布概率的相对熵距离,再次更新特征提取网络与聚类中心,将待分类图片输入经过再次更新的特征提取网络,得到待分类图片的图片特征,计算图片特征与经过再次更新的类别聚类中心中所有类别中心的概率,取概率最大的类别作为分类结果。

    基于迁移学习的人物检测方法和系统

    公开(公告)号:CN113936295B

    公开(公告)日:2024-08-16

    申请号:CN202111103913.2

    申请日:2021-09-18

    Abstract: 本发明提出一种基于迁移学习的人物检测方法和系统,包括:构建用于图像目标检测的教师网络和其对应的学生网络,获取已标注人物类别标签的图片数据集作为训练数据集;以该训练数据集对该教师网络和该学生网络进行训练时,提取老师网络每层目标检测FPN的分类分支输出,得到包括NCHW四个通道输出结果的四维矩阵;通过在该四维矩阵的C通道方向求和,得到NHW维度的特征矩阵作为特征掩码矩阵,基于该特征掩码矩阵、老师网络和学生网络的FPN特征图,得到特征图约束损失;对教师网络的损失、学生网络的损失和该特征图约束损失进行求和,得到蒸馏损失,该蒸馏损失收敛后使用该学生网络对图片中的人物进行检测。

    基于涌现交流规则的多智能体通信方法及系统

    公开(公告)号:CN117746844A

    公开(公告)日:2024-03-22

    申请号:CN202311649867.5

    申请日:2023-12-04

    Abstract: 本发明提出一种基于涌现交流规则的多智能体通信方法,包括:说话者模型根据第一上下文面板推理得到第一规则,并结合第一上下文面板的规则标签构建损失函数,以训练更新说话者模型,得到中间说话模型;中间说话模型将第二上下文面板的第二规则发送至听者模型,听者模型根据第二规则从备选答案面板选择正确答案以回答问题面板;根据第二规则和第二上下文面板的规则标签、正确答案和答案标签构建损失函数联合训练中间说话模型和听者模型,得到最终说话模型和最终听者模型;通过最终说话模型提取目标上下文面板的目标规则,最终听者模型根据目标规则从其候选答案中选择答案以完成指定任务。本发明提高了智能体的认知推理能力和表达抽象概念的能力。

    一种基于对象的强化学习方法及系统

    公开(公告)号:CN117689912A

    公开(公告)日:2024-03-12

    申请号:CN202211013747.1

    申请日:2022-08-23

    Abstract: 本发明提出一种基于对象的强化学习方法和系统,包括:智能体采集在当前所处环境的观测图像,从该观测图像中识别出对象的位置,并对其进行无监督聚类,得到各对象的类别标签;以该对象的类别标签为监督,通过卷积神经网络对该观测数据进行对象抽取,得到该观测图像的对象表示;基于该观测图像的对象表示,构建该观测图像中对象间的关系,作为该观测图像的特征向量,基于该特征向量执行学习策略,得到目标动作,该智能体执行该目标动作与该环境产生交互。该发明可以提升强化学习中策略的推理能力,使其具备较高的泛化能力。

    基于细粒度结构化稀疏的在线训练方法及系统

    公开(公告)号:CN114429206A

    公开(公告)日:2022-05-03

    申请号:CN202111666701.5

    申请日:2021-12-31

    Abstract: 本发明提出一种基于细粒度结构化稀疏的在线训练方法和系统,包括:基于预设学习率和权重梯度,训练稠密模型;对该稠密模型的权重进行细粒度结构化稀疏,得到稀疏掩码,并基于该稀疏掩码训练稀疏模型,且在训练该稀疏模型的过程中更新该稀疏掩码和该稀疏模型的模型权重;固定该稀疏模型的网络结构再次训练该稀疏模型,且在再次训练该稀疏模型过程中仅更新该稀疏模型的模型权重,保存完成经过再次训练的稀疏模型的模型权重和稀疏掩码作为在线训练结果。稀疏模型比稠密模型的规模小,比稠密模型的通道数也小。在部署模型时采用稀疏模型,由于稀疏模型规模小,可以有效减少计算量,达到加速模型运行速度的技术效果。

    融合全局信息的场景分割修正方法与系统

    公开(公告)号:CN107564007B

    公开(公告)日:2020-09-11

    申请号:CN201710650525.3

    申请日:2017-08-02

    Inventor: 唐胜 张蕊 李锦涛

    Abstract: 本发明涉及一种场景分割修正方法,通过全局残差修正网络,以完全残差卷积网络作为前端模型,将该前端模型的置信度图和原始图像按通道拼接起来,作为该全局残差修正网络的输入,从而输出全局修正残差,将该全局修正残差与该置信度图相加,得到场景分割的修正结果;使用已知的场景分割数据集对该全局残差修正网络进行训练;使用已知的场景分割数据集对该全局残差修正网络进行训练。同时本发明还提出了将该全局残差修正网络和局部边界修正网络串联起来,形成级联的框架,该级联的框架可以对前端模型的分割结果进行全局修正和局部修正,从而得到更加精确的场景分割结果。

Patent Agency Ranking