一种基于残差强化学习的机器人自主化装配方法

    公开(公告)号:CN115390439B

    公开(公告)日:2024-12-13

    申请号:CN202210999879.X

    申请日:2022-08-19

    Abstract: 本发明涉及一种基于残差强化学习的机器人自主化装配方法,步骤包括:根据机器人装配过程中的状态st定义笛卡尔空间控制指令;在机器人末端与装配表面接近阶段设置k1=0;当Fext>Fmax时,机器人与装配表面发生了第一次接触;判断待装配物体是否进入到装配孔位;进入插入阶段,设置k2=0,机器人执行插入操作,当检测到外力Fext>Fd/2时,装配成功。本发明针对装配过程中的接近、搜索、插入三个阶段,分别设计相应的装配策略,使用基于视觉和力觉感知融合的残差强化学习方法和基于解析方法的力控制策略,实现端到端的机器人自学习装配。

    一种航天器能力建模方法和系统

    公开(公告)号:CN113158343B

    公开(公告)日:2023-12-12

    申请号:CN202110432079.5

    申请日:2021-04-21

    Abstract: 本发明公开了一种航天器能力建模方法和系统,该方法包括:根据任务要求,对具有相同技术要求的指标进行归纳,得到多个类型的能力指标,并确定各能力指标的指标值;其中,多个类型的能力指标,包括:以航天器性能参数为特征的Np个性能指标,以航天器功能模式为特征的Nf个功能指标和以航天器智能化水平为特征的Ni个智能指标;对携带有指标值的各类型的能力指标进行面向场景的指标筛选,得到确定场景下的航天器能力指标集合;根据确定场景下的航天器能力指标集合,进行面向任务进行能力指标重组,生成任务能力指标,得到面向任务的航天器能力模型。本发明旨在解决传统的能力指标归纳方法存在的问题,实现航天器面向动态场景的能力分析与评估。

    一种航天器交会对接最后逼近段相对轨道与姿态跟踪控制方法

    公开(公告)号:CN113485396B

    公开(公告)日:2023-11-10

    申请号:CN202110748227.4

    申请日:2021-06-29

    Abstract: 一种航天器交会对接最后逼近段相对轨道与姿态跟踪控制方法,为了解决现有预设性能控制方案中控制器设计对系统跟踪误差初值有依赖性,而且现有的方法在考虑相对轨道与姿态跟踪误差预设性能约束的情况下,不能保证满足实际交会对接任务中推力器、控制力矩陀螺、动量轮等执行机构的物理结构限制的问题,通过建立跟踪航天器与目标航天器之间相对轨道与姿态跟踪动力学模型,构造一种新的性能函数,放宽了对初始跟踪误差已知的限制,利用预设性能的设计思想来实现兼顾相对轨道与姿态跟踪误差的精细稳态与暂态控制,并通过设计一个辅助饱和补偿系统来补偿执行机构的饱和非线性。

    一种高精度固定时间收敛的相对姿态容错跟踪控制方法

    公开(公告)号:CN113485394B

    公开(公告)日:2023-06-30

    申请号:CN202110726029.8

    申请日:2021-06-29

    Abstract: 一种高精度固定时间收敛的相对姿态容错跟踪控制方法,针对空间交会对接任务的特殊性,首先通过设计一种能固定时间收敛的相对姿态跟踪误差性能约束边界,结合预设性能控制方法来保证相对姿态跟踪误差的在固定时间内收敛到稳态指标约束范围内,此外通过自适应控制技术对系统不确定性、外界干扰、执行机构故障等复合不确定性进行估计并补偿,能够在固定时间内保证闭环控制系统的稳定性,实现对故障的容错控制的同时,亦能实现对外部干扰抑制控制以及对模型不确定性的鲁棒控制,既增强了控制系统对执行机构故障的鲁棒容错能力。

    一种深度强化学习的轻量抓取网络建模方法

    公开(公告)号:CN116305624A

    公开(公告)日:2023-06-23

    申请号:CN202310118848.3

    申请日:2023-02-03

    Abstract: 一种深度强化学习的轻量抓取网络建模方法,包括:建立机器人物体抓取仿真场景,在仿真场景中构建物体抓取工作空间,并模拟机器人物体抓取试验设备;建立轻量特征提取网络,网络输入为仿真场景中物体抓取空间的RGB‑D图像,网络输出为提取的图像特征向量;将所述图像特征向量输入策略网络,网络输出执行动作的概率分布的均值和方差;根据所述执行动作的概率分布的均值和方差得到执行动作的正态概率分布,在仿真场景中执行相应的动作,得到奖励,仿真环境进入下一环境状态;收集环境状态、执行的动作、奖励及下一状态作为经验,更新特征提取网络和策略网络,直到训练曲线收敛,得到训练好的轻量抓取网络模型。

    一种基于能力模型的航天器任务推演方法和系统

    公开(公告)号:CN113377119B

    公开(公告)日:2023-05-09

    申请号:CN202110432096.9

    申请日:2021-04-21

    Abstract: 本发明公开了一种基于能力模型的航天器任务推演方法和系统,该方法包括:进行态势评估,得到态势判定结果和基本能力指标集合;以n个1级期望态势为目标进行1级任务序列规划,并进行基于能力模型的多目标优化求解,得到1级基本能力指标集合;将各1级期望态势作为初始态势,各1级基本能力指标集合作为初始基本能力指标集合,重复任务序列规划和多目标优化求解的步骤,得到2级基本能力指标集合,依次类推,得到K级基本能力指标集合;选择最优态势发展支链,生成基于能力模型的任务推演结果。本发明解决了航天器实现对自身能力的快速评估、任务级指令的快速响应以及能力资源的快速分配问题,增强了对动态不确定场景的自主应变能力。

    基于偏随机密钥遗传算法的不规则岩石三维装箱优化方法

    公开(公告)号:CN115470695A

    公开(公告)日:2022-12-13

    申请号:CN202211001163.2

    申请日:2022-08-19

    Abstract: 一种基于偏随机密钥遗传算法的不规则岩石三维装箱优化方法,包括:对岩石样本进行视觉采样和三维重建;对网格模型进行处理;对偏随机密钥遗传算法进行初始化,生成初代种群;建立容器及OBB包围盒的碰撞模型,设置其位置和姿态;建立各OBB包围盒对应的岩石样本的碰撞模型,设置其位置和姿态;添加重力和摩擦力,计算容器空间占有率作为个体的适应度;根据适应度大小将种群个体分为精英个体和一般个体两类,按照偏随机密钥遗传算法对种群进行复制、交叉和变异操作,产生下一代种群;重复执行,当满足终止条件时,输出最大适应度个体解码装箱后各岩石样本的最终位置和姿态作为最终装箱方案。本发明能实现有限容器内对不规则岩石最大化装箱。

    一种基于残差强化学习的机器人自主化装配方法

    公开(公告)号:CN115390439A

    公开(公告)日:2022-11-25

    申请号:CN202210999879.X

    申请日:2022-08-19

    Abstract: 本发明涉及一种基于残差强化学习的机器人自主化装配方法,步骤包括:根据机器人装配过程中的状态st定义笛卡尔空间控制指令;在机器人末端与装配表面接近阶段设置k1=0;当Fext>Fmax时,机器人与装配表面发生了第一次接触;判断待装配物体是否进入到装配孔位;进入插入阶段,设置k2=0,机器人执行插入操作,当检测到外力Fext>Fd/2时,装配成功。本发明针对装配过程中的接近、搜索、插入三个阶段,分别设计相应的装配策略,使用基于视觉和力觉感知融合的残差强化学习方法和基于解析方法的力控制策略,实现端到端的机器人自学习装配。

    一种基于图像域的机械臂高效操控归置学习奖励训练方法

    公开(公告)号:CN115302511A

    公开(公告)日:2022-11-08

    申请号:CN202211001178.9

    申请日:2022-08-19

    Abstract: 本发明公开了一种基于图像域的机械臂高效操控归置学习奖励训练方法,实现杂乱场景中机械臂自主归置物体任务。该任务中,由于空间受限、复杂碰撞等约束的存在,导致终止状态是不可预测的,从而对奖励函数的设计带来了困难。本专利对强化学习的奖励是“步骤奖励”和“完成奖励”的组合,通过在图像域中合并来量化终端状态的性能,这将引导终端状态收敛到一个更好的域,而不是特定的值。以鼓励快速排列盒子中分散的对象,同时最小化对象之间的间隙,对不同数量、不规则形状的物体以及间断情况具有更好的适应性。

Patent Agency Ranking