一种基于CW-RNN网络的UUV实时避碰规划方法

    公开(公告)号:CN108459614B

    公开(公告)日:2020-12-04

    申请号:CN201810044019.4

    申请日:2018-01-17

    Abstract: 本发明提供了一种基于CW‑RNN网络的UUV实时避碰规划方法,属于水下航行器导航领域。本发明提供的方法如下:步骤1:构建全局坐标系和局部坐标系,建立声纳仿真模型;步骤2:设计用于实时避碰规划的CW‑RNN网络;步骤3:构建数据集用于神经网络的训练阶段和测试阶段;步骤4:利用训练集中数据训练CW‑RNN网络,得到实时避碰规划器;步骤5:将声纳探测信息及目标点信息输入至基于CW‑RNN网络的避碰规划器,获得UUV下一时刻的转艏及速度的调整指令。本发明提供的方法得到的规划器不仅有强大的学习能力,同时还具有非常强的泛化能力,适用于各种复杂的环境;同时可满足实时性的要求,并且所规划的路径满足UUV运动特性的要求。

    一种基于改进RNN的UUV实时避障规划方法

    公开(公告)号:CN109765929A

    公开(公告)日:2019-05-17

    申请号:CN201910033349.8

    申请日:2019-01-14

    Abstract: 本发明属于无人水下航行领域,具体涉及一种基于改进RNN的UUV实时避障规划方法。本发明提供了一种基于改进RNN的UUV实时避碰规划方法,该方法采用卷积连接方式代替原RNN网络中的全连接,减少了网络参数,降低了算法学习时间,提高了算法信息处理能力。本发明设计的用于UUV实时避碰规划的改进RNN算法,在复杂的不确定环境中有较强的适应性;有较强的学习能力、泛化能力及抗噪声干扰能力。

    一种基于深度Q网络的UUV实时避碰规划方法

    公开(公告)号:CN110716574B

    公开(公告)日:2023-05-02

    申请号:CN201910934428.6

    申请日:2019-09-29

    Abstract: 本发明属于UUV控制技术领域,具体涉及一种基于深度Q网络的UUV实时避碰规划方法。本发明使网络体系在复杂环境的局部避碰规划时具有自我学习的能力实现端到端模型,不对输入的声呐数据进行人工提取特征和特征匹配,直接从原始数据集上学习状态与动作的映射关系,将深度学习和强化学习相结合应用到避碰规划问题的解决上。本发明使用深度强化学习,无需像深度学习那样进行大规模的采样和做标签,也不像传统的方法需建立环境和UUV本身的数学模型,无需环境的模型,采用强化学习不会因为路径过于复杂而无法执行策略,使其在实际应用中缩短了项目的开发周期、实施更加简洁、高效、鲁棒性高。

    一种基于改进RNN的UUV实时避障规划方法

    公开(公告)号:CN109765929B

    公开(公告)日:2022-04-05

    申请号:CN201910033349.8

    申请日:2019-01-14

    Abstract: 本发明属于无人水下航行领域,具体涉及一种基于改进RNN的UUV实时避障规划方法。本发明提供了一种基于改进RNN的UUV实时避碰规划方法,该方法采用卷积连接方式代替原RNN网络中的全连接,减少了网络参数,降低了算法学习时间,提高了算法信息处理能力。本发明设计的用于UUV实时避碰规划的改进RNN算法,在复杂的不确定环境中有较强的适应性;有较强的学习能力、泛化能力及抗噪声干扰能力。

    一种基于避碰准则的多USV群体协同避碰规划方法

    公开(公告)号:CN109597417B

    公开(公告)日:2022-04-05

    申请号:CN201910033309.3

    申请日:2019-01-14

    Abstract: 本发明属于USV控制技术领域,具体涉及一种基于避碰准则的多USV群体协同避碰规划方法。该方法包括:步骤1、制定合理的USV避碰规则;步骤2、多USV系统建模,计算运动参数和碰撞危险度;步骤3、构建USV避碰规划仿真软件平台,添加雷达探测模块和遗传算法,设计典型的仿真案例验证算法的有效性。本发明使多个USV从起点出发躲避环境中所有静态障碍物到达终点,在整个航行过程中USV之间不发生碰撞且在相遇时遵守避碰准则采取避碰策略,同时避免出现大角度转向、紧急加减速的情况。本发明致力找到严格遵守避碰准则的多USV避碰规划方法,并且解决航行过程的大角度转向、大范围加减速的不良航行问题。实现路径最短、符合经济性、平滑性、安全性的最优避碰。

    静态环境下基于深度强化学习的移动机器人避碰规划方法

    公开(公告)号:CN110750096A

    公开(公告)日:2020-02-04

    申请号:CN201910953377.1

    申请日:2019-10-09

    Abstract: 本发明属于移动机器人导航技术领域,具体涉及一种静态环境下基于深度强化学习的移动机器人避碰规划方法。本发明使用激光测距仪采集原始数据,将处理后的数据作为A3C算法的状态S,通过构建A3C-LSTM神经网络,将状态S作为网络输入,通过A3C算法,神经网络输出相应参数,利用参数通过正态分布选择移动机器人每一步执行的动作。本发明无需对环境进行建模,通过深度强化学习算法最终实现移动机器人成功在复杂静态障碍物环境下避障。本发明设计具有转艏约束的连续动作空间模型,且采用多线程异步学习,与一般深度强化学习方法相比,大大提高学习训练时间,减少样本相关性,保障探索空间的高利用性与探索策略的多样性,提升算法收敛性、稳定性以及避障成功率。

    基于深度双Q网络强化学习的UUV实时避碰规划方法

    公开(公告)号:CN110716575A

    公开(公告)日:2020-01-21

    申请号:CN201910934538.2

    申请日:2019-09-29

    Abstract: 本发明属于UUV控制技术领域,具体涉及一种基于深度双Q网络强化学习的UUV实时避碰规划方法。本发明提供了一种适用于UUV工作环境和感知特点的自主避碰规划方法,通过UUV与环境之间不断地试错交互,利用成功或失败的经验,产生奖励或惩罚的信号不断地改进UUV的策略,让UUV具有自我学习的能力。本发明使网络体系在复杂环境的局部避碰规划时具有自我学习的能力实现端到端模型,通过直接从原始数据集上学习状态与动作的映射关系,将深度学习和强化学习相结合应用到避碰规划问题的解决上。本发明使用深度强化学习,不会因为路径过于复杂而无法执行策略,使其在实际应用中缩短了项目的开发周期、实施更加简洁、高效、鲁棒性高。

    一种基于改进的具有适应性的量子粒子群算法的优化计算方法

    公开(公告)号:CN108615069A

    公开(公告)日:2018-10-02

    申请号:CN201810248937.9

    申请日:2018-03-25

    Abstract: 本发明的目的在于提供一种基于改进的具有适应性的量子粒子群算法的优化计算方法,本发明采取的技术方案是根据需要建立合适的评价指标,区分各粒子的优化程度,依据各粒子优化状态自行分配不同的惯性权值。本发明解决了传统QPSO算法中唯一的控制参数,惯性权重线性减少的单一的调整问题。通过针对性地调整不同优化程度的粒子的惯性权重,能够有效提高算法全局寻优的能力。

    一种基于CW-RNN网络的UUV实时避碰规划方法

    公开(公告)号:CN108459614A

    公开(公告)日:2018-08-28

    申请号:CN201810044019.4

    申请日:2018-01-17

    CPC classification number: G05D1/10 G06N3/0445

    Abstract: 本发明提供了一种基于CW-RNN网络的UUV实时避碰规划方法,属于水下航行器导航领域。本发明提供的方法如下:步骤1:构建全局坐标系和局部坐标系,建立声纳仿真模型;步骤2:设计用于实时避碰规划的CW-RNN网络;步骤3:构建数据集用于神经网络的训练阶段和测试阶段;步骤4:利用训练集中数据训练CW-RNN网络,得到实时避碰规划器;步骤5:将声纳探测信息及目标点信息输入至基于CW-RNN网络的避碰规划器,获得UUV下一时刻的转艏及速度的调整指令。本发明提供的方法得到的规划器不仅有强大的学习能力,同时还具有非常强的泛化能力,适用于各种复杂的环境;同时可满足实时性的要求,并且所规划的路径满足UUV运动特性的要求。

    静态环境下基于深度强化学习的移动机器人避碰规划方法

    公开(公告)号:CN110750096B

    公开(公告)日:2022-08-02

    申请号:CN201910953377.1

    申请日:2019-10-09

    Abstract: 本发明属于移动机器人导航技术领域,具体涉及一种静态环境下基于深度强化学习的移动机器人避碰规划方法。本发明使用激光测距仪采集原始数据,将处理后的数据作为A3C算法的状态S,通过构建A3C‑LSTM神经网络,将状态S作为网络输入,通过A3C算法,神经网络输出相应参数,利用参数通过正态分布选择移动机器人每一步执行的动作。本发明无需对环境进行建模,通过深度强化学习算法最终实现移动机器人成功在复杂静态障碍物环境下避障。本发明设计具有转艏约束的连续动作空间模型,且采用多线程异步学习,与一般深度强化学习方法相比,大大提高学习训练时间,减少样本相关性,保障探索空间的高利用性与探索策略的多样性,提升算法收敛性、稳定性以及避障成功率。

Patent Agency Ranking