谷歌浏览器插件
订阅小程序
在清言上使用

基于SPE-ICM的移动机器人内在动机避障规划

Journal of Electronic Measurement and Instrumentation(2023)

引用 0|浏览2
暂无评分
摘要
针对动态环境下强化学习算法对移动障碍物的检测不理想,进而影响最优避障策略的问题.提出一种以状态预测误差为内在动机的奖励结构形式(state predict error-intrinsic curiosity module,SPE-ICM)来提高策略函数对Agent的环境探索能力.首先,引入内在奖励机制为Agent提供多重奖励(reward)结构;其次,依据内外的奖励结构优化提高Agent对环境信息的感知能力,改进对移动障碍物在数据结构上的采集检测方式,并且依赖新的检测方式对最优避障策略函数进行优化提升;最后,将该网络模型与深度确定性策略梯度算法(DDPG)结合,运用到以ROS搭建的路径规划仿真环境中进行对比实验,验证所提算法的可行性.结果表明,所提算法在检测能力、决策能力上效果明显更优.
更多
查看译文
关键词
status reward error,optimal obstacle avoidance strategy,intrinsic motivation rewards
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要