汽车最新资讯与谷歌共赴强化学习之旅解锁机器人长途导航新纪元

雷锋网 AI 科技评论按：可以智能自主导航的机器人不仅能为人类带来便利，还能帮助那些行动受限的人独立生活。目前，强化学习是一种有效方法，将原始传感器数据映射到机器人的动作上。然而，强化学习通常缺乏理解大空间环境的能力，这对于无需人类帮助、安全穿梭长距离的机器人来说是一个挑战。

谷歌的研究人员最近提出了结合深度强化学习和长距离运动规划的算法，这种算法具有很强的自适应能力。在三篇论文中，他们逐步将深度强化学习与长距离规划结合起来，探索了更容易适应新环境的自动控制方案。

首先，他们训练了局部规划智能体，可以执行基本导航任务，并在模拟环境中使用AutoRL进行训练。尽管这些智能体只能在较短距离内工作，它们也能够迁移到真实机器人和未见过的环境中。

随后，他们构建了路线图，在这个图中，每个节点代表一个位置。如果局部规划器能够在两个节点之间可靠地往返导航，那么这两个节点就会被用边连接起来。

最后，一篇论文通过组合强化学习和基于采样的规划完成了长距离机器人导航任务，而另一篇则利用PRMs和SLAM技术实现了基于PRM-RL的地图重建，为机器人的室内导航提供了一套完整解决方案。这两项技术都显示出它们对提升机器人自主性有着巨大的潜力。

通过这些创新方法，谷歌AI研究人员正在推动前沿科技，使得未来可能出现更多高效且安全地处理复杂场景的大型服务机械系统。

标签：机器人