qq最新资讯与谷歌一同探索强化学习长距离机器人导航的未来奇迹

雷锋网 AI 科技评论按:可以智能自主导航的机器人不仅能为人类带来便利,还能帮助那些行动受限的人独立生活。目前,研究表明强化学习非常适合将传感器数据映射到机器人的动作上。不过,传统的强化学习算法在理解大空间结构方面存在局限性,这对于无需人类干预、安全地长距离移动的机器人来说是必须克服的挑战。

谷歌的研究团队近期提出了一种结合深度强化学习和长距离运动规划的机器人自主控制算法,该算法具有很好的自适应能力。通过三篇论文,我们可以看到谷歌AI如何逐步将深度强化学习与长距离运动规划相结合,以探索更容易适应新环境变化的自动控制方案。

首先,他们训练了能够执行基本导航任务并安全穿越短距离地形的小型规划智能体。这类本地规划器能够处理来自有噪声传感器(如一维激光雷达)输入,比如提供障碍物距离信息,并计算出所需速度和角速度。通过AutoRL自动搜索反馈和神经网络架构,这些本地规划者虽然只能在10-15米内训练,但表现良好,并且能够迁移到真实环境中。

随后,研究人员构建了路线图,将不同的位置作为节点连接起来。在模拟真实条件下训练出的本地规划者,如果能够可靠地在两个节点间导航,那么这两个节点就被用边连接起来。这成为了大尺度空间中的基础单元。

接下来,他们尝试将基于采样的概率路线图(PRMs)方法与手工调节后的基于深度强化学习局部规划者的组合,以实现更复杂的地图生成和更高效的大规模参数优化。此外,他们还采用SLAM技术进行同步定位和重建,同时增加分布式地图构建,使得最大支持的地图大小达到70,000个节点。

这些工作展示了如何通过结合不同技术,如AutoRL、PRMs以及SLAM,从而使得机器人系统更加灵活、高效,并且对各种环境变化有更好的适应能力。未来,随着这些技术不断进步,我们或许会看到真正实现长距离自主导航功能的服务机器人,它们将极大提高行动受限人们的生活质量,为社会带来革命性的变革。

标签: 机器人

猜你喜欢