机器人足球赛中基于增强学习的任务分工

智能输送方案
2024-12-22 14:33
0

摘要：本文研究了机器人足球赛中利用增强学习进行角色分工的问题，通过仿真试验和理论分析，指出文[1]中采取无限作用范围衰减奖励优化模型(infinite—horizon discounted model)的Q学习算法对该任务不合适，并用平均奖励模型(average—reward model)对算法进行了改进，实验表明改进后学习的收敛速度以及系统的性能都提高了近一倍。

PDF下载：