清华大学出版社--图书推荐

读者通过本书可以了解强化学习中策略迭代，特别是Rollout方法在分布式和多智能体框架下的**进展和应用。本书可用作人工智能或系统与控制科学等相关专业的高年级本科生或研究生作为一个学期的课程教材。也适用于开展相关研究工作的专业技术人员作为参考书阅读。