





定价:149元
印次:1-5
ISBN:9787302540328
出版日期:2020.06.01
印刷日期:2024.08.23
图书责编:古雪
图书分类:教材
本书的目的是考虑大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和最优控制来解决,但它们的精确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法,以产生具有足够性能的次优策略。这些方法统称为增强学习,也可以叫做近似动态规划和神经动态规划等。 本书的主题产生于最优控制和人工智能思想的相互作用。本书的目的之一是探索这两个领域之间的共同边界,并架设一座具有任一领域背景的专业人士都可以访问的桥梁。
Dimitri P. Bertseka,美国MIT终身教授,美国国家工程院院士,清华大学复杂与网络化系统研究中心客座教授。电气工程与计算机科学领域国际知名作者,著有《非线性规划》《网络优化》《凸优化》等十几本畅销教材和专著。
Preface Turning to the succor of modern computing machines, let us renounce all analytic tools. Richard Bellman [Bel57] From a teleological point of view the particular numerical solution of any particular set of equations is of far less importance than the understanding of the nature of the solution. Richard Bellman [Bel57] In this book we consider large and challenging multistage decision problems, which can be solved in principle by dynamic programming (DP for short), but their exact solution is computationally intractable. We discuss solution methods that rely on approximations to produce suboptimal policies with adequate performance. These methods are collectively known by s...
Contents
1. Exact Dynamic Programming
1.1. DeterministicDynamicProgramming . . . . . . . . . . . p. 2
1.1.1. DeterministicProblems . . . . . . . . . . . . . . p. 2
1.1.2. TheDynamicProgrammingAlgorithm . . . . . . . . p. 7
1.1.3. Approximation inValue Space . . . . . . . . . . . p. 12
1.2. StochasticDynamicProgramming . . . . . . . . . . . . . p. 14
1.3. Examples,Variations, and Simplifications . . . . . . . . . p. 18
1.3.1. Deterministic ShortestPathProblems . . . . . . . . p. 19
1.3.2. DiscreteDeterministicOptimization . . . . . . . . . p. 21
1.3.3. Problemswith aTermination State . . . . . . . . . p. 25
1.3.4. Forecasts . . . . . . . . . . . . . . . . . . . . . p. 26
1.3.5. ...
本书的主题产生于最优控制和人工智能思想的相互作用。本书的目的之一是探索这两个领域之间的共同边界,并架设一座具有任一领域背景的专业人士都可以访问的桥梁。
同系列产品
查看详情-
阿尔法零对最优模型预测自适应控制的启示
[美]德梅萃·P. 博塞克斯(Dimitri P. Bertsekas)
ISBN:9787302684718
定 价:79元
-
策略前展、策略迭代与分布式强化学习
[美]德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas) 著
ISBN:9787302599388
定 价:139元
-
抽象动态规划(第2版)
[美]德梅萃·P.博赛卡斯(Dimitri P. Bertsekas) 著
ISBN:9787302599814
定 价:89元
-
抽象动态规划
Dimitri P. Bertsekas 著
ISBN:9787302362692
定 价:39元