





定价:89元
印次:2-1
ISBN:9787302599814
出版日期:2022.04.01
印刷日期:2022.03.11
图书责编:崔彤
图书分类:教材
第2版的主要目的是扩大第1版(2013)的第3章和第4章的半契约模型的内容,并以自第1版以来作者在期刊和报告中发表的研究成果作为补充。这本书的数学内容非常优雅且严格,依靠抽象的力量专注于基础知识。该书首次提供了该领域的全面综合知识,同时提出了许多新研究,其中一些研究与当前非常活跃的领域(如近似动态编程)有关。本书中散布着许多例子,用严谨的理论统一起来,并将其应用于特定类型的问题,例如折扣、随机最短路径、半马尔可夫、最小极大、序贯博弈、乘法和风险敏感模型。本书还包括练习(提供完整的解答),并通过示例、反例和理论扩展来补充本文。 就像Bertsekas的其他几本著作一样,这本书写得很好,非常适合自学。它可用作研究生动态编程课程的补充。
德梅萃 P.博塞克斯(Dimitri P. Bertseka),美国MIT终身教授,美国国家工程院院士,清华大学复杂与网络化系统研究中心客座教授。电气工程与计算机科学领域国际知名作者,著有《非线性规划》《网络优化》《凸优化》等十几本畅销教材和专著。
影印版序 本书利用不动点理论问题的紧密关联性,阐述以总成本为目标的序贯决策问题的核心理论和算法的最新研究进展,重点讨论以动态规划为基础的抽象映射,并定义了相关的数学特征。本书聚焦于抽象映射的两个基本性质——单调性和(加权超范数)压缩性。事实上,动态规划理论分析和算法的本质主要取决于这两种属性是否存在,而问题的其余结构在很大程度上是无关紧要的。除了极特别的情况,本书将始终假设单调性成立,围绕抽象映射的压缩性特点研究了四类主要模型: 压缩模型、半压缩模型、非压缩模型、受限策略和Borel空间模型。 本书第1版,在压缩模型部分,主要讨论折扣随机最优控制问题; 在半压缩模型部分,主要讨论随机最短路问题; 在非压缩模型部分,主要讨论经典动态规划问题; 在受限策略和Borel空间模型部分,主要讨论连续概率空间的随机最优控制问题,令其允许策略和动态规划映射具有某种可测特性。 本书第2版,主要是扩展了第1版第3、4章的半压缩模型,在第3章中讨论的半压缩模型中只需使用平稳正则策略。在第4章中,将正则性的概念推广到了非平稳策略,旨在探索贝尔曼方程解集的结构以及最优控制问题的最优性与其他结构性质的联系,如讨论了连续空间确定性最优控制中最优性与经典稳定性、可控性的关系等。 本书以动态规划为基础,运用抽象映射的单调性和压缩映射理论研究近似动态规划或动态规划的若干典型问题,主要特点是: 不涉及所讨论问题的随机特性,也不涉及特殊类型的动态规划问题的某些有趣特征。本书中展示的理论方法位居随机运筹学和随机最优控制领域的学科前沿,其严谨的分析方法和处理技巧具有重要的理论价值,在数学...
同系列产品
查看详情-
阿尔法零对最优模型预测自适应控制的启示
[美]德梅萃·P. 博塞克斯(Dimitri P. Bertsekas)
ISBN:9787302684718
定 价:79元
-
策略前展、策略迭代与分布式强化学习
[美]德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas) 著
ISBN:9787302599388
定 价:139元
-
强化学习与最优控制
[美]德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas) 著
ISBN:9787302540328
定 价:149元
-
抽象动态规划
Dimitri P. Bertsekas 著
ISBN:9787302362692
定 价:39元