


作者:[美]斯楠·奥兹德米尔(Sinan Ozdemir) 著,冯磊 周慧梅 译
定价:108元
印次:2-1
ISBN:9787302717188
出版日期:2026.06.01
印刷日期:2026.06.03
图书责编:王中英
图书分类:零售
"本书是大语言模型(LLM)领域的系统性实战指南,由兼具理论数学背景与 AI 创业经验的 Sinan Ozdemir 撰写,旨在帮助读者既理解 LLM 的底层原理,又能快速将其应用于实际项目。 全书分为四大部分共12章。第一部分(第1~4章)从 LLM 基本概念出发,系统介绍 Transformer 架构、语义搜索、提示工程等基础知识,并通过检索增强生成(RAG)和AI智能体案例展示实际应用。第二部分(第5~8章)深入探讨模型微调、高级提示工程、自定义嵌入与模型架构以及AI对齐原则,帮助读者从“能用”迈向“用好”。第三部分(第9~12章)聚焦前沿实践,涵盖多模态模型、基于人类反馈的强化学习(RLHF)、开源模型高级微调、生产部署优化及 LLM 评估方法论。第四部分(附录A~附录D)提供常见问题解答、术语表和应用架构参考。 本书**的特色在于理论与实践的深度结合——每个核心概念都配有直观的类比解释和可运行的 Python 代码示例,读者可跟随实战项目逐步掌握从原型到生产的完整技能链。适合有一定编程基础的开发者、数据科学家及希望系统掌握 LLM 技术的 AI 从业者阅读。 "
Sinan Ozdemir是一名数据科学家、创业者和教育工作者。Sinan的学术生涯在约翰·霍普金斯大学(The Johns Hopkins University)渡过,主修数学专业。随后他从事教育事业,曾经在约翰·霍普金斯大学和General Assembly公司举办多次数据科学讲座。在此之后,他创立了旨在通过人工智能技术和数据科学力量帮助企业销售团队的创业公司Legion Analytics。
推荐语 本书在开源与闭源模型之间找到了绝佳平衡,是一部帮助读者理解和运用 LLM 的系统指南,成功架起了理论与实践之间的桥梁。 —Giada Pistilli, Hugging Face 首席伦理学家 一份令人耳目一新、深受启发的学习资源。书中既有翔实的实用指导,又有清晰易懂的专业阐释,让你在这个令人惊叹的新领域真正“长本事”。 —Pete Huang, The Neuron 作者 想找一本全面覆盖大语言模型核心内容的综合资源绝非易事。直到发现这本书,我才停止了寻觅。Sinan 擅长以直截了当的方式呈现复杂概念。他把复杂的思想与算法拆解得清晰明了,让读者不至于被信息淹没。每个主题都循序铺陈、配以示例,成为读者进一步理解相关知识的踏脚石。这极大地提升了学习体验,使得即便是 LLM 开发中最棘手的部分,也能被不同基础的读者所掌握。 本书的另一大亮点是丰富的代码资源,书中的大量实战样例和代码片段对于想要动手实验、学以致用的读者来说,简直如虎添翼。它们为读者提供了宝贵的动手机会,帮助读者检验并打磨自己的理解,从而更深入地吃透材料,真正与内容互动。 总之,本书是所有对构建 LLM 感兴趣的读者的难得之选。书中卓越的讲解质量、清晰凝练的文字、丰富的代码资源,以及对要点的全面覆盖,使其成为不可或缺的参考书。不论你是新手还是资深从业者,它都能切实提升你在 LLM 开发上的理解与实践能力。我将本书强烈推荐给所有准备踏上 LLM 应用之旅的人。 —Pedro Marcelino,机器学习工程师, @overfit_study 联合创始人兼 CEO Sinan 的这本书...
第一部分 大语言模型导论
第 1 章 大语言模型概述····························· 2
1.1 什么是大语言模型························· 3
LLM 的定义································· 5
1.2 流行的现代 LLM··························· 6
1.2.1 BERT ································ 6
1.2.2 GPT 家族与 ChatGPT ············ 7
1.2.3 T5 ···································· 8
1.2.4 Llama ································ 8
1.3 LLM 的关键特征··························· 9
1.4 理解上下文的重要性····················· 12
1.5 LLM 的工作原理·························· 12
1.5.1 预训练阶段························ 13
1.5.2 迁移学习··························· 15
1.5.3 微调································· 15
1.5.4 注意力······························ 16
1.5.5 嵌入··················... 查看详情
"1.灵活的学习路径:既可深度编程,亲自跑代码、调模型;也可专注理论,厘清不变的核心原理。
2.讲透关键概念:用生活化类比和简单语言讲透复杂概念,辅以可运行Python代码,让概念“活”起来。
3.覆盖从原型到生产的完整技能链:包含微调、RAG、RLHF、多模态、云端部署与评估。
4.在实战中学习:构建搜索系统、RAG管道、智能体等,在真实项目中理解LLM落地的现实挑战。
"

