目 录
基础篇
1 导论 2
1.1 数据、信息与模型 2
1.2 规律、规则与机制 3
1.3 人工智能 5
1.4 化学信息学 6
1.5 生物信息学 6
1.6 本书内容框架 7
2 化学信息学基础 10
2.1 化学信息学数据 10
2.2 有机化合物结构 11
2.3 有机化学反应与合成路线 13
2.4 化学分子的表示 14
2.5 分子的相似性与构效关系 16
2.6 化学信息学的应用 18
3 生物信息学基础 28
3.1 生物信息学数据 28
3.2 核酸与基因 29
3.3 蛋白质 30
3.4 酶 32
3.5 分子生物学技术 33
3.6 组学技术 35
3.7 生物信息数据库 37
3.8 生物信息数据的表示方法 38
4 数学基础 41
4.1 概述 41
4.2 向量 42
4.3 矩阵 43
4.4 导数与梯度 44
4.5 概率与概率分布 45
4.6 信息熵与交叉熵 47
5 算法基础 50
5.1 时空复杂度 50
5.2 动态规划算法 51
5.3 AI中的优化算法 52
5.4 生物信息学中经典的序列比对算法 54
5.5 降维算法 57
6 机器学习基础 60
6.1 机器学习概述 60
6.2 机器学习的一般流程 61
6.3 模型评估 63
6.4 机器学习经典模型 68
7 深度学习基础 72
7.1 深度学习概述 72
7.2 感知机与前馈神经网络 72
7.3 神经网络的训练 75
7.4 卷积神经网络 77
7.5 表示学习与迁移学习 80
7.6 深度学习模型的可解释性 81
7.7 深度学习框架 83
技术篇
8 序列模型 86
8.1 序列模型概述 86
8.2 RNN 86
8.3 Transformer 88
8.4 BERT 92
8.5 预训练大语言模型:GPT的发展过程 94
8.6 DeepSeek-R1 95
8.7 序列模型的应用 96
9 图模型 105
9.1 图模型概述 105
9.2 图卷积网络 106
9.3 图同构网络(GIN) 108
9.4 消息传递神经网络(MPNN) 109
9.5 预训练的图模型 111
9.6 异质图模型 113
9.7 图模型应用 114
10 多模态人工智能模型 121
10.1 概述 121
10.2 多模态特征融合技术 122
10.3 伪样本构建技术 123
10.4 应用案例 124
11 知识图谱 136
11.1 概述 136
11.2 知识图谱构建 137
11.3 知识表示与推理 138
11.4 大模型时代的知识图谱 138
11.5 知识图谱的应用 140
12 生成式模型 147
12.1 概述 147
12.2 自编码器 147
12.3 变分自编码器 148
12.4 扩散模型 149
12.5 生成式AI在药物设计中的应用 150
13 强化学习 156
13.1 概述 156
13.2 蒙特卡洛树搜索算法 157
13.3 强化学习算法 158
13.4 强化学习的应用案例 159
应用篇
14 AI辅助化学合成 164
14.1 概述 164
14.2 逆合成分析 164
14.3 反应产物预测 167
14.4 反应条件预测 169
14.5 化学自动化 170
15 AI在波谱学中的应用 176
15.1 概述 176
15.2 核磁共振谱 178
15.3 质谱 180
16 蛋白质结构与功能预测 186
16.1 概述 186
16.2 蛋白质结构预测 187
16.3 蛋白-配体复合物结构预测 188
16.4 蛋白质-蛋白质相互作用预测 189
16.5 蛋白质功能预测 192
16.6 基于语言模型的蛋白质结构与功能预测 192
16.7 蛋白质序列设计 196
17 RNA结构与功能预测 199
17.1 概述 199
17.2 RNA二级结构预测 200
17.3 RNA三级结构预测:ARES和RhoFold+ 201
17.4 蛋白质-核酸复合物结构预测 203
17.5 RNA功能预测 204
18 利用组学数据建模 210
18.1 概述 210
18.2 因果推断 211
18.3 基于转录组学数据建模 212
18.4 基于多组学数据的建模 220
19 AI辅助生物合成 225
19.1 概述 225
19.2 酶功能预测 225
19.3 酶功能设计 229
19.4 化学+生物合成路径设计 232
19.5 AI辅助生物合成案例 235
20 AI制药导论 242
20.1 制药业简史 242
20.2 药物设计简史 245
20.3 现代新药研发流程 248
20.4 AI制药 248
21 小分子药物ADMET性质预测 251
21.1 ADMET性质概述 251
21.2 小分子的理化性质 252
21.3 小分子的ADMET性质 255
21.4 ADMET数据集 258
21.5 物理信息神经网络 258
21.6 ADMET研究案例 259
22 先导化合物发现与优化 268
22.1 药物设计概述 268
22.2 基于靶点发现先导化合物 270
22.3 先导化合物优化 276
23 药物靶标预测 282
23.1 概述 282
23.2 基于组学数据预测靶标 283
23.3 基于文本数据构建药物-靶标-疾病关系 289
24 药物制剂 297
24.1 概述 297
24.2 晶型预测 297
24.3 熔点预测 300
24.4 溶解度预测 302
24.5 药物配方预测 303
25 抗体药物 307
25.1 概述 307
25.2 抗体结构预测 308
25.3 基于结构生成抗体 309
25.4 抗体性质预测与优化 310
25.5 AI辅助ADC、双抗的设计 313
26 核酸药物 317
26.1 概述 317
26.2 RNA适配体药物设计 319
26.3 mRNA疫苗设计 320
26.4 AI在核酸药物设计中的应用 322
附录 缩略语 327
