图书目录

目录

下载源码

第1章绪论

1.1数据挖掘基础

1.1.1数据挖掘概述

1.1.2数据挖掘演进脉络

1.1.3数据挖掘应用领域

1.2基于Python的数据挖掘

1.2.1本地环境安装

1.2.2简单案例实践

1.2.3本书常用方法

1.3天池平台操作概述

1.3.1天池AI实训平台介绍

1.3.2课程配套环境操作

1.3.3天池数据集介绍

习题1

第2章数据可视化

2.1数据可视化概述

2.1.1数据可视化的概念

2.1.2数据可视化的作用

2.1.3Python数据可视化实战准备

2.2matplotlib绘制简单图表

2.2.1matplotlib简介

2.2.2绘图属性设置

2.2.3简单图形的绘制

2.3高级图表绘制

2.3.1subplot子区

2.3.2Seaborn

2.3.3词云图

2.3.4mplot3d模块

习题2

第3章数据预处理

3.1数据预处理概述

3.1.1数据预处理的概念

3.1.2数据预处理在数据挖掘中的作用

3.1.3数据预处理的主要任务

3.2数据清洗

3.2.1缺失值处理

3.2.2噪声数据处理

3.2.3异常值处理

3.3数据集成

3.3.1数据源识别与整合

3.3.2数据格式统一化

3.3.3数据冗余与相关性分析

3.4数据变换

3.4.1数据变换概述

3.4.2数据编码应用示例

3.4.3规范化应用示例

3.5数据预处理应用案例

习题3

第4章回归分析

4.1回归分析基本问题

4.1.1回归分析介绍

4.1.2回归分析的种类

4.1.3回归分析的发展史

4.2线性回归模型

4.2.1模型的相关概念

4.2.2一元线性回归分析

4.2.3多元线性回归分析

4.2.4实战准备

4.2.5模型案例分析

4.3其他回归模型

4.3.1Lasso回归模型

4.3.2岭回归模型

4.3.3逻辑回归模型

4.3.4实战准备

4.3.5模型案例分析

习题4

第5章关联规则分析

5.1关联规则分析概述

5.1.1概念

5.1.2原理步骤

5.1.3应用领域

5.2Apriori算法

5.2.1基本原理

5.2.2算法流程

5.2.3实战准备

5.2.4Apriori算法案例

5.3FPgrowth算法

5.3.1基本原理

5.3.2算法流程

5.3.3实战准备

5.3.4FPgrowth算法案例

5.4关联规则分析案例

习题5

第6章聚类分析

6.1聚类分析概述

6.1.1聚类分析的基本概念

6.1.2聚类分析的原理和步骤

6.2基于划分的聚类

6.2.1kmeans算法

6.2.2kmeans++算法

6.2.3实战准备

6.2.4划分聚类案例

6.3基于层次的聚类

6.3.1层次聚类的基本概念

6.3.2凝聚层次算法: AGNES算法

6.3.3分裂层次算法: DIANA算法

6.3.4实战准备

6.3.5层次聚类案例

6.4基于密度的聚类

6.4.1密度聚类的基本概念

6.4.2DBSCAN 算法

6.4.3实战准备

6.4.4密度聚类案例

习题6

第7章随机森林

7.1随机森林概述

7.1.1决策树概论

7.1.2随机森林概论

7.1.3决策树与随机森林

7.2决策树

7.2.1sklearn中的决策树模型

7.2.2分类决策树

7.2.3回归决策树

7.3随机森林实践

7.3.1随机森林实践准备

7.3.2随机森林案例分析

7.3.3随机森林的应用案例

习题7

第8章神经网络

8.1神经网络概述

8.1.1概念

8.1.2发展历程

8.1.3应用领域

8.2长短期记忆网络算法

8.2.1基本原理

8.2.2算法流程

8.2.3LSTM算法案例

8.3BP反向传播算法

8.3.1基本原理

8.3.2算法流程

8.3.3BP算法案例

习题8

第9章贝叶斯分类

9.1贝叶斯分类概述

9.1.1贝叶斯定理

9.1.2贝叶斯分类步骤及优点

9.1.3应用领域

9.2朴素贝叶斯算法

9.2.1基本原理

9.2.2算法分类

9.2.3实战准备

9.2.4朴素贝叶斯算法案例

9.3贝叶斯网络

9.3.1基本原理

9.3.2算法流程及实战准备

9.3.3贝叶斯网络算法案例

习题9

第10章文本挖掘

10.1文本挖掘概述

10.1.1基本介绍

10.1.2应用领域

10.1.3基本流程

10.2文本预处理

10.2.1文本清洗

10.2.2分词和词性标注

10.2.3特征选取

10.2.4词向量表示方法

10.3文本挖掘方法实现

10.3.1文本分类

10.3.2文本聚类

10.4文本挖掘结果可视化

10.4.1知识图谱

10.4.2词云图

10.5文本挖掘算法案例

习题10

第11章综合案例实战

11.1代码自动生成

11.2租房案例概述

11.2.1案例背景

11.2.2案例研究目的

11.3数据采集及预处理

11.3.1选取及提取网页

11.3.2使用Scrapy解析页面内容

11.3.3数据清理及存储

11.4数据分析与可视化

11.4.1房源租金可视化分析

11.4.2区域租金均价分布可视化

11.5代码自动生成的租房决策实现

11.5.1找准区域

11.5.2找准商圈

11.5.3找准户型

11.5.4找准朝向

11.5.5找准设施

11.5.6得出结果

11.6数据挖掘应用发布和实践

11.6.1基于Web服务器的应用发布

11.6.2基于钉钉低代码的应用发布