图书前言

前言

“数据分析与数据挖掘”是一门跨学科的计算机科学分支课程,是人工智能、机器学习、概率论、统计学和数据库知识的交叉学科。数据挖掘的目标是在一个或多个数据集中通过数据处理和结合一定的算法模型,最终挖掘出有价值的信息。随着科技的发展,数据量呈爆炸式增长,数据挖掘在工业界和学术界都得到了越来越多的重视。国际知名的互联网公司和科研单位都在大力发展数据科学。在我国,数据科学的发展受到了极大的关注,通过数据分析与数据挖掘可以帮助决策,进而推动经济发展。

本书内容均为数据分析与数据挖掘过程中常用方法和模型,目的是让爱好数据科学的计算机专业、统计学专业以及相关专业的学生熟悉数据挖掘的过程,掌握数据分析与数据挖掘过程中常用的算法模型及数据处理方式。本书知识点的介绍通过基础理论及概念讲解、应用例题、习题三部分进行,部分章节涉及算法应用实例。通过对数据分析与数据挖掘知识点的基础理论讲解,对数据分析与数据挖掘形成整体的认识及了解;通过应用例题,能够对算法的过程有深刻的理解;通过习题,能够巩固相应知识点。本书注重基础理论的介绍,使读者能够快速掌握数据分析与数据挖掘的基本过程和基础算法,为后续学习打下坚实的基础。

参与本书构思、撰写、审稿、应用实例的上机验证及截图校对的人员如下: 喻梅、于健、王庆节、王建荣、于瑞国、陈军、邸海波、尚鸿运、孟莹、成基元、赵永伟、李鑫、曹雅茹、郭佳、刘凯、邢文涛。

本书在撰写过程中得到了清华大学出版社张瑞庆编审的大力支持,在此表示衷心感谢。

由于时间仓促、编者水平有限,书中难免有不当之处,敬请读者批评、指正。

编者

2018年1月