





定价:59.9元
印次:2-7
ISBN:9787302558682
出版日期:2020.09.01
印刷日期:2024.08.01
图书责编:张瑞庆
图书分类:教材
本书主要介绍数据挖掘和数据分析的基本概念和方法,包括数据的基本属性和概念、数据预处理技术、数据立方体和OLAP技术、频繁模式挖掘、回归分析、分类、聚类、离群点分析。每一部分先介绍基本概念、理论基础、应用实例、思考习题。书中涉及的模型和算法均给予了相应的实例,便于读者更好的理解和使用模型。
喻梅 天津大学智能与计算学部教授,硕士生导师。主要从事计算机网络、数据挖掘及数据库方向的研究及教学。研究重点为社交网络中实体社团的发现及识别、影响因素及发展规律;基于亲密度及影响力的微博社交兴趣圈挖掘算法等。在国际会议及期刊上发表了多篇相关学术论文。担任多个国际会议技术委员会委员,参与会议组织工作及专业技术服务。参与多部计算机教材的编写。
随着科学技术的发展,数据量呈爆炸式增长,如何从海量数据中挖掘出有助于决策的知识显得尤为重要,这使得数据分析与数据挖掘技术受到极大的关注。为满足数据挖掘学习者的需要,2018年出版了本书第1版,不仅用于高等学校计算机专业的教学,同时也用于非计算机专业相关学科的教学,受到了广大教师和学生的欢迎。经过两年的教学实践,我们对本书进行了修订,以便更好地满足教学及应用需求。 本书主要介绍数据分析及数据挖掘中的基本概念和方法。本书知识点的讲解分别通过基础理论及概念、应用例题、习题三大部分进行,部分知识点涉及算法应用实例。通过相关理论及概念的介绍,使读者对数据分析与数据挖掘的基础算法有整体认识和了解;通过应用例题的讲解,使读者对算法过程有深刻理解;通过习题的训练,使读者能够巩固相应知识点。通过本书的学习,读者可以快速掌握数据分析与数据挖掘的基本概念和基本方法。 为方便教师备课及教学,我们提供了与本书第2版配套的电子课件,若教师需要可以与清华大学出版社联系。我们在学堂在线上同步开设了“数据挖掘”在线课程,以方便教师在线教学以及广大学习者在线学习。 本书第2版由喻梅、于健主编,王建荣、李雪威副主编。参与本书构思、撰写、审稿、应用实例的上机验证及截图校对的人员有喻梅、于健、王建荣、李雪威、王庆节、于瑞国、陈军、徐天一、赵满坤、高洁、刘志强、刘伟、张妍、刘莹、冯爽、邓锐、刘玉生、李盼、刘鸣喆等。在此也感谢对本书第1版做出贡献的编写者。 在全书的撰写过程中,得到了清华大学出版社和张瑞庆编审的大力支持,在此表示衷心的感谢。 本书编写过程中参考了一些教材和资料,具体见参考文献,在此对原作者表示...
第1章概述1
1.1数据分析与数据挖掘1
1.1.1数据分析1
1.1.2数据挖掘1
1.1.3数据分析与数据挖掘的区别和联系3
1.2分析与挖掘的数据类型3
1.3数据分析与数据挖掘的方法7
1.4数据分析与数据挖掘使用的技术8
1.5应用场景及存在的问题12
1.5.1数据分析与数据挖掘的应用12
1.5.2存在的主要问题13
1.6本书结构概述14
1.7习题14
第2章数据16
2.1数据对象与属性类别16
2.1.1属性的定义16
2.1.2属性的分类16
2.2数据的基本统计描述17
2.2.1中心趋势度量18
2.2.2数据分散度量20
2.2.3数据的图形显示22
2.3数据的相似性和相异性度量26
2.3.1数据矩阵与相异性矩阵26
2.3.2标称属性的邻近性度量27
2.3.3二元属性的邻近性度量28
2.3.4数值属性的相异性29
2.3.5序数属性的邻近性度量31
2.3.6混合类型属性的相异性31
2.3.7余弦相似性33目录数据分析与数据挖掘(第2版)2.4习题34
第3章数据预处理36
3.1数据预处理及任务36
3.1.1数据预处理的必要性36
3.1.2数据预处理的主要任务39
3.2数据清理40
3.2.1缺失值、噪声和不一致数据的处理40
3.2.2数据清理方式43
3.3数据集成44
3.4数据归约49
3.4.1直方图49
3.4.2数据立方体聚集50
3.4.3属性子集选择52
3.4.4抽样53
3.5数据变换与数据离散化54
3.5.1数据变...
本书主要介绍数据分析与数据挖掘的基本概念和方法,包括数据的基本属性和概念、数据预处理技术、数据仓库和OLAP技术、回归分析、频繁模式挖掘、分类、聚类、离群点分析。每一部分先介绍基本概念、理论基础,再给出应用实例,便于读者更好的理解和应用算法,最后给出习题。
本书所讲述的内容均为数据分析与数据挖掘过程中常用方法和模型,目的是让爱好数据科学的计算机专业、统计学专业以及相关专业的学生熟悉数据挖掘的过程,掌握数据分析与数据挖掘过程中常用的算法模型及数据处理方式。本书知识点的介绍通过基础理论及概念介绍、应用例题、习题三部分进行,部分章节涉及算法应用实例。通过对数据分析与数据挖掘知识点的基础理论讲解,对数据分析与数据挖掘有整体的认识及了解;通过应用例题,能够对算法的过程有深刻的理解;通过习题,能够巩固对相应知识点掌握。
本书适用于数据分析与数据挖掘领域的初学者,可以作为相关专业本科及研究生教材。书中算法由浅入深、由原理到应用,有利于初学者的学习和理解。本书也可作为数据分析与数据挖掘相关专业人士的参考用书。