图书前言

前  言

机器学习是新思想、新观念、新理论、新技术不断出现并迅速发展的新兴学科,是人工智能的基础。目前几乎所有学科(工科、理科、金融和文法等)的研究方向都与机器学习相关,机器学习已经成为从事不同领域研究的重要手段和工具。本书为研究生和本科生机器学习相关课程的学习而编写。 

本书的内容主要包括五部分:第一部分是机器学习中的数学基础,包括线性代数、概率统计与信息论、最优化方法和张量分析;机器学习是基于样本数据的,第二部分内容是样本数据的处理,包括 Kernel 方法、PCA、KPCA、LDA 和 KLDA;第三部分是监督学习,包括多变量线性回归及基于 Kernel 的线性回归、逻辑回归、贝叶斯分类器、决策树、随机森林、SVM、人工神经网络和卷积神经网络;第四部分是无监督学习,包括 k-means、FCM 和改进的 FCM;第五部分是应用,包括机器学习算法的综合应用、机器学习和深度学习的工程应用。 

本书的特色如下。 

(1)在相关背景知识中介绍了与机器学习相关的线性代数、优化理论等基础知识,自成体系,具有系统性、完整性,适合不同专业的学生学习。 

(2)为提高学生的基础理论水平,本书注重基础理论的描述,包括每种机器学习算法的物理意义、如何公式化和如何数值求解的描述。 

(3)为加深学生对基础理论的理解,同时提高学生解决工程实际问题的能力,本书包括对每种算法实现的介绍,并给出源码。 

(4)编写力求由浅入深,层次分明,逻辑性强,可阅读性强,有利于读者自学。 

(5)引入课题组及同行的最新科研成果,具有时代感和先进性。 

本书全部书稿几经修改,也参考了很多国内外机器学习方面的著作和网络资源。本书前言、第 1 章、第 9—10 章、第 16—20 章由天津大学电气自动化与信息工程学院唐晨教授编写;第 2—6 章和第 15 章由山东大学数学学院付树军教授编写;第 7—8 章、第 11—14 章由天津大学电气自动化与信息工程学院徐岩副教授编写。由于编著者水平有限、时间紧迫,书中可能尚有不足之处,恳请广大读者批评指正,使本书得以改进和完善。 

本书获得“天津大学研究生创新人才培养项目”(项目编号 YCX19049)资助,以及山东大学教育教学改革研究项目和山东大学研究生国际化课程建设项目的支持;清华大学出版社高晓蔚编辑对本书的出版提供了很大的帮助;唐晨课题组的研究生徐敏、陈明明、刘晨秀、韩睿、陈蕾、赵琦、黄纵横、黄圣鉴、谢慧颖,付树军课题组的研究生王建行、徐奥、于博宇、崔婉婉和廖胜海,徐岩课题组的研究生秦宏、黄佳妮、王彦昀在本书的编写中做了大量的工作,在此一并表示由衷的感谢! 

编著者 

2022 年 3 月