本书以Python为基础,深入讲解HDFS分布式文件系统和PySpark3编程。该书基于Spark3.3以上版本,以特色案例为驱动,帮助读者掌握Hadoop和PySpark的环境搭建与应用编程,实践大数据应用,开启智能未来。