您好,欢迎来到宝阳悦读网
VIP购买
分类页面广告
《Python大数据处理库PySpark实战》/汪明
作者: 汪明
格式:
mobi/epub/pdf/awz3
浏览量:
53次
扫描关注公众号
扫码关注公众号

温馨提示:书籍来自网络收集,版权归原作者所有,仅做学习试读,下载后请24小时内删除,侵权删(联系:1401211620@qq.com)

所属分类:
点击下载
收藏该图书
图书中部
图书详情
内容简介:
本书正是一本PySpark入门教材,适合有一定Python基础的读者学习使用。本书分为7章,第1章介绍大数据的基本概念、常用的大数据分析工具;第2章介绍Spark作为大数据处理的特点和算法;第3章介绍Spark实战环境的搭建,涉及Windows和Linux操作系统;第4章介绍如何灵活应用PySpark对数据进行操作;第5章介绍PySpark ETL处理,涉及PySpark读取数据、对数据进行统计分析等数据处理相关内容;第6章介绍PySpark如何利用MLlib库进行分布式机器学习(Titanic幸存者预测);第7章介绍一个PySpark和Kafka结合的实时项目。
详情数据包