内容简介:
本书共分为四大部分:基础篇(1~10章)介绍了Spark的用途、扩展、安装、运行模式、程序发、编程模型、工作原理,以及SparkSQL、SparkStreaming、MLlib、GraphX、Bagel等重要的扩展;实战篇(11~14)讲解了搜索结果的排序、个性化推荐系统、日志分析系统、自然语言处理、数据挖掘等方面的案例;高级篇(15~18)则讲解了Spark的调度管理、存储管理、监控管理、性能优化、**实践以及重算法的解读;扩展篇(19~20)讲解了Sparkjob-server和Tachyon。<br/>