内容简介:
大数据推动了各行各业的迅猛发展,各领域呈现出新产品、新技术、新服务和新的发展业态,但“信息丰富而知识贫乏”的现象仍然存在。逾越数据与知识之间的鸿沟,需要强有力的分析工具和分析方法的支撑。现有的关联规则挖掘算法,因其时空复杂性和I/O代价高,难以适应大数据分析任务。本书充分利用Hadoop、Spark等集群系统的强大数据处理能力,论述了支持大数据分析的关联规则并行挖掘算法与集群系统性能优化,并探讨了其在智能制造领域的应用。本书可供从事数据挖掘、机器学习及并行计算等相关专业的科研人员参考,也可作为高等院校计算机、大数据专业的高年级本科生与研究生的学习参考书。