编辑推荐:
●作者在学术界和工业界工作多年,书中介绍的都是非常实用的算法。 ●本书涵盖实际中常用的各种算法,包括回归、分类、推荐系统、排序等,能够引导读者从原始数据出发到形成zui终的解决方案。 ●通过R语言来引导读者使用算法,使读者能够简单上手,得到算法的第1手使用经验。 机器学习是一个热门而又高深的话题。多年来,符号学习、统计学习、深度学习等一系列高高在上的名词使得大众对机器学习敬而远之,大数据时代,机器学习的广泛成功应用再次引爆了大众对机器学习的关注。 机器学习能够解决什么样的问题?如何使用机器学习解决实际问题?应该怎样选择算法?本书从实践出发回答这些问题。书中首先通过实际应用场景引出机器学习中的几类典型问题,然后着重介绍解决各类问题的实用算法,并利用R语言和相关的软件包来引导读者实际使用这些算法。 ●不懂机器学习?没有关系。本书不仅介绍了机器学习的基本概念和算法原理,还提供了完整的程序代码,助读者轻松上手、快速门。 ●数学基础不够?没有关系。本书一方面突出了对概念和原理的理解,尽可能淡化了对数学背景的要求;另一方面也介绍了需要具备的数学知识,便于读者查阅。 ●不会使用R语言?没有关系。本书介绍了R语言的基本知识及常用R软件包,两位作者更是亲手绘制了全书90%以上的插图,手把手教读者用R语言分析数据和展现结果。 掌握本书介绍的算法和对应的R软件包后,读者可以顺利地针对新问题、新数据选择和使用机器学习算法,在实践中获得更大收获。
内容简介:
大数据时代为机器学习的应用提供了广阔的空间,各行各业涉及数据分析的工作都需要使用机器学习算法。本书围绕实际数据分析的流程展,着重介绍数据探索、数据预处理和常用的机器学习算法模型。本书从解决实际问题的角度出发,介绍回归算法、分类算法、推荐算法、排序算法和集成学习算法。在介绍每种机器学习算法模型时,书中不但阐述基本原理,而且讨论模型的评价与选择。为方便读者学习各种算法,本书介绍了R语言中相应的软件包并给出了示例程序。 本书的一大特色就是贴近工程实践。首先,本书仅侧重介绍当前工业界常用的机器学习算法,而不追求知识内容的覆盖面;其次,本书在介绍每类机器学习算法时,力求通俗易懂地阐述算法思想,而不追求理论的深度,让读者借助代码获得直观的体验。
作者简介:
孙亮,*数据科学与技术研究院高级专家。曾任微软Azure机器学习(Azure Machine Learning)部门高级数据科学家,先后毕业于南京大学计算机系(1999-2003)、中国科学院软件研究所(2003-2006)、美国亚利桑那州立大学计算机系(2006-2011),研究兴趣包括机器学习、数据挖掘及其实际应用等。近年来参加了KDD Cup、Heritage HealthPrize等多项数据挖掘竞赛并多次取得优异成绩。在IEEE T-PAMI、NIPS、ICML、SIGKDD等机器学习领域的知名国际期刊和国际会议上发表论文近20篇,著有机器学习英文专著1部。 黄倩,河海大学副研究员,先后毕业于南京大学计算机系(1999-2003)、中国科学院计算技术研究所(2003-2010),研究兴趣包括多媒体大数据处理、机器学习、云计算等。参加过多个973、863、国家自然科学基金项目的研究,参与过AVS、H.265 HEVC等国内外视频压缩标准的制订。现主持包括国家自然科学基金在内的多个国家、省市级项目,并获南京市江宁区首批高层次创业人才“创聚工程”项目资助。在相关领域的知名国际期刊和国际会议上发表论文逾20篇,出版译著4本,参编专著1部。