编辑推荐:
阅读本书可以获得一份关于在Python下操作、处理、清洗、规整数据集的完整说明。本书第二版针对Python 3.6行了更新,并增加实际案例向你展示如何高效地解决一系列数据分析问题。你将在阅读过程中学习到*版本的pandas、NumPy、IPython和Jupyter。 本书由Wes McKinney创作,他是Python pandas项目的创始人。本书是对Python数据科学工具的实操化、现代化的介绍,非常适合刚学Python的数据分析师或刚学数据科学以及科学计算的Python编程者。数据文件和相关的材料可以在GitHub上找到: l使用IPython shell和Jupyter notebook行探索性计算 l学习NumPy(Numerical Python)的基础和高级特性 l门pandas库中的数据分析工具 l使用灵活工具对数据行载、清洗、变换、合并和重塑 l使用matplotlib创建富含信息的可视化 l将pandas的groupby功能应用于对数据集的切片、分块和汇总 l分析并操作规则和不规则的时间序列数据 利用完整的、详细的示例学习如何解决现实中数据分析问题
内容简介:
本书由Python pandas项目创始人Wes McKinney亲笔撰写,详细介绍利用Python行操作、处理、清洗和规整数据等方面的具体细节和基本要。第2版针对Python 3.6行全面修订和更新,涵盖新版的pandas、NumPy、IPython和Jupyter,并增加大量实际案例,可以帮助你高效解决一系列数据分析问题。 第2版中的主要更新包括: •所有的代码,包括把Python的教程更新到了Python 3.6版本(第1版中使用的是Python 2.7) •更新了Python第三方发布版Anaconda和其他所需Python包的安装指引 •更新pandas库到2017年的新版 •新增一章,关于更多高级pandas工具和一些使用提示 •新增statsmodels和scikit-learn的简明使用介绍
作者简介:
Wes McKinney 是流行的Python源数据分析库pandas的创始人。他是一名活跃的演讲者,也是Python数据社区和Apache软件基金会的Python/C 源发者。目前他在纽约从事软件架构师工作。