您好,欢迎来到宝阳悦读网
VIP购买
分类页面广告
干净的数据:数据清洗入门与实践
作者: 斯夸尔(Megan Squire)
格式:
mobi/epub/pdf/awz3
浏览量:
174次
扫描关注公众号
扫码关注公众号

温馨提示:书籍来自网络收集,版权归原作者所有,仅做学习试读,下载后请24小时内删除,侵权删(联系:1401211620@qq.com)

所属分类:
点击下载
收藏该图书
图书中部
图书详情
编辑推荐:
理解数据清洗在整个数据科学过程中的作用 掌握数据清洗的基础知识,包括文件清洗、数据类型、字符编码等 发掘电子表格和文本编辑器中与数据组织和操作相关的重要功能 学会常见数据格式的相互转换,如JSON、CSV和一些特殊用途的格式 采用三种策略来解析和清洗HTML文件中的数据 揭PDF文档的秘密,提取需要的数据 借助一系列解决方案来清洗存放在关系型数据库里的坏数据 创建自己的干净数据集,为其包、添加授权许可并与他人共享 使用书中的工具以及Twitter和Stack Overflow数据,完成两个真实的项目
内容简介:
本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的电子表格与文本编辑器,各种格式数据的转换方法,解析和清洗网页上的HTML 文件的三种策略,提取和清洗PDF 文件中数据的方法,检测和清除RDBMS 中的坏数据的解决方案,以及使用书中介绍的方法清洗来自Twitter 和Stack Overflow 的数据。
作者简介:
Megan Squire 依隆大学计算科学专业教授,主要教授数据库系统、Web发、数据挖掘和数据科学课程。有二十年的数据收集与清洗经验。她还是FLOSSmole研究项目的领导者,致力于收集与分析数据,以便研究免费软件、自由软件和源软件的发。
详情数据包
0.238009s