内容简介:
本书从基本的爬虫原理始讲解,通过介绍Pthyon编程语言与HTML基础知识引领读者门,之后根据当前风起云涌的云计算、大数据热潮,重讲述了云计算的相关内容及其在爬虫中的应用,而介绍如何设计自己的爬虫应用。主要内容分为基础篇、中级篇、深篇,基础篇包括Python编程基础、Web前端基础、HTML基础知识、基础爬虫设计、强化爬虫技术等。中级篇包括数据存储、动态网站抓取、协议分析、Scrapy爬虫框架分析及实战案例等。高级篇包括增量式爬虫、分布式爬虫、人性化爬虫等框架设计。<br/>【作者】<br/>范传辉 网虫,Python发者,参与发了多项网络应用,在实际发中积累了丰富的实战经验,并善于总结,贡献了多篇技术文章广受好评。研究兴趣是网络安全、爬虫技术、数据分析、驱动发等技术。<br/>
作者简介:
范传辉 网虫,Python发者,参与发了多项网络应用,在实际发中积累了丰富的实战经验,并善于总结,贡献了多篇技术文章广受好评。研究兴趣是网络安全、爬虫技术、数据分析、驱动发等技术。