范传辉编著的《Python爬虫开发与项目实战》这是一本实战性很强的书,书中共有9个爬虫项目,以系统的实战项目为驱动。由浅入深地讲解爬虫开发中所需的知识和技能。从静态网站到动态网站,从单机爬虫到分布式爬虫,既包含基础知识点,又讲解了关键问题和难点分析,包含从入门到进阶的所有知识。读者认真学习完本书之后不再是个菜鸟,可以自主地开发Python爬虫项目。本书主要内容分为基础篇、中级篇、深入篇,基础篇包括Python编程基础、Web前端基础、HTML基础知识、基础爬虫设计、强化爬虫技术等。中级篇包括数据存储、动态网站抓取、协议分析、Scrapy爬虫框架分析及实战案例等。高级篇包括增量式爬虫、分布式爬虫、人性化爬虫等框架设计。
随着大数据时代到来,网络信息量也变得更多更大,基于传统搜索引擎的局限性,网络爬虫应运而生。范传辉编著的《Python爬虫开发与项目实战》从基本的爬虫原理开始讲解,通过介绍Pthvon编程语言和Web前端基础知识引领读者入门,之后介绍动态爬虫原理以及Scrapy爬虫框架,最后介绍大规模数据下分布式爬虫的设计以及PySpider爬虫框架等。
本书主要特点:
·由浅入深,从Pvthon和Web前端基础开始讲起,逐步加深难度,层层递进。
·内容详实,从静态网站到动态网站,从单机爬虫到分布式爬虫,既包含基础知识点,又讲解了关键问题和难点分析,方便读者完成进阶。
·实用性强,本书共有9个爬虫项目,以系统的实战项目为驱动,由浅及深地讲解爬虫开发中所需的知识和技能。
·难点详析,对js加密的分析、反爬虫措施的突破、去重方案的设计、分布式爬虫的开发进行了细致的讲解。