本书将介绍如何使用Python编写网络爬虫程序获取互联网上的大数据。本书包括三部分内容:基础部分、进阶部分和项目实践。基础部分(第1~6章)主要介绍爬虫的三个步骤(获取网页、解析网页和存储数据),并通过诸多示例的讲解,让读者从基础内容开始系统性地学习爬虫技术,并在实践中提升Python爬虫水平。进阶部分(第7~12章)包括多线程的并发和并行爬虫、分布式爬虫、更换IP等,帮助读者进一步提升爬虫水平。项目实践部分(第13~16章)使用本书介绍的爬虫技术对几个真实的网站进行抓取,让读者能在读完本书后根据自己的需求写出爬虫程序。无论是否有编程基础,只要是对爬虫技术感兴趣的读者,本书就能带领读者从入门到进阶,再到实战,一步步了解爬虫,终写出自己的爬虫程序。
推荐序
推荐序二
前言
前言二
第1章网络爬虫入门
1.1为什么要学网络爬虫
1.1.1 网络爬虫能带来什么好处
1.1.2能从网络上爬取什么数据
1.1.3应不应该学爬虫
1.2网络爬虫是否合法
1.2.1 Robots协议
1.2.2 网络爬虫的约束
1.3网络爬虫的基本议题
1.3.1 Python爬虫的流程
1.3.2三个流程的技术实现
2章编写及时个网络爬虫
2.1搭建Python平台
2.1.1 Python的安装
2.1.2使用pip安装第三方库
2.1.3使用编译器Jupyter编程
2.2 Python使用入门
2.2.1基本命令
2.2.2数据类型
2.2.3条件语句和循环语句
2.2.4函数
2.2.5面向对象编程
2.3编写及时个简单的爬虫
第3章静态网页抓取
第4章动态网页抓取
第5章解析网页
第6章数据存储
第7章提升爬虫的速度
第8章反爬虫问题
第9章解决中文乱码
第10章登录与验证码处理
第11章服务器采集
第12章分布式爬虫
第13章爬虫实践一:维基百科
第14章爬虫实践二:知乎Live
第15章爬虫实践三:百度地图API
第16章爬虫实践四:餐厅点评
写的不错,推荐购买!
一般般,一般般
快递丢件没有收到货物
虽然本书中有一个出版的错误,但作者很负责的在博客网站上做了勘误说明,书的内容先大后小,入门爬虫挺好的。
不错,赞赞赞
!!!!!!
比较浅,适合入门
不错,语言通俗易懂,学起来比较轻松,值得推荐
书不错,很实用,很好学。
超级超级棒,说的非常到位???
书很好对我的帮助很大
文笔很好,通俗易懂,挺适合年轻人看的。
非常的一个研究技术工具!!
文笔很好,通俗易懂,技术覆盖全面,挺适合年轻人看的。
刚买了这本书,写得不错!对照书中的示例,很容易上手练习!
本书内容实翔,案例分析透彻,适合基础学习用书,入门人员提升用书。
这本书很实用,无论你是否有一定的编程基础,只要你对爬虫技术感兴趣,它能带领我们成为网络爬虫高手!作者用通俗易懂的语言,让我这个50岁的老娘也想成为网络爬虫高手!网络时代需要它!