《Python 3网络爬虫实战》示例源码免费下载

#好书推荐##好书奇遇季#《Python 3网络爬虫实战》京东当当天猫都有发售。

本书配套示例源码，文后提供了下载二维码，可用微信扫码下载，供读者个人学习使用，禁止任何形式的商用。

Python简单易学，Python爬虫也不复杂，只需要了解Python的基本操作即可自行编写。在网络上经常更新的数据，无须每次都打开网页浏览，使用爬虫程序可以一键获取数据，下载保存后进行数据分析。本书将介绍几种不同类型的Python爬虫，可以针对不同情况的站点进行数据收集。

本书共12章。

第1~4章介绍Python 3.8的基本安装、简单Python程序的编写、网络爬虫的基本原理以及网页数据的存储和读取。

第5章介绍的Scrapy爬虫框架主要针对一般无须登录的网站，在爬取大量数据时使用Scrapy会很方便。

第6章介绍的BeautifulSoup爬虫可以算作爬虫的“个人版”。BeautifulSoup爬虫主要针对一些爬取数据比较少、结构简单的网站。

第7章介绍的PyQuery模块的主要功能是对页面进行快速爬取，重点是以jQuery的语法来操作解析 HTML 文档。

第8章介绍的Selenium模块的主要功能是模拟浏览器，作用主要是针对JavaScript返回数据的网站。

第9章介绍PySpider框架，通过UI界面与代码结合实现网站的爬取。

第10~12章介绍一些比较分散的爬虫技术，如图片验证码识别、爬取部分App内容、反爬虫等。

posted @ 2021-11-30 08:52 brucexia 阅读(350) 评论(0) 收藏举报

刷新页面返回顶部

brucexia