摘要: 网络爬虫:可以理解成网页蜘蛛,在网页上采集数据 爬取流程: 1、导入模块 2、打开网页,获取原码 3、获取章节原码 4、获取正文 5、过滤‘杂质’ 6、保存下载 废话不多说开始爬!!! 今天爬的网站是 全书网—斗罗大陆 准备工作、首先我们先导入两个模块 import urllib.request # 阅读全文
posted @ 2018-11-19 20:24 FalsePlus 阅读(75) 评论(0) 推荐(0)