2018 年 11月 19 日随笔档案 - FalsePlus

2018年11月19日

摘要：网络爬虫：可以理解成网页蜘蛛，在网页上采集数据爬取流程： 1、导入模块 2、打开网页，获取原码 3、获取章节原码 4、获取正文 5、过滤‘杂质’ 6、保存下载废话不多说开始爬！！！今天爬的网站是全书网—斗罗大陆准备工作、首先我们先导入两个模块 import urllib.request # 阅读全文

posted @ 2018-11-19 20:24 FalsePlus 阅读(81) 评论(0) 推荐(0)

falseplus