摘要:
from os import listdirfrom os.path import isfile ,join,isdirdef one_dir_file(path): #打印该目录下所有文件,跳过目录下的子文件夹 print('path:',path) for item in listdir(pat 阅读全文
posted @ 2018-07-20 14:45
白鸟飞尽
阅读(344)
评论(0)
推荐(0)
摘要:
写的第一个爬虫,基本思路: 定义 pageMax 方法 获取整体数据信息,最大页数 定义 request的方法获取单页数据 定义parse方法分析单页数据,提取items,存储在生成器yield中 定义search方法循环获取数据,保存在本地 另外,通过history文件记录抓取历史 saveImg 阅读全文
posted @ 2018-07-20 08:43
白鸟飞尽
阅读(87)
评论(0)
推荐(0)

浙公网安备 33010602011771号