2018 年 7月 20 日随笔档案 - 白鸟飞尽

2018年7月20日

摘要： from os import listdirfrom os.path import isfile ,join,isdirdef one_dir_file(path): #打印该目录下所有文件，跳过目录下的子文件夹 print('path:',path) for item in listdir(pat 阅读全文

posted @ 2018-07-20 14:45 白鸟飞尽阅读(344) 评论(0) 推荐(0)

小白写爬虫

摘要：写的第一个爬虫，基本思路：定义 pageMax 方法获取整体数据信息，最大页数定义 request的方法获取单页数据定义parse方法分析单页数据，提取items，存储在生成器yield中定义search方法循环获取数据，保存在本地另外，通过history文件记录抓取历史 saveImg 阅读全文

posted @ 2018-07-20 08:43 白鸟飞尽阅读(87) 评论(0) 推荐(0)

白鸟飞尽

公告