摘要: 在github网站上找出符合以下条件的项目(同时满足),并推送通知到手机上:1、最近一周内发布的;2、star数大于200;3、topic是blockchain查找repo的API(topic是blockchain,创建日期在2020年3月3日以后的):https://api.github.com/ 阅读全文
posted @ 2020-03-17 22:00 djl_djl 阅读(361) 评论(0) 推荐(0)
摘要: 爬取某人的微博数据,把某人所有时间段的微博数据都爬下来。具体思路:创建driver get网页 找到并提取信息 保存csv 翻页 get网页(开始循环) ... 没有“下一页”就结束,用了while True,没用自我调用函数嘟大海的微博:https://weibo.com/u/1623915527 阅读全文
posted @ 2020-03-17 21:39 djl_djl 阅读(905) 评论(8) 推荐(0)
摘要: 用oop编程实现文件自动解压整理,同时监控2个目录并处理zip文件,解压后一个文件夹删除zip文件,另一个文件夹将zip文件移动到某一目录中。记得要在主程序中加入下面2行代码,保证进程一直存在:while True: pass import time import os import threadi 阅读全文
posted @ 2020-03-17 21:26 djl_djl 阅读(282) 评论(0) 推荐(0)
摘要: 拉勾网职位信息的爬取爬取关键字为python,工作地点在北京朝阳区的工作信息,从中提取今天发布的岗位信息,url:https://www.lagou.com/jobs/list_python/p-city_2?px=default&district=朝阳区#filterBoxoop代码思路:spid 阅读全文
posted @ 2020-03-17 21:20 djl_djl 阅读(361) 评论(0) 推荐(0)
摘要: 爬取小猪短租的租房信息,爬取第1~4页房屋,共96个房子的信息,包括标题、地址、租金、房东姓名、图片链接等。使用requests和BeautifulSoup。小猪短租:http://bj.xiaozhu.com/房源详情页:http://bj.xiaozhu.com/fangzi/134350372 阅读全文
posted @ 2020-03-17 21:09 djl_djl 阅读(317) 评论(0) 推荐(0)