上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 25 下一页
摘要: 每五分钟执行 */5 * * * *每小时执行 0 * * * *每天执行 0 0 * * *每周执行 0 0 * * 0每月执行 0 0 1 * *每年执行 0 0 1 1 *Crontab的格式第1列分钟1~59第2列小时1~23(0表示子夜)第3列日1~31第4列月1~12第5列星期0~6(0 阅读全文
posted @ 2018-03-23 17:13 wangheng1409 阅读(165) 评论(0) 推荐(0) 编辑
摘要: #!/usr/bin/pythonimport subprocessimport sysimport loggingimport osgameproc = "jd_5.py"def getPid(process): cmd = "ps aux| grep '%s'|grep -v grep " % 阅读全文
posted @ 2017-11-28 17:31 wangheng1409 阅读(371) 评论(0) 推荐(0) 编辑
摘要: 2.使用yield from 重构: 阅读全文
posted @ 2017-09-21 16:00 wangheng1409 阅读(170) 评论(0) 推荐(0) 编辑
摘要: 随机100w订单统计的成功结果: 目的:按照这种规律生成订单号的首位 注:总数10097,5开头的5605,占总数的55.6% 阅读全文
posted @ 2017-09-21 15:56 wangheng1409 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 0x01 常见的反爬虫 这几天在爬一个网站,网站做了很多反爬虫工作,爬起来有些艰难,花了一些时间才绕过反爬虫。在这里把我写爬虫以来遇到的各种反爬虫策略和应对的方法总结一下。 从功能上来讲,爬虫一般分为数据采集,处理,储存三个部分。这里我们只讨论数据采集部分。 一般网站从三个方面反爬虫:用户请求的He 阅读全文
posted @ 2017-01-04 12:03 wangheng1409 阅读(169) 评论(1) 推荐(1) 编辑
上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 25 下一页