摘要: 自己闲来无聊,就爬取了网易信息,重点是分析网页,使用抓包工具详细的分析网页的每个链接,数据存储在sqllite中,这里只是简单的解析了新闻页面的文字信息,并未对图片信息进行解析 仅供参考,不足之处请指正 阅读全文
posted @ 2017-06-30 10:37 淋哥 阅读(1768) 评论(0) 推荐(1) 编辑
摘要: # 默认情况下,redis不是在后台模式运行的,如果需要在后台进程运行,把该项的值更改为yes,默认为no daemonize:是否以后台daemon方式运行 # 如redis服务以后台进程运行的时候,Redis默认会把pid写入/run/redis.pid文件组,你可以配置到其他文件路径。 # 当 阅读全文
posted @ 2017-06-30 10:37 淋哥 阅读(2730) 评论(0) 推荐(0) 编辑
摘要: 今日头条 as cp算法解析,我们在提交的时候"as":"479BB4B7254C150", "cp":"7E0AC8874BB0985",就可以了,有兴趣的同学可以去看看他们的js代码,只是简单的对进行了加密 as cp 算法 Python 实现 阅读全文
posted @ 2017-06-30 09:42 淋哥 阅读(8061) 评论(0) 推荐(2) 编辑
摘要: 爬虫很简单,难的是自己去分析网页解析网页和爬虫的效率 阅读全文
posted @ 2017-06-30 09:23 淋哥 阅读(2016) 评论(0) 推荐(0) 编辑
摘要: 爬取百度图片 在Python 2.7上运行 阅读全文
posted @ 2017-06-30 09:19 淋哥 阅读(1665) 评论(0) 推荐(0) 编辑
摘要: #coding:utf8 import redis # python 操作redis之——HyperLogLog r =redis.Redis(host="33.23.724.12190",port=6222,password="666666") # 1.Pfadd 命令将所有元素参数添加到 Hyp 阅读全文
posted @ 2017-06-30 09:17 淋哥 阅读(1501) 评论(0) 推荐(0) 编辑
摘要: #coding:utf8 import redis r =redis.Redis(host="23.226.74.190",port=63279,password="66666666666") 1.Zadd 命令用于将一个或多个成员元素及其分数值加入到有序集当中。如果某个成员已经是有序集的成员,那么 阅读全文
posted @ 2017-06-30 09:14 淋哥 阅读(20666) 评论(0) 推荐(3) 编辑