2019 年 7月 3 日随笔档案 - KD_131

2019年7月3日

摘要：这篇文章主要介绍了Python与Redis的连接教程,Redis是一个高性能的基于内存的数据库,需要的朋友可以参考下今天在写zabbix storm job监控脚本的时候用到了python的redis模块，之前也有用过，但是没有过多的了解，今天看了下相关的api和源码,看到有ConnectionP 阅读全文

posted @ 2019-07-03 17:24 KD_131 阅读(6454) 评论(0) 推荐(0)

RedisCrawlSpider

摘要：这个RedisCrawlSpider类爬虫继承了RedisCrawlSpider，能够支持分布式的抓取。因为采用的是crawlSpider，所以需要遵守Rule规则，以及callback不能写parse()方法。同样也不再有start_urls了，取而代之的是redis_key，scrapy-re 阅读全文

posted @ 2019-07-03 17:15 KD_131 阅读(335) 评论(0) 推荐(0)

scrapy 发post请求

摘要：可以使用 yield scrapy.FormRequest(url, formdata, callback)方法发送POST请求。如果希望程序执行一开始就发送POST请求，可以重写Spider类的start_requests(self) 方法，并且不再调用start_urls里的url。 clas 阅读全文

posted @ 2019-07-03 16:19 KD_131 阅读(193) 评论(0) 推荐(0)

django项目分解

摘要： https://www.cnblogs.com/huwei934/tag/django/ 阅读全文

posted @ 2019-07-03 16:14 KD_131 阅读(110) 评论(0) 推荐(0)

os.path.join用法

摘要： os.path.join()函数：连接两个或更多的路径名组件 1.如果各组件名首字母不包含’/’，则函数会自动加上 2.如果有一个组件是一个绝对路径，则在它之前的所有组件均会被舍弃 3.如果最后一个组件为空，则生成的路径以一个’/’分隔符结尾 Demo1 import os Path1 = 'hom 阅读全文

posted @ 2019-07-03 16:05 KD_131 阅读(726) 评论(0) 推荐(0)

图片懒加载，Selenium，PhantomJS

摘要：引入今日概要图片懒加载 selenium phantomJs 谷歌无头浏览器知识点回顾验证码处理流程今日详情动态数据加载处理一.图片懒加载什么是图片懒加载？案例分析：抓取站长素材http://sc.chinaz.com/中的图片数据 #!/usr/bin/env python # 阅读全文

posted @ 2019-07-03 10:57 KD_131 阅读(337) 评论(0) 推荐(0)

js动态生成数据的抓取

摘要：需求：爬取https://www.xuexi.cn/f997e76a890b0e5a053c57b19f468436/018d244441062d8916dd472a4c6a0a0b.html页面中的新闻数据。分析： 1.首先通过分析页面会发现该页面中的新闻数据都是动态加载出来的，并且通过抓包工具阅读全文

posted @ 2019-07-03 10:53 KD_131 阅读(816) 评论(0) 推荐(0)

cur.execute(sql,args)和cur.execute(sql)的区别

摘要：轉：https://blog.csdn.net/mjjyszazc/article/details/88932664 方式一： userid = “123”sql = “select id,name from user where id = ‘%s’” % useridcur.execute(sql 阅读全文

posted @ 2019-07-03 10:04 KD_131 阅读(1540) 评论(0) 推荐(0)