会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
糖饼好吃
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
8
9
10
11
12
2016年12月6日
pyspider爬豆瓣电影实例
摘要: 直接copy官网实例会出现599的错误,百度了很久发现是因为证书的问题 添加这一句忽略证书 validate_cert = False 代码如下: +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ #!/usr/bin/e
阅读全文
posted @ 2016-12-06 11:51 糖饼好吃
阅读(425)
评论(0)
推荐(0)
2016年11月29日
纵表与横表转换(实用)
摘要: 现把转换方法列举如下: 1、纵表转横表: 纵表结构 TableA Name Course Grade 张三 语文 75 张三 数学 80 张三 英语 90 李四 语文 95 李四 数学 55 横表结构 TableB Name 语文 数学 英语 张三 75 80 90 李四 95 55 0 方法一:
阅读全文
posted @ 2016-11-29 14:12 糖饼好吃
阅读(555)
评论(0)
推荐(0)
2016年11月24日
完善爬取糗百的段子
摘要: 最后下载完第一页, 第二页还是出不来。 郁闷的是第一页能出来,说明调用 download()是成功执行了 估计是糗百的还有其他的防爬虫吧,等以后再回来完善 爬取”百思不得其姐”段子的前50页:
阅读全文
posted @ 2016-11-24 17:06 糖饼好吃
阅读(190)
评论(0)
推荐(0)
为自己的爬虫更换代理和HTML头部
摘要: import requestsimport reimport randomimport time class download(): def __init__(self): self.iplist = [] ##初始化一个list用来存放我们获取到的IP html = requests.get("h
阅读全文
posted @ 2016-11-24 16:56 糖饼好吃
阅读(474)
评论(0)
推荐(0)
我的第一个爬虫(爬取糗百的段子)
摘要: 写个这么简答的东西踩的坑有: os.chdir("D:\mzitu")f = open("111.txt", 'a') 一开始下面写的是D:\mzitu.111.txt,拼命的保存,就是看不到数据,我这暴脾气,简直不能忍。 还有直接打印文本内容会出现乱码 然后type()了一下发现是unicode,
阅读全文
posted @ 2016-11-24 15:33 糖饼好吃
阅读(261)
评论(0)
推荐(0)
2016年11月18日
django创建blog
摘要: 如果本文看不懂的,去看的我视频吧!http://www.testpub.cn/ Django 自称是“最适合开发有限期的完美WEB框架”。本文参考《Django web开发指南》,快速搭建一个blog 出来,在中间涉及诸多知识点,这里不会详细说明,如果你是第一次接触Django ,本文会让你在感性上
阅读全文
posted @ 2016-11-18 16:34 糖饼好吃
阅读(244)
评论(0)
推荐(0)
上一页
1
···
8
9
10
11
12
公告