会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
zzq
How to think.
博客园
首页
新随笔
联系
管理
订阅
随笔分类 -
PY
UnicodeEncodeError: 'gbk' codec can't encode character '\xee'
摘要:在将爬取到的内容写入文件时候报了这个错误,解决方案是在open()的时候给encoding参数传'utf-8'就好了,因为网页的编码就是utf-8。
阅读全文
posted @
2019-01-12 14:00
*zzq
阅读(598)
评论(0)
推荐(0)
requests库/爬取zhihu表情包
摘要:先学了requests库的一些基本操作,简单的爬了一下。 用到了requests.get()方法,就是以GET方式请求网页,得到一个Response对象。不加headers的话可能会400error所以加上: page=requests.get(url='https://www.zhihu.com/
阅读全文
posted @
2019-01-07 19:14
*zzq
阅读(330)
评论(0)
推荐(0)
Regex-Golf
摘要:A man, a plan: 判断回文,如果不确定串长度情况下可以考虑利用反向引用构造pattern,例如: (.)\1 , (.)(.)\2\1 , (.)(.)(.)\3\2\1 ...但这里只需要判下前后两个char就好了。 Prime : 判断元素个数是不是素数,是的话匹配成功否则失败。一开
阅读全文
posted @
2019-01-04 15:12
*zzq
阅读(252)
评论(0)
推荐(0)
regex-ways
摘要:regex的分组与捕获:分组就是用小括号(str)括起来的东西,就是一个分组。要想得到这些分组的信息,就要想办法捕获。每个分组都有编号,编号规则是从外向内,从左至右。 。例如,在表达式 (A)(B(C)) 中,存在四个这样的组: 0 (A)(B(C)) 1 (A) 2 (B(C)) 3 (C) 0表
阅读全文
posted @
2019-01-04 14:50
*zzq
阅读(164)
评论(0)
推荐(0)
regex back-reference
摘要:\<number>表示反向引用,引用group(number)表示的内容 最外层括号的group-id就是1,向内依次增加
阅读全文
posted @
2019-01-03 16:12
*zzq
阅读(217)
评论(0)
推荐(0)
sublime-代码提示
摘要:py的话安装这个插件: Anaconda user配置 default里面: 然后就好啦。
阅读全文
posted @
2018-12-29 20:07
*zzq
阅读(268)
评论(0)
推荐(0)
PY3 多组输入
摘要:在c语言你能使用while(scanf(“%d”,x) !=EOF)判断输入是否碰到文件结束符(EOF)。 但是在python你不能使用while((x=input())!=EOF)。 这有两种方法可实现对文件结束符(EOF)的判断。如下: 1、用sys.stdin 2、用try捕捉
阅读全文
posted @
2018-10-19 16:19
*zzq
阅读(320)
评论(0)
推荐(0)
公告