随笔分类 -  Python

摘要:我在上一篇博客中说明了在爬取数据的时候,把数据写入到文件的乱码问题 在这一篇里面我做一个总结: 1、首先应该看一个案例 我把数据写在.py文件中: #coding:utf-8 s = 'hehe测试中文字符'ss = u'hehe测试中文字符'uu = s.decode('utf-8') print 阅读全文
posted @ 2016-03-10 17:32 练子 阅读(1066) 评论(0) 推荐(0)
摘要:一、读取返回的页面数据 在浏览器打开的时候查看源代码,如果在头部信息中指定了UTF-8 那么再python代码中读取页面信息的时候,就需要指定读取的编码方式: response.read().decode('utf-8') 二、把中文数据写入到文件的时候 python默认的是按照ACSII的编码往外 阅读全文
posted @ 2016-03-08 13:54 练子 阅读(5408) 评论(0) 推荐(0)
摘要:这里用知乎(www.zhihu.com)来测试的python的模拟登陆操作 首先用FIreFox和Fiddler来拦截所有对知乎的请求,包括进入登陆的页面的url(www.zhihu.com/signin)和登陆的url(www.zhihu.com/login/phone_num) 查看页面的源代码 阅读全文
posted @ 2016-03-02 17:47 练子 阅读(961) 评论(0) 推荐(0)