会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Nanrou
博客园
首页
新随笔
联系
订阅
管理
2017年3月10日
爬虫中遇到的问题汇总
摘要: 3.10 关于爬取时,网页编码不是utf-8,而导致 lxml 输出中文时乱码的解决办法 用requests.get拿到response,response.content是bytes的内容,所以可以直接传给 lxml, body = etree.HTML(response.content)就不会有乱
阅读全文
posted @ 2017-03-10 11:12 Nanrou
阅读(3005)
评论(0)
推荐(0)
公告