会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Grandyang
仰天长啸仗剑红尘,冬去春来寒暑几更...
博客园
首页
新随笔
联系
订阅
管理
2017年12月6日
lxml xpath 爬取并正常显示中文内容
摘要: 在使用python爬虫提取中文网页的内容,为了能正确显示中文的内容,在转为字符串时一定要声明编码为utf-8,否则无法正常显示中文,而是显示原编码的字符,并没有正确转换。比如下面这个简单的爬取百度页面的title的示例: 如果不在tostring函数中正确配置的话,会打印出: 而正确的应该是:
阅读全文
posted @ 2017-12-06 01:36 Grandyang
阅读(5762)
评论(0)
推荐(1)
公告