Liuyt_61

愿踏遍山河,仍觉人间值得

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2017年12月3日

摘要: 爬取网页时候print输出的时候有中文输出乱码 例如: \\xe4\\xb8\\xad\\xe5\\x8d\\x8e\\xe4\\xb9\\xa6\\xe5\\xb1\\x80 百度了使用encode 和decode 使用codecs都不好使。 应该在爬取网页read()的时候就修改编码格式 还有一 阅读全文
posted @ 2017-12-03 19:23 Liuyt_61 阅读(2414) 评论(0) 推荐(0) 编辑