摘要: 一。 为什么要用解析框架 bs4 我觉得爬虫最难得问题就是编码格式,因为你不知道要爬取目标网站的编码格式,有可能是Unicode,utf-8, ASCII , gbk格式,但是使用Beautiful Soup解析后,文档都被转换成了Unicode,通过Beautiful Soup输出文档时,不管输入 阅读全文
posted @ 2018-01-04 17:53 淋哥 阅读(2505) 评论(0) 推荐(0) 编辑