2017 年 7月 22 日随笔档案 - 骑着螞蟻流浪

2017年7月22日

摘要： BeautifulSoup用来解析HTML比较简单，API非常人性化，支持CSS选择器、Python标准库中的HTML解析器，也支持lxml的XML解析器。其相较与正则而言，使用更加简单。示例：首先必须要导入bs4库运行结果四大对象种类 BeautifulSoup将复杂的HTML文档转换成阅读全文

posted @ 2017-07-22 16:30 骑着螞蟻流浪阅读(407) 评论(0) 推荐(0)

爬虫——爬取百度贴吧每个帖子里面的图片

摘要：现在我们用正则来做一个简单的爬虫，我们尝试爬取某个百度贴吧里面的所有帖子，并且将这个帖子里首页每个楼层发布的图片下载到本地。分析：以美女吧为例第一页：https://tieba.baidu.com/f?kw=%E7%BE%8E%E5%A5%B3&pn=0 第二页：https://tieba.ba 阅读全文

posted @ 2017-07-22 11:30 骑着螞蟻流浪阅读(744) 评论(0) 推荐(0)

骑着螞蟻流浪

公告