摘要:
BeautifulSoup用来解析HTML比较简单,API非常人性化,支持CSS选择器、Python标准库中的HTML解析器,也支持lxml的XML解析器。 其相较与正则而言,使用更加简单。 示例: 首先必须要导入bs4库 运行结果 四大对象种类 BeautifulSoup将复杂的HTML文档转换成 阅读全文
posted @ 2017-07-22 16:30
骑着螞蟻流浪
阅读(407)
评论(0)
推荐(0)
摘要:
现在我们用正则来做一个简单的爬虫,我们尝试爬取某个百度贴吧里面的所有帖子,并且将这个帖子里首页每个楼层发布的图片下载到本地。 分析:以美女吧为例 第一页:https://tieba.baidu.com/f?kw=%E7%BE%8E%E5%A5%B3&pn=0 第二页:https://tieba.ba 阅读全文
posted @ 2017-07-22 11:30
骑着螞蟻流浪
阅读(744)
评论(0)
推荐(0)

浙公网安备 33010602011771号