摘要: 一、基本概念及步骤 在我们理解了网页中标签是如何嵌套,以及网页的构成之后,我们就是可以开始学习使用python中的第三方库BeautifulSoup筛选出一个网页中我们想要得到的数据。 什么是BeautifulSoup? 简单来说,Beautiful Soup是python的一个库,最主要的功能是从 阅读全文
posted @ 2018-06-07 23:50 BD-ld-2017 阅读(123) 评论(0) 推荐(0)
摘要: 前言 首先我们提到爬虫,我们不得不说网页,因为我们使用python编写的爬虫实际上是针对于网页进行设计的,解析网页以及抓取这些数据是爬虫需要做的事情,日常中我们看到这些网页,可以看到很多图片,很多的标题以及很多的文字信息,实际上他们都是在浏览器渲染后的结果,我们可以吧浏览器理解为一个翻译官,它把这些 阅读全文
posted @ 2018-06-07 20:55 BD-ld-2017 阅读(942) 评论(0) 推荐(3)