摘要:
为什么要学习正则表达式 实际上爬虫一共就四个主要步骤: 我们在前面的案例里实际上都省略了第3步,也就是“取”的步骤。因为我们down下了的数据是全部的网页,这些数据很庞大并且很混乱,其中大部分的东西是我们不关心的,因此我们需要将之按我们的需要过滤和匹配出来。 那么对于文本的过滤和者规则的匹配,最强大 阅读全文
posted @ 2017-07-19 16:32
骑着螞蟻流浪
阅读(581)
评论(0)
推荐(0)
摘要:
Requests继承了urllib.request的所有特性,Requests支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动确定响应内容的编码,支持国际化的URL和POST数据自动编码。 相较于urllib.request而言,其使用更加简洁方便。 基本GET请求 阅读全文
posted @ 2017-07-19 14:33
骑着螞蟻流浪
阅读(353)
评论(0)
推荐(0)

浙公网安备 33010602011771号