摘要:
原理:我的上篇博客 import requests import time from bs4 import BeautifulSoup def get_html(url): ''' 获得 HTML ''' headers = { 'user-agent': 'Mozilla/5.0 (Windows 阅读全文
posted @ 2019-12-23 12:16
木子欢儿
阅读(675)
评论(0)
推荐(0)
摘要:
好啦好啦,那我们来拉开我们的爬虫之旅吧~~~ 这一只小爬虫是爬取酷狗TOP500的,使用的爬取手法简单粗暴,目的是帮大家初步窥探爬虫长啥样,后期会慢慢变得健壮起来的。 环境配置 在此之前需要下载一个谷歌浏览器,下好后由于谷歌搜索是需要FQ的,可设置打开网页为百度来使用 我们用到的是bs4,要求这两个 阅读全文
posted @ 2019-12-23 11:12
木子欢儿
阅读(1696)
评论(0)
推荐(0)

浙公网安备 33010602011771号