摘要: import requests #调用requests模块 import re #调用re 正则表达式 from urllib.request import urlretrieve #调用下载模块 import os #调用系统模块 '''分析网页''' #获取页面源代码 html = reques 阅读全文
posted @ 2019-12-29 23:23 故事的小黄花丶 阅读(118) 评论(0) 推荐(0)
摘要: python爬虫常用库 请求库: 1. requests 这个库是爬虫最常用的一个库 2. Selenium Selenium 是一个自动化测试工具,利用它我们可以驱动浏览器执行特定的动作,如点击、下拉等操作 对于一些用JS做谊染的页面来说,这种抓取方式是非常有效的。 3.ChomeDrive 安装 阅读全文
posted @ 2019-12-29 15:58 故事的小黄花丶 阅读(738) 评论(0) 推荐(0)