2020年12月28日
摘要: wheel文件本质上就是zip或者rar,只不过他更加方便python的安装以及使用。在之前的图片中我们只要使用pip install wheel 就可以安装wheel。 在安装了wheel之后我们可以使使用pip install XXX.whl来安装.whl的文件了。(这里的XXX.whl是whe 阅读全文
posted @ 2020-12-28 20:42 輪滑少年 阅读(387) 评论(0) 推荐(0)
摘要: 一、xpath选择器使用 # xpath: XPath 是一门在 XML 文档中查找信息的语言 # / :从根节点选取。 # // :不管位置,直接找 # /@属性名 # /text() # 会复制() doc='''<html> <head> <base href='http://example. 阅读全文
posted @ 2020-12-28 20:35 輪滑少年 阅读(315) 评论(0) 推荐(0)
摘要: 一、bs4的使用 from bs4 import BeautifulSouppip3 install lxml html_doc=""" <!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; 阅读全文
posted @ 2020-12-28 17:17 輪滑少年 阅读(444) 评论(0) 推荐(0)
摘要: 一:爬虫介绍 1. 什么是爬虫 爬虫就是一个网络蜘蛛,伪装成用去,去网站拿到自己想要的数据。注意:是可见即可爬,如果爬取的是人家加密的数据,就是黑客(犯法)2. 爬虫的本质 模拟浏览器发送请求(requests,selenium)->下载网页代码->只提取有用的数据(bs4,xpath,re)->存 阅读全文
posted @ 2020-12-28 10:28 輪滑少年 阅读(877) 评论(0) 推荐(0)