01 2021 档案

摘要:搭建python虚拟环境,避免包的混乱和版本的冲突。为每个程序单独创建虚拟环境可以保证程序中能访问虚拟环境中的包,保持解释器环境的干净整洁。 推荐使用virtualenv,笔者使用python版本为3.7。 安装virtualenv pip install virtualenv 创建运行环境 vir 阅读全文
posted @ 2021-01-30 10:54 点点520 阅读(95) 评论(0) 推荐(0)
摘要:Lxml库 Lxml库是基于libxml2的XML解析库的Python库,该模块使用C语言编写,解析速度比BeautifulSoup更快。 Lxml库使用Xpath语法解析定位网页数据。 1 安装与使用 windows系统下,在cmd命令提示框中,输入如下命令: pip install lxml 2 阅读全文
posted @ 2021-01-14 18:54 点点520 阅读(578) 评论(0) 推荐(0)
摘要:1 爬虫 1.1 爬虫原理 爬虫需要做2件事: 1、模拟计算机对服务器发起Request请求; 2、接收服务器端的Response内容并解析、提取所需的信息; 1.2 爬虫流程 分为多页面爬虫流程、跨页面爬虫流程; 1.2.1 多页面爬虫流程 流程如下: (1) 手动翻页并观察各网页的URL构成特点 阅读全文
posted @ 2021-01-14 15:48 点点520 阅读(96) 评论(0) 推荐(0)
摘要:2021对于点点来说是特别的,这一年更得认真学习、沉淀,不断完善自我,故此开通博客园! --书山有路勤为径,学海无涯苦作舟! --2021.1.11 阅读全文
posted @ 2021-01-11 13:27 点点520 阅读(76) 评论(0) 推荐(0)